搜索引擎用中文分詞把詞按照一定的規格,將一個長尾詞分割成幾個部分,從而概括一段話的主要內容,讓用戶能更快速度的找到想要的內容,是seo必須掌握的一個基礎知識。最簡單的例子:無錫網站建設 - 這個詞看似一個詞,其實明眼人一眼就能看出兩個來,即網站建設和無錫網站建設。
現有的中文分詞算法可分為三類:
1.字符串匹配的分詞方法
2.詞義分詞法。
3.統計分此法。
而其中第一種方法是最常用的分詞法,百度就是用此種分詞。字符串匹配的分詞方法,他又分為3種分詞方法。
1.正向最大匹配法
什么意思呢?就是把一個詞從左至右來分詞。
舉個例子。
“不知道你在說什么”
這句話采用正向最大匹配法是如何分的呢?“不知道,你,在,說什么”與正向最大匹配法相對應的是反向最大匹配發。這是第二種分詞方法。
2.反向最大匹配法
來分上面我舉的例子是如何分的呢 ?不知道你在說什么。反向最大匹配法來分上面這段是如何分的!安,知道,你在,說,什么”,這個就分的比較多了,反向最大匹配法就是從右至左。
3.就是最短路徑分詞法。
這個什么理解呢 ,就是說 我一段話里面要求切出的詞數是最少的。還是上面哪句話“不知道你在說什么”最短路徑分詞法就是指,我把上面哪句話分成的詞要是最少的。不知道,你在,說什么,這就是最短路徑分詞法,分出來就只有3個詞了。
好了,當然還有上面三種可以相互結合組成一些分詞方法。剩下還有統計的分詞方法和詞義分詞法,不過這兩種分詞方法,比較簡單而且尚不成熟,處于測試階段。這些技巧都算的上是網站推廣中的核心問題也是關鍵所在了吧,其實不管做什么事情我們都要學會如果去抓住里面的要點所在。正如之前的一篇文章 - “做好網站推廣要把握好核心要點” 所提到的那樣:推廣的道理都是相通的,只有你有善于發現的眼睛。