搜索引擎算法之:謹(jǐn)慎對(duì)待同義詞
來(lái)源:昆明多彩網(wǎng)絡(luò)公司 日期:2011-02-20 閱讀: 發(fā)表評(píng)論
在搜索引擎中有一個(gè)很重要的分詞技術(shù),比如將一個(gè)長(zhǎng)的詞語(yǔ)分解成若干個(gè)短語(yǔ),然后再根據(jù)這些短語(yǔ)呈現(xiàn)最終的搜索結(jié)果,而我們這里說(shuō)得同義詞并非搜索引擎中的分詞技術(shù),說(shuō)的是一個(gè)該怎么樣去理解用戶(hù)意圖的技術(shù)。
比如說(shuō)我們搜索“網(wǎng)站制作”和“網(wǎng)頁(yè)制作”這兩個(gè)同義詞語(yǔ),可以對(duì)比一下搜索出來(lái)的結(jié)果,發(fā)現(xiàn)還是有很多不同的,雖然這兩個(gè)詞語(yǔ)的意思基本相同;而我們?cè)偎阉鞲?jìng)爭(zhēng)較小的同義詞的時(shí)候就可以發(fā)現(xiàn)搜索結(jié)果相似程度的就出現(xiàn)上升趨勢(shì)。
這里我們可以大膽的猜測(cè)一下影響搜索引擎對(duì)于同義詞搜索結(jié)果的相關(guān)因素:
1、兩個(gè)同義詞如果意義非常接近,同時(shí)相關(guān)信息較少的話(huà),搜索引擎會(huì)自動(dòng)匹配這兩個(gè)詞語(yǔ),并且呈現(xiàn)大部分相同的結(jié)果。
2、兩個(gè)同義詞意義非常接近,但是詞語(yǔ)的搜索指數(shù)很高,同時(shí)相關(guān)的網(wǎng)站競(jìng)爭(zhēng)排名也非常激烈,那么呈現(xiàn)出來(lái)的結(jié)果就會(huì)迥異。
3、如果兩個(gè)同義詞前面加上了地域或者其他限制性的前綴,搜索引擎會(huì)考慮將這兩個(gè)詞語(yǔ)當(dāng)成一個(gè)關(guān)鍵詞來(lái)對(duì)待,但幾率較小。
4、對(duì)于冷門(mén)和一些專(zhuān)業(yè)術(shù)語(yǔ),搜索引擎如果在自身數(shù)據(jù)庫(kù)中有兩個(gè)同義詞的數(shù)據(jù),將同義詞當(dāng)成一個(gè)關(guān)鍵對(duì)待的幾率將大大加大。
以上猜測(cè)僅參考了少部分的搜索詞語(yǔ),搜索引擎對(duì)于同義詞的匹配和對(duì)待的態(tài)度是非常的謹(jǐn)慎,更多更準(zhǔn)確的數(shù)據(jù)就需要更多的關(guān)鍵詞語(yǔ)去驗(yàn)證了。
發(fā)表評(píng)論評(píng)論列表(有 條評(píng)論)