“雅虎搜索功能發(fā)生了巨大變化。”
韓國(guó)雅虎(代表李承一)的搜索功能發(fā)生了巨大變化。與1個(gè)月前相比,韓語(yǔ)網(wǎng)頁(yè)的搜索功能明顯好轉(zhuǎn)。
雅虎服務(wù)發(fā)生了什么變化?
最近幾年來(lái),雅虎總部一直致力于開(kāi)發(fā)搜索技術(shù),并于2月推出了YST(Yahoo! Search Technology)自己的搜索引擎。隨著國(guó)內(nèi)網(wǎng)站使用該技術(shù),搜索功能大幅上升。
與雅虎總部在網(wǎng)頁(yè)搜索中使用“Google”不同,韓國(guó)雅虎一直使用國(guó)內(nèi)企業(yè)的搜索引擎。但該韓語(yǔ)搜索引擎動(dòng)輒搜索出“沙悟凈”一樣的結(jié)果,令用戶大傷腦筋。
例如,如果搜索“說(shuō)唱”神童——柳太平洋的名字,就會(huì)搜索出1萬(wàn)多篇文章,其中,排在第一的是法務(wù)法人太平洋的某律師。
如此,之所以首先搜索出與要搜索的單詞全然沒(méi)有關(guān)系的資料,是因?yàn)轫n語(yǔ)復(fù)合名詞處理技術(shù)存在問(wèn)題。把“柳太平洋”的單詞誤認(rèn)為復(fù)合名詞,分成“柳”和“太平洋”搜索的結(jié)果。
韓國(guó)雅虎主張,YST的功能不但超過(guò)國(guó)內(nèi)的搜索技術(shù),還比“Google”優(yōu)秀。果真如此嗎?
搜索網(wǎng)站企業(yè)對(duì)比較功能的資料敏感。雖然沒(méi)有正式的排名,但只要從用戶角度出發(fā)進(jìn)行簡(jiǎn)單的測(cè)試,就能區(qū)分好壞。即,在不同的網(wǎng)站輸入同一個(gè)單詞,比較搜索結(jié)果的件數(shù)和正確性以及相關(guān)度。
例如,如果搜索70年代流行歌曲《火樹(shù)》歌詞中的“你是否知道”的部分,只有首先介紹包含該句子的網(wǎng)頁(yè),才能視為相關(guān)度較高。
而且還要測(cè)試把多個(gè)單詞當(dāng)作一個(gè)單詞搜索的句文搜索功能。作為句文搜索符號(hào),使用“大引號(hào)”。如果比較結(jié)果,就能看出韓國(guó)雅虎的改進(jìn)。
韓國(guó)雅虎搜索事業(yè)部長(zhǎng)崔亨禹(音譯)表示:“自從引進(jìn)新搜索引擎后,搜索的數(shù)據(jù)庫(kù)(DB)量、順序技術(shù)、韓語(yǔ)處理技術(shù)、刪除垃圾網(wǎng)頁(yè)等功能大幅上升。”