|
||||||||||
|
||||||||||
您現(xiàn)在的位置:中國IDC圈 >> SEO(搜索優(yōu)化) |
搜索眾巨頭正積極打造終極搜索引擎 |
中國IDC圈9月12日報道:谷歌、微軟、雅虎等公司正著手開發(fā)新一代技術(shù),讓信息搜索更為自動化和個性化。 搜索引擎,也就是那個小小的瀏覽器工具,你在其中輸入一個詞,并點擊回車,之后就滿懷希望開始等待,可它返回的往往是數(shù)百萬個毫不相關(guān)的互聯(lián)網(wǎng)地址。微軟公司(Microsoft,下稱微軟)稱,人們平均要花11分鐘的時間才能找到所需內(nèi)容,而且還有一半的人在達(dá)成此目標(biāo)之前即中途放棄搜索。據(jù)高德納公司(Gartner)估計,由于訪問者根本無法找到所需內(nèi)容,有一半的潛在Web銷售因此而喪失掉了。 谷歌公司(Google)、微軟、雅虎公司(Yahoo)、以及其他數(shù)十家專業(yè)搜索公司,其中也包括那些專注于商業(yè)領(lǐng)域的搜索公司在內(nèi),已開始展開新一代搜索技術(shù)的開發(fā)競賽,以幫助人們更高效地獲取所需信息。有了這些新興的搜索工具,人們無需再使用混合語言一遍又一遍地簡化搜索。他們可以用英語或其他語言查詢問題,或者根本不提出任何問題,只是基于其以前的查詢或所用的應(yīng)用軟件,就能自動收到查詢結(jié)果。 專注于中文搜索的百度公司(Baidu,下稱百度)雖然沒有就下一代搜索的話題表態(tài),但是根據(jù)百度現(xiàn)有的一系列產(chǎn)品,從百度貼吧、百度知道、百度百科到百度空間等服務(wù),不難看出這家公司正在利用用戶生成內(nèi)容(UGC)提高自身對于用戶興趣點捕捉的精確度。 除了文字內(nèi)容之外,用戶實際得到的搜索結(jié)果還將包括音頻和視頻文件、PowerPoint幻燈和其他信息圖表、以及結(jié)構(gòu)化數(shù)據(jù),這些信息全部精選自Web、PC、以及公司數(shù)據(jù)庫,并最終匯成統(tǒng)一的信息流。假以時日,圖像搜索甚至能在圖像中檢測信息,而無需對元數(shù)據(jù)進(jìn)行解析。 搜索結(jié)果將更加精確,并經(jīng)過自動歸納總結(jié),按照個人偏好依相關(guān)程度進(jìn)行排序。聚簇、標(biāo)簽云(Tag Cloud)等可根據(jù)參數(shù)擴(kuò)大或縮小搜索的新表達(dá)方法以及自動分類,可以簡化對搜索結(jié)果的處理。同時,采用標(biāo)簽服務(wù)、社會性書簽服務(wù)(Social Bookmarking)以及共享搜索等方式,充分發(fā)揮人類智慧特別是群體智慧的力量,搜索引擎將得到極大改進(jìn)。 而且,我們無需翹首以盼,等待這些高速搜索引擎的出現(xiàn)。如下一些高級功能已隨處可見。 語義搜索 當(dāng)今多數(shù)搜索引擎都要求使用速記語言,也就是某些人稱作Keywordese的語言!澳蔷拖窀粋2歲小孩說話! Powerset公司首席執(zhí)行官(CEO)巴尼。佩爾(Barney Pell)形容道。Powerset是一家將自然語言處理技術(shù)應(yīng)用于搜索領(lǐng)域的初創(chuàng)公司。未來10年,佩爾指出,搜索引擎“理會意思”的本領(lǐng)會更為高強(qiáng)。 早在2000年,百度就曾經(jīng)大力協(xié)助當(dāng)時的ChinaRen公司推出了一個名為“孫悟空搜索”的提問式搜索引擎!拔耶(dāng)時使用過孫悟空搜索,感覺它對中文語義的理解已達(dá)到了相當(dāng)?shù)纳疃,雖然那時的技術(shù)可能還比較粗淺!崩铢i在接受《信息周刊》采訪時回憶道。李鵬是加拿大英屬哥倫比亞大學(xué)(University of British Columbia)計算機(jī)專業(yè)的在讀博士,同時也是微軟位于美國華盛頓州雷德蒙德園區(qū)(Redmond)的實習(xí)研究人員,專注于語義網(wǎng)(Semantic Web)的研究。 現(xiàn)在,Powerset公司、Hakia公司、以及其他一些公司已開始開發(fā)新的搜索引擎,這些搜索引擎應(yīng)用語言學(xué)解釋問題,分析Web內(nèi)容,并且必要時,還通過與用戶的互動來優(yōu)化搜索結(jié)果。Hakia公司CEO里薩。博坎(Riza Berkan)憧憬說,未來搜索引擎會成為“知識淵博的工具,如果我們能教會它們?nèi)绾沃v話、如何理會用戶的意思。 ” 語義搜索引擎對語言進(jìn)行解析,就像學(xué)生學(xué)英文一樣,用字典和辭典來解釋字的意思,并依據(jù)句法的基本規(guī)則將之連起來。比如,“國際商業(yè)機(jī)器公司(IBM)于1996年斥資7.43億美元買下了Tivoli公司”這句話,包括了購買、購買的主語、購買的時間、以及買入價等幾個概念。 在理解問題之后,基于語義網(wǎng)的搜索引擎將會給出智能的回答!氨热纾惚硎疽A(yù)約一個牙醫(yī),”李鵬給出了一個例子,“搜索引擎有可能從你的Outlook找出你的時間表,然后從你牙醫(yī)的網(wǎng)站上找出他或她的時間安排情況,最后歸納出共同的時間點,再給你提出精確的預(yù)約建議! 迄今為止,盡管Hakia公司的搜索引擎已能夠利用語言提示在它自己甚至都不能領(lǐng)會的概念中發(fā)現(xiàn)大致意思,但人們應(yīng)用語言規(guī)則,并對分類進(jìn)行定義,以縮小搜索范圍的做法仍然有助于推進(jìn)搜索引擎的開發(fā)!叭绻茏龅酵耆詣踊覀兙湍苄孀约喊l(fā)明了新人類,”博坎調(diào)侃道。谷歌和雅虎等在開發(fā)Web搜索引擎時也都會雇傭語言學(xué)家,盡管他們的搜索引擎還遠(yuǎn)不能與Hakia或Powerset的語義搜索相提并論。谷歌的搜索引擎能進(jìn)行拼寫檢查,并返回所搜索的單詞的同義詞和變體,但并不能始終準(zhǔn)確地解答問題。 聯(lián)邦保存研究所(Federal Preservation Institute)的歷史保存學(xué)習(xí)門戶(Historic Preservation Learning Portal)采用的是企業(yè)搜索公司Autonomy公司的技術(shù)。該網(wǎng)站存有大量記錄保存規(guī)則和保存方法的文檔,研究所應(yīng)用語義搜索幫助那些非專家類的用戶發(fā)現(xiàn)其所需信息!八麄儜(yīng)用這些工具,用普通語言即可提問,而其問題中無需帶有關(guān)鍵詞可能會含的技術(shù)術(shù)語!痹撗芯克偙O(jiān)康斯坦絲。拉米雷(Constance Ramirez)介紹說。比如說,有個網(wǎng)站訪問者可能會詢問加里福尼亞州紅屋頂房屋的保存情況,“看到返問的各類結(jié)果都是相關(guān)的,那種感覺真是妙不可言。”拉米雷回味道。 IBM也在致力于醫(yī)療衛(wèi)生和政府等領(lǐng)域的專業(yè)文本分析研究?蛻衾闷涿麨镺mniFind Analytics的搜索引擎,甚至可以分辨諸如情緒這樣的細(xì)枝末節(jié)之處,而且不管搜索到的文檔對某個主題的記錄或分析是積極的還是消極的,客戶還可對公司內(nèi)使用的專業(yè)詞匯、概念、以及專有名詞進(jìn)行定義。 “但是,基于精確語義的搜索有一個前提,那就是信息來源必須基于資源描述框架(RDF)、Web本體語言(Web Ontology Language,OWL )等信息格式。”李鵬指出,“信息源的格式化需要得到提供者的認(rèn)可和規(guī)范,這本身就需要相當(dāng)長的時間,是一個漸進(jìn)的發(fā)展過程! 無關(guān)鍵詞搜索 好運(yùn)難遇。目前仍處于開發(fā)階段的這類搜索引擎無需提示,即會根據(jù)你以前的查詢替你完成搜索;否則它們可能會在背景中搜索,根據(jù)Word文檔或Excel電子表中的上下文內(nèi)容提供相關(guān)信息。蘋果公司(Apple)的iTunes項目與此類似,如果聽者從硬盤中播放了一部音樂作品,iTunes Store即會顯示相關(guān)的其他音樂。
|
【責(zé)任編輯:junlee】
|
文章評論
|
|
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||
|
Chinaitlab Group 旗下網(wǎng)站: |
關(guān)于我們 | 廣告服務(wù)| 成功客戶 | 友情鏈接 | 網(wǎng)站歷史 | 聯(lián)系我們 | 招聘信息 | 免責(zé)聲明 |
|
北京盛世創(chuàng)富廣告?zhèn)髅接邢薰?BR>北京運(yùn)營中心:北京市海淀區(qū)中關(guān)村南大街9號理工科技大廈2107室 服務(wù)電話:86-10-85655622 深圳研發(fā)中心:深圳市福田保稅區(qū)英達(dá)利科技數(shù)碼園C座701D 服務(wù)電話:86-755-82044560 Copyright©2001 - 2009 All Rights Reserved |
|