中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
Google 以外的17個(gè)搜索引擎創(chuàng)新
新聞來源:譯言-技術(shù)與創(chuàng)業(yè)
原文作者:Nitin Karandikar
原文鏈接:Top 17 Search Innovations Outside Of Google
譯者:convertible 有許多新的搜索引擎(最新統(tǒng)計(jì)有100多個(gè))都在開創(chuàng)一些搜索技術(shù)的創(chuàng)新。下面是一份17大搜索創(chuàng)新清單,我們認(rèn)為,這些創(chuàng)新將來會(huì)是破壞性的(譯者:關(guān)于破壞性創(chuàng)新,請(qǐng)參見這里)。這些創(chuàng)新分為4類:查詢預(yù)處理;信息來源;算法改進(jìn);結(jié)果可視化和后處理。 [其中的某些創(chuàng)新也在Google的存在各種產(chǎn)品中,但是,正如下文所述,Google的主搜索頁(yè)中不是缺失了這些功能,就是功能還很有限。


查詢預(yù)處理
 

 

這類改進(jìn)的主要目的是應(yīng)用邏輯來盡量預(yù)測(cè)用戶的意圖,并由此改進(jìn)查詢的輸入。

1. 自然語(yǔ)言處理 這一功能最初是由Ask.com開創(chuàng)的。同期最著名的例子是Hakia 和 Powerset,二者以不同的方式試圖理解用戶查詢背后的語(yǔ)義或意思。這些搜索引擎與Google的很大的不同,是他們認(rèn)為“忽略詞”(stopwords)非常重要,如次要的連詞,像by, for, about, of, in等,Google通常會(huì)忽略它們。

2. 個(gè)人相關(guān)性(亦稱“個(gè)性化”) 長(zhǎng)久以來,大家認(rèn)為按某特定用戶的興趣和要求處理查詢,能獲得更高相關(guān)性的搜索結(jié)果。 Google已在其搜索引擎中支持這一功能,但需要登陸才能使用。很多用戶理所當(dāng)然地不情愿這樣做,因?yàn)檫@樣可能會(huì)給Google提供追蹤其特殊的搜索內(nèi) 容的條件。 [即使John Battelle也認(rèn)為這個(gè)想法有點(diǎn)可怕,盡管Google的Matt Cutts并不同意這個(gè)看法。] 所需要的就是一種雖然是匿名方式,但能提供個(gè)性化的搜索方式。從更廣泛的角度來說,提供多個(gè)網(wǎng)站上的個(gè)性化會(huì)更加有用。 Collarity就是擁有這一功能的搜索引擎。

3. 定制的、專門的搜索 這是一個(gè)簡(jiǎn)單但強(qiáng)大的功能。這一應(yīng)用的典型代表是SimplyHired,一個(gè)求職招聘的垂直搜索引擎,能提供強(qiáng)大的、預(yù)設(shè)的搜索,比如“適合年紀(jì)大的員工的雇主”、“允許上班帶狗的雇主”等。

信息來源

這些改進(jìn)著重于潛在的數(shù)據(jù)來源:額外的內(nèi)容類型和對(duì)數(shù)據(jù)來源的限制,提高了搜索結(jié)果的可靠性(減少垃圾信息)。

4. 新的內(nèi)容類型
今天的年輕人正像交流文字信息一樣,在手機(jī)上舒服地交流照片和視頻,成為這個(gè)時(shí)代的標(biāo)記。在網(wǎng)上,富媒體內(nèi)容-圖片、音頻、視頻、電視等,及與其內(nèi)容有關(guān)的語(yǔ)義信息一起正在爆炸性地增長(zhǎng)。搜索引擎也愈加需要相應(yīng)地支持這些內(nèi)容類型。一些支持豐富內(nèi)容的搜索引擎的示例如下:

-富媒體搜索:音頻 (odeo, podzinger ),視頻(Youtube, truveo),電視 (Blinkx ),圖片 (Picsearch, Netvue )

-專業(yè)化內(nèi)容搜索:博客 (Technorati ),新聞(Topix ),分類廣告 (oodle )

當(dāng)然,Google在這一領(lǐng)域也非?;钴S,如Google Blogsearch(博客),Searchmash (圖片), Google視頻, Google新聞等,因此,也許將這一項(xiàng)放在這個(gè)清單里不大公平。盡管如此,理想的情況是,將不同的媒體結(jié)果集合在一個(gè)搜索里,正如Searchmash已經(jīng)做的那樣(Retrevo是另外一個(gè)好例子)。

5. 限定的數(shù)據(jù)來源

最使搜索用戶煩心的問題之一是垃圾信息。由于營(yíng)銷商們更加聰明,正日益使用更多侵略性的SEO(搜索引擎優(yōu)化)技巧,搜索結(jié)果的質(zhì)量就又下降了。 (Google,作為最流行的搜索引擎,更是眾矢之的。) 對(duì)一系列受信任站點(diǎn)的限制性搜索排除了這一問題,盡管它也縮小了搜索內(nèi)容的領(lǐng)域—它為某些類型的搜索很好地提供了真實(shí)的、優(yōu)質(zhì)的結(jié)果,比如,當(dāng)為一個(gè)小學(xué)項(xiàng)目研究火山時(shí),搜索維基百科(Wikipedia)、國(guó)家地理(National Geographic)和科學(xué)/教育站點(diǎn)。

這一應(yīng)用最好的例子來自A9.com,它能從多種數(shù)據(jù)來源中提供內(nèi)容,并允許用戶對(duì)每一個(gè)搜索作出清楚的選擇。Google Co-op 和 Yahoo! Search Builder 能使第三方可以創(chuàng)建這種解決方案;Rollyo早已經(jīng)是這一領(lǐng)域的先行者!

6. 特定領(lǐng)域的搜索(垂直搜索)
通過聚焦一個(gè)單一的垂直方向,搜索引擎能提供更好的用戶體驗(yàn),它對(duì)某一特定領(lǐng)域更加全面、簡(jiǎn)明。針對(duì)不同的領(lǐng)域有令人難以置信的大量的垂直搜索引擎,更多資料請(qǐng)查看Alex Iskold在讀寫網(wǎng)(Read/WriteWeb)上的文章或在Software Abstractions博客上的概述。 [要更全面地了解這方面的信息,Sramana Mitra的在線旅游服務(wù)概述介紹了垂直搜索與通用搜索的關(guān)系。]

算法改進(jìn)


這些改進(jìn)著重于提高潛在的搜索算法以提高搜索結(jié)果的相關(guān)性并提供新的搜索能力。

7. 參數(shù)搜索
這類搜索更接近于數(shù)據(jù)庫(kù)查詢,而不象文本搜索。它回答的問題從本質(zhì)上不同。參數(shù)搜索有助于發(fā)現(xiàn)問題解決方案,而不是文本文檔。比如,Shopping.com允許你用材料、品牌、風(fēng)格或價(jià)格不同來限定衣服搜索;像indeed 這樣的招聘搜索網(wǎng)站讓你限定搜索匹配的郵政編碼;GlobalSpec讓你搜索工程部件時(shí)指定多種參數(shù)(如搜索工業(yè)管道時(shí)輸入各種參數(shù))。參數(shù)搜索是垂直搜索引擎的天然特性。

Google已在通用層面上組合了這一特性,比如在高級(jí)搜索頁(yè)面上的參數(shù),但是沖淡了它的有用性。當(dāng)你深入進(jìn)標(biāo)準(zhǔn)的搜索結(jié)果,或當(dāng)你限定搜索某一特定垂直領(lǐng)域時(shí),附加參數(shù)的強(qiáng)大功能最能充分體現(xiàn)出來。

8. 社會(huì)化信息輸入
Yahoo! 的Bradley Horowitz相信社會(huì)化輸入未來將是搜索技術(shù)一個(gè)重要的分水嶺(微軟也有同樣看法)。來自大量用戶的聚集信息輸入使搜索引擎受益于群眾的智慧而提供優(yōu)質(zhì)的搜索結(jié)果。當(dāng)然,如果某些個(gè)別的輸入缺乏獨(dú)立性或可能是故意搗亂,搜索結(jié)果可能會(huì)無效。 在這一領(lǐng)域中提供的不同的服務(wù)中,del.icio.us 是根據(jù)這一方法提供優(yōu)質(zhì)搜索能力的典范。[在我較早發(fā)布的文章中,作了一個(gè)基于“外包給群眾(crowd-sourcing)”的不同解決方案的可搜索性能的對(duì)比。] 其他基于用戶評(píng)價(jià)的系統(tǒng)包括StumbleUpon, Squidoo, About.com,當(dāng)然也有Wikipedia。盡管嚴(yán)格來說,它們不是搜索引擎,它們都可以歸結(jié)于可搜索性的總體框架之內(nèi)。

當(dāng)然,Google那功勛卓著的網(wǎng)頁(yè)排名(PageRank)算法也隱含地根據(jù)社會(huì)化輸入。由于網(wǎng)頁(yè)排名(PageRank)的一個(gè)重要組成部分是基于不同網(wǎng)站的外部鏈接的數(shù)量和特點(diǎn),那些外部鏈接擔(dān)當(dāng)了收集群體智慧的隱含投票。

9. 人工輸入
為了有一個(gè)完整的認(rèn)識(shí),把這一類包括進(jìn)來。像ChaCha這樣的搜索引擎正在試驗(yàn)用人工操作員來回答搜索查詢。 值得討論,Yahoo! Answers是否也是這一領(lǐng)域中的另一種解決方案,盡管這些答案由其他用戶,而不是為搜索引擎工作的人來提供。

很難看出ChaCha這類方法怎樣擴(kuò)大規(guī)模,除非它設(shè)法利用社區(qū)資源。

10. 語(yǔ)義搜索
最近搜索領(lǐng)域一些令人激動(dòng)的新發(fā)展與從整個(gè)網(wǎng)絡(luò)中提取智能信息有關(guān)。 這些應(yīng)用剛剛開始,他們表達(dá)了語(yǔ)義網(wǎng)絡(luò)的巨大潛能。這一領(lǐng)域早期的先行者包括:Monitor110,它試圖從網(wǎng)絡(luò)上提取可作為行動(dòng)參考的金融信息,金融機(jī)構(gòu)投資者們可能對(duì)這些信息有興趣;Spock,“搜人”引擎(現(xiàn)在正處于封閉測(cè)試階段),它計(jì)劃在啟動(dòng)時(shí)數(shù)據(jù)庫(kù)中有1億份檔案;Riya,一個(gè)視覺搜索引擎,其技術(shù)能提供照片的面部和文本識(shí)別。

11. 對(duì)發(fā)現(xiàn)的支持
與個(gè)性化和代理技術(shù)并肩的是發(fā)現(xiàn)技術(shù),這是搜索的圣杯。盡管即時(shí)需求的搜索現(xiàn)在是最流行的,但大部分用戶在長(zhǎng)時(shí)間內(nèi)有相當(dāng)穩(wěn)定的興趣。如果你能發(fā)現(xiàn)新的數(shù)據(jù)源,特別是當(dāng)優(yōu)質(zhì)的feed出現(xiàn)時(shí),豈不是很爽?

在這一方向上已經(jīng)有了一些試探性的嘗試,將搜索與RSS的力量聯(lián)合起來,比如你已經(jīng)能建立一個(gè)RSS feed來輸出許多 Google 和 Yahoo!中的搜索內(nèi)容。Bloglines已經(jīng)支持“特薦Feed”的功能--很明顯,feed讀者很適合在你感興趣的領(lǐng)域推薦新的博客和feed(基于你的OPML文檔的內(nèi)容)。這一領(lǐng)域中還有Aggregate Knowledge,它通過從多處網(wǎng)站匿名收集信息來為零售和媒體提供專業(yè)化服務(wù)??傮w而言,這將來會(huì)是一個(gè)令人激動(dòng)的領(lǐng)域!

結(jié)果顯示和后處理


這些改進(jìn)著重于改善結(jié)果顯示和為查詢后提供的“下一步”功能。

12. 分類、標(biāo)簽云和聚類
像Quintura和Clusty這樣的搜索引擎根據(jù)標(biāo)簽和關(guān)鍵詞提供結(jié)果的聚類。它不僅讓用戶看到結(jié)果本身,也使結(jié)果的聚類及結(jié)果之間的關(guān)系可視化。這一元信息(meta-information)能幫助用戶領(lǐng)會(huì)結(jié)果并發(fā)現(xiàn)相關(guān)主題的新信息。

13. 結(jié)果可視化
圖片比文本結(jié)果更容易讓人的大腦理解和記憶。在比聚類更普遍的水平上,用專門的圖形用戶界面來顯示搜索結(jié)果及結(jié)果之間的關(guān)系,能傳達(dá)給用戶更多的意義并使用戶感覺到“大方向”。在某一特定的上下文中,這一方法效果特別好,比如垂直搜索引擎。 Thinkmap的Visual Thesaurus,Inxight Software的VizServer和房地產(chǎn)搜索引擎Trulia的HeatMaps都是使信息可視化的新方法的例子,盡管在這一領(lǐng)域的研究還處于早期階段。更簡(jiǎn)單的一個(gè)應(yīng)用,HousingMaps是一個(gè)顯示可租/售房屋位置的聚合。

14. 結(jié)果提煉與過濾
搜索后下一步經(jīng)常是通過進(jìn)一步的對(duì)結(jié)果的提煉并“深入進(jìn)”結(jié)果里去。這不同于我們?cè)贕oogle已經(jīng)用到的“關(guān)鍵詞修改”,它不僅僅是用關(guān)鍵詞組合來試驗(yàn)提交新的查詢,而是試圖確實(shí)地提煉結(jié)果[等于是在SQL查詢的“where”子句中增加更多的條件],這將使用戶收縮其結(jié)果并趨近于想要的答案。

查詢提煉是搜索處理的重要部分,盡管它還沒有引起應(yīng)有的注意。一個(gè)好例子是醫(yī)療搜索引擎Healia,它允許用戶通過使用人口特質(zhì)過濾器來改動(dòng)衛(wèi)生保健搜索結(jié)果。這很重要,因?yàn)槿丝谔刭|(zhì),比如年齡、種族和性別可能對(duì)癥狀、疾病和治療用藥的搜索結(jié)果有很大的影響;還有基于發(fā)現(xiàn)結(jié)果的復(fù)雜性、來源和類型的過濾器。

Google最近在其結(jié)果頁(yè)面底端引入了一個(gè)新按鈕:“在結(jié)果中搜索”,這是正確的一步;結(jié)果還可以通過現(xiàn)有的 OneBox插件和相關(guān)的Plusbox新功能來提煉。隨著時(shí)間的過去,我們可以期待這一功能會(huì)日益成熟。

15. 結(jié)果輸出平臺(tái)
由于社會(huì)化媒體和在線內(nèi)容變得更加流行,用戶數(shù)字信息可選擇的數(shù)量繼續(xù)增加;相應(yīng)地,搜索引擎必須支持多種輸出平臺(tái),包括:網(wǎng)絡(luò)搜索,移動(dòng)設(shè)備,RIA(豐富互聯(lián)網(wǎng)應(yīng)用程序 Rich Internet Applications),RSS,電子郵件等。隨著從不同設(shè)備接入網(wǎng)絡(luò)更加普遍,未來的用戶很可能會(huì)將更加非傳統(tǒng)的資源來連接搜索引擎,比如:用TiVo(譯者:一種可以錄制數(shù)字電視節(jié)目的系統(tǒng)。)系統(tǒng)來搜索感興趣的電影或節(jié)目,用Nintendo(任天堂)系統(tǒng)搜索在線游戲,甚至用冰箱的觸摸屏來搜索菜譜。

現(xiàn)在的一些搜索引擎已經(jīng)支持標(biāo)準(zhǔn)的網(wǎng)絡(luò)瀏覽器和移動(dòng)設(shè)備之外的附加的平臺(tái)。網(wǎng)絡(luò)搜索引擎Plazoo提供RSS feed 已經(jīng)很長(zhǎng)時(shí)間了;Quintura起初根本就是一個(gè)可下載的RIA應(yīng)用,現(xiàn)在這個(gè)搜索引擎剛剛開始提供網(wǎng)絡(luò)界面。

為許多不同的結(jié)果類型提供支持的最簡(jiǎn)單的方法是提供開放的API,使第三方開發(fā)人員能為專業(yè)化的目標(biāo)平臺(tái)創(chuàng)建定制的用戶界面。Alexa網(wǎng)絡(luò)搜索平臺(tái)是最先提供開放的API的平臺(tái)之一(盡管你自己承擔(dān)使用該API的風(fēng)險(xiǎn)),其他可用的API包括oodle, zillow 和 trulia。

當(dāng)然,Google也為幾種不同的產(chǎn)品提供API,比如Google Base, Google Maps 和 AJAX 搜索API,盡管不是為主搜索引擎提供。手持設(shè)備能通過Google Mobile獲得支持;Google Base 和 Blogsearch已經(jīng)提供了RSS輸出。

16. 相關(guān)服務(wù)
嚴(yán)格來講,這并不是搜索功能本身的一部分。但是,一旦你完成一個(gè)查詢,經(jīng)常下一步自然地就是跟隨這一搜索的結(jié)果。比如,你搜索工作機(jī)會(huì)以后,你就會(huì)想申請(qǐng)你發(fā)現(xiàn)的招聘崗位。從最終用戶的有用性來看,這是搜索引擎全部功能的內(nèi)在部分。

令人吃驚的是,這一特征除了顯示與上下文相關(guān)的廣告外,還沒有被許多搜索引擎重點(diǎn)開發(fā)。這一方法的完美的例子是這個(gè)有一個(gè)有趣的名字的搜索引擎: the web‘s too big(互聯(lián)網(wǎng)太大了),它能使用戶搜索英國(guó)的公共關(guān)系機(jī)構(gòu)的網(wǎng)站上的信息。他們提供一個(gè)有趣的附加功能:用戶能輸入他們的想查詢的有關(guān)公關(guān)的詳細(xì)情況,點(diǎn)擊一下就可以直接提交給多個(gè)公關(guān)機(jī)構(gòu)。類似地,房地產(chǎn)搜索引擎Zillow提供Zestimate(Zillow計(jì)算的房產(chǎn)的估計(jì)價(jià)值)的概念,以及房產(chǎn)問答的功能。這些類型的附加服務(wù)增加了提供給用戶的搜索結(jié)果的價(jià)值,也使這個(gè)網(wǎng)站更有“粘性”。

Google在它的一些產(chǎn)品上也提供附加服務(wù),比如在Google Maps上的“尋找商家”,但并不是在它的主搜索引擎上。

17. 搜索代理
搜索代理像feed那樣,與興趣和訪問搜索結(jié)果領(lǐng)域的孿生創(chuàng)意密切相關(guān),這一創(chuàng)意是持續(xù)的、正在進(jìn)行中。設(shè)想某個(gè)軟件有一種定期搜索查詢的功能,監(jiān)控網(wǎng)上感興趣主題的更新信息,收集并整理結(jié)果,移除重復(fù)信息并以匯總的形式提供定期升級(jí)。這對(duì)某些類型的、重要的但并不急迫的連續(xù)搜索非常好:比如,監(jiān)控感興趣的招聘、按特定參數(shù)設(shè)定的在售新房、降到某特定價(jià)格的衣服等。

Copernic是這一領(lǐng)域的有趣的“選手”—Copernic搜索代理能自動(dòng)運(yùn)行已存儲(chǔ)的搜索,提供新結(jié)果的匯總,還能跟蹤網(wǎng)頁(yè)的變化。來自Connotate Technologies的Information Agent Suite挖掘“深層網(wǎng)絡(luò)”并自動(dòng)進(jìn)行變化探測(cè)。更多搜索代理的例子,詳見讀寫網(wǎng)(Read/WriteWeb)的一篇文章,介紹了Allth.at及Swamii 和Searchbots.net。

結(jié)論
很明顯,Google并不甘心這次猛攻的失敗。正像它把個(gè)性化搜索引入到最初的搜索引擎上,當(dāng)這些其他的方法成功時(shí),Google將繼續(xù)把這些方法集成到其主流搜索引擎上。比如,垂直專業(yè)化搜索是Google肯定會(huì)用的強(qiáng)大工具。

將來很可能在Google首頁(yè)上簡(jiǎn)單的“搜索框”后面會(huì)隱藏著多種專業(yè)化搜索引擎。另一方面,試圖勉強(qiáng)加入這些數(shù)量日益增加的復(fù)雜特性,將可能使Google或任何其他主流網(wǎng)絡(luò)搜索引擎的整體結(jié)構(gòu)非常復(fù)雜而難以改變,因此如何取舍將是越來越困難的挑戰(zhàn)。在Software Abstractions博客的一篇文章中,我們看一看集成了這些大部分特性的主流搜索結(jié)構(gòu)的概念結(jié)構(gòu)。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
信息過載和個(gè)性化搜索 — Allyon 方案·案例中心
譯文:擊敗Google的賽跑 -google,譯文,草根網(wǎng)IT資訊精讀(20ju.com)
打破中文聚類搜索的低迷
一個(gè)純粹的中文搜索引擎:【Doge Doge】多吉搜索
打造屬于您自己的搜索引擎 - Swicki
62%的用戶只點(diǎn)擊搜索結(jié)果第一頁(yè)
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服