】“我們的搜狗3.0,已經(jīng)達(dá)到中文搜索領(lǐng)域的絕對(duì)的領(lǐng)先,而這種差距是競(jìng)爭(zhēng)對(duì)手們?cè)诂F(xiàn)有技術(shù)架構(gòu)上難以實(shí)現(xiàn)的。” 2006年12月7日下午,搜狐公司CEO張朝陽(yáng)在辦公室接受了記者的采訪。當(dāng)談及即將上線的搜狗3.0版搜索引擎時(shí),他的神情頗為愉悅。
他甚至略為調(diào)侃地評(píng)價(jià)競(jìng)爭(zhēng)對(duì)手百度“聽(tīng)取的華爾街的聲音太多了”。
盡可能地“抓” 將于明年1月1日正式推出的搜狗3.0版本的最大亮點(diǎn),在于將憑借其自主研發(fā)的
服務(wù)器集群并行的抓取技術(shù),將中文網(wǎng)頁(yè)的收錄數(shù)量由目前的50億一舉提升到100億,網(wǎng)頁(yè)的更新速度將提升到每天5億。據(jù)張朝陽(yáng)介紹,這樣的一個(gè)收錄數(shù)據(jù)量,可實(shí)現(xiàn)了對(duì)全部中文網(wǎng)頁(yè)50%—75%的覆蓋率,在當(dāng)前中文類搜索引擎中尚屬首位。
要在節(jié)省
服務(wù)器的情況下,達(dá)到100億數(shù)據(jù)和5億的日更新量,對(duì)于搜索引擎技術(shù)而言還是具有一定挑戰(zhàn)性的。張朝陽(yáng)告訴記者,之所以要將搜狗的重點(diǎn)放在增加收錄量上,是由于很多新的頁(yè)面包括用戶所產(chǎn)生的內(nèi)容,都“很有價(jià)值”,而只有“把網(wǎng)上出現(xiàn)的頁(yè)面盡可能地抓過(guò)來(lái)”,才是實(shí)現(xiàn)搜索引擎“好用”和“及時(shí)”的基礎(chǔ)。
百度“草根”谷歌“學(xué)術(shù)” “精準(zhǔn)”,是搜狗3.0版本的另一優(yōu)勢(shì)所在。
解釋這一特點(diǎn)時(shí),張朝陽(yáng)特意拿出了競(jìng)爭(zhēng)伙伴們進(jìn)行對(duì)比說(shuō)明:“拿同一關(guān)鍵詞到不同的搜索引擎上搜索,得到的結(jié)果是有很多差別的,我們發(fā)現(xiàn),百度的結(jié)果草根含量相對(duì)高一些,但多個(gè)詞聯(lián)合檢索效果比Google弱;Google的結(jié)果學(xué)術(shù)性含量相對(duì)較高;而Yahoo的結(jié)果則更傾向于官方信息?!?
注意到這一點(diǎn)后,搜狗開(kāi)始嘗試著將幾家的優(yōu)勢(shì)綜合,在搜索引擎的權(quán)重設(shè)置方面找到平衡點(diǎn),以便“讓不同的用戶更容易找到自己所需要的結(jié)果”。
“搜索引擎是需要強(qiáng)大的人工智能來(lái)對(duì)網(wǎng)頁(yè)進(jìn)行分析,你的構(gòu)架要有準(zhǔn)確的分析,結(jié)果就是更了解?!睆埑?yáng)如是說(shuō)道。
在他看來(lái),如今,搜狗3.0版的中文搜索結(jié)果已經(jīng)明顯優(yōu)于百度、谷歌和雅虎。
“追趕者必須在技術(shù)上超越對(duì)手才能夠改變用戶行為。如果搜狗引擎的水平接近百度,用戶還是不會(huì)過(guò)來(lái),我們2.5版的技術(shù)和百度相當(dāng),現(xiàn)在3.0版已經(jīng)超越了百度,達(dá)到中文搜索領(lǐng)域的絕對(duì)的領(lǐng)先?!?
中文市場(chǎng)還大有可挖 就在幾天前,百度剛剛宣布了將于明年進(jìn)軍日本搜索引擎市場(chǎng)的規(guī)劃。對(duì)此張朝陽(yáng)顯得頗有些不以為然:“他們聽(tīng)取華爾街的聲音太多了。”
他表示,中文市場(chǎng)其實(shí)還大有可挖,因此,搜狗將持續(xù)專注于中文搜索。
“我們目前不會(huì)考慮去做外文的搜索,主要任務(wù)還是把中文的搜索結(jié)果做好?!睆埑?yáng)告訴記者,在他看來(lái),中國(guó)網(wǎng)民很快將成為世界上最大的網(wǎng)民群體,但現(xiàn)在中文搜索的用戶滿意度,還遠(yuǎn)遠(yuǎn)達(dá)不到西方人使用英文搜索時(shí)的滿意度,創(chuàng)新和可供突破改進(jìn)的空間相當(dāng)大,因而“我們要先把中文市場(chǎng)做強(qiáng)做好,挖深挖透?!?
網(wǎng)頁(yè)搜索技術(shù)強(qiáng)大之后,各種相應(yīng)的專項(xiàng)應(yīng)用也會(huì)隨之而來(lái)。據(jù)悉,明年適當(dāng)時(shí)候,搜狐將推出垂直搜索服務(wù)。張朝陽(yáng)還透露,目前搜狗在視頻搜索方面也進(jìn)行了很多儲(chǔ)備,包括在視頻內(nèi)容鏈接搜索以及內(nèi)容連通和流暢性方面都有很大積累,很快就能推出相關(guān)服務(wù)。
“驅(qū)動(dòng)”搜狐 “我們的3.0,就像一個(gè)新的發(fā)動(dòng)機(jī),一旦制造出來(lái)并安裝上后,速度會(huì)一下子上來(lái)?!辈稍L中,張朝陽(yáng)屢次將搜狗3.0比作一個(gè)全新的“發(fā)動(dòng)機(jī)”。
在他心目中,這個(gè)馬力強(qiáng)勁的“發(fā)動(dòng)機(jī)”,不但能夠迅速驅(qū)動(dòng)搜狐的搜索引擎業(yè)務(wù),更將全面“驅(qū)動(dòng)”整個(gè)搜狐:“現(xiàn)在應(yīng)該說(shuō)搜狗已經(jīng)成為整個(gè)搜狐公司的引擎。因?yàn)樗压费邪l(fā)中心的技術(shù),包括搜索引擎技術(shù)、網(wǎng)頁(yè)分析技術(shù)、內(nèi)容的加速和下載技術(shù)等都已經(jīng)匯集到了了整個(gè)搜狐,促進(jìn)著搜狐技術(shù)的進(jìn)步,并將會(huì)使得整個(gè)搜狐公司的業(yè)績(jī)不斷改善和發(fā)展?!?
“我們希望把搜狐打造成一個(gè)技術(shù)的圣殿,如果說(shuō)兩年前我們說(shuō)這個(gè)話可能大家不相信,但是現(xiàn)在隨著搜狗的成長(zhǎng),我們基本上已經(jīng)朝著這個(gè)方向走了?!睆埑?yáng)笑道。不過(guò)他也坦承,從娛樂(lè)驅(qū)動(dòng)到如今的技術(shù)驅(qū)動(dòng),自己也經(jīng)歷了一個(gè)思想的轉(zhuǎn)變過(guò)程:“我一直在考慮互聯(lián)網(wǎng)公司的核心競(jìng)爭(zhēng)力到底來(lái)自什么?現(xiàn)在確認(rèn)了,是技術(shù)?!?
雖然對(duì)搜狗寄寓厚望,目前張朝陽(yáng)還尚未計(jì)劃將贏利任務(wù)壓在搜狗頭上。他坦言,雖然在技術(shù)上已經(jīng)超越了百度等競(jìng)爭(zhēng)對(duì)手,但搜狗的流量比起競(jìng)爭(zhēng)對(duì)手來(lái)尚有一定差距,因此,目前搜狗的首要任務(wù)是先把流量做起來(lái),“讓搜狗成為中國(guó)人首選的搜索引擎”,然后再考慮贏利和收入問(wèn)題。
“在搜狗的品牌方面我們?cè)?jīng)走過(guò)一些彎路,現(xiàn)在已經(jīng)糾正過(guò)來(lái)了,將來(lái),我們會(huì)繼續(xù)把搜狗的品牌擦亮。