很多人對互聯網變現和計算廣告的認識還很模糊,盲人摸象慢慢進步。本文為作者在清華大數據“技術·前沿”講座上所做的題為《互聯網變現與計算廣告》的演講,文中他談到了二者的關系和認識。
本文選自2015年9月28日劉鵬先生在清華大數據“技術·前沿”講座上所作演講。
今天借這個機會從我們做計算廣告的角度談一談,對大數據大家像盲人摸象一樣。我談一談我對數據的理解。所以我的題目叫做互聯網變現和計算廣告,談他們兩者之間的廣告。
我們還是從一些不太嚴肅的風格開始,這是我在空號里面寫的一個文章,二十一世紀還是什么一個雜志讓我寫一篇文章,談談互聯網思維,我想了半天,因為我一直在互聯網行業(yè)里面干,互聯網思維是什么?我指的是中國的市場,中國市場我總結了三個點:
第一,不要錢,和我今天這本書直接相關?;ヂ摼W上最核心的一點商業(yè)模式的東西是免費傾銷加后向變現的商業(yè)模式。嘀嘀、快的的模式不客氣的講就是傾銷,但是不是每一個企業(yè)傾銷完了都能夠活下來,或者能夠長大,企業(yè)在用傾銷的方式獲得了市場占有率以后,由于你推的是免費產品,怎么掙錢呢?就要大量用到后向變現的方式,后向變現就是把我免費產品獲得無形資產變成錢的過程。
我總結了三種資產:
第一,流量,別人在用你的APP的時候你可以順便在上面放一點東西,夾一點私活。流量通過廣告變現大家都明白。
第二,數據,大家都是奔著大數據來的,肯定對這一點很有興趣,數據怎么變成錢呢?數據能不能掙錢,會有很多人問這個問題,我覺得這個問題特別可笑,數據不僅掙錢,而且是規(guī)模化的盈利,這件事情已經不是這兩年才發(fā)生的事,這是十年前就已經發(fā)生的事情。為什么現在大家還在討論數據能不能掙錢,這說明很多大數據領域的人并沒有真正研究過去在互聯網里對數據的使用方法和變現手段。
有一個規(guī)律:一切規(guī)模化、個性化傳遞信息的商品,它的售價都會趨向于邊際成本,一個網站或者一個APP邊際成本是多少,每多服務一個用戶,他應該付出的額外成本是多少。邊際成本應該是零或者是很小一個數,很自然的這些產品的定價都應該是免費的。其他的商品,比如說電視,樂視的電視是多少錢銷售的?毛利為零,甚至是負毛利銷售,他有非常明確的后向變現的手段,不要擔心他掙不到錢,他只要能夠做到一定規(guī)模,掙錢是板上釘釘的事情,他掙的方式是先進的方式,別的方式會被他的所打敗。手機很明顯也會趨向于零毛利的銷售。有一些牌子的手機現在毛利已經很低了,甚至是負的,這都不奇怪。
還有一些大家可以去探討,比如說電影,我堅定的認為電影的票價絕對應該是零,這件事情什么時候會發(fā)生?以我最保守的判斷,絕對不會超過十年。它的原理是,比如說最近有一個片子叫《港囧》,之前一部叫《泰囧》,它的票房非常好,等于賣給了三千萬人,三千萬人對于大眾喜聞樂見的方式來說,太少了,如果我們用免費的方式把它變成三億人看,后端產生的商業(yè)價值難道僅僅是十個億嗎?
可是問題就來了,如果我們僅僅把前端的商業(yè)免費了,后端的變現我們不掌握,你的片子就白虧了,所以后端變現的體系是非常重要的。我本人也看過一些電影,包括植入的廣告,包括各種形式,他們從植入廣告這一點來說,他們的商業(yè)模式還屬于比較低級的階段,現在這種方式支撐不了把片子免費,還獲得十億以上的收入。這里面有很多利益相關方在里面。不要錢,如果你想知道我的書寫什么,我希望大家了解什么,重點是了解這個東西,免費的流量和數據如何變成錢的,它涉及到很多復雜的產品技術。
第二,不要臉?,F在大多數互聯網產品的營銷方式和產品點是無底線迎合用戶的狀態(tài)。特別是在面對比較年輕用戶的時候,各個互聯網公司在產品的文案上、產品的營銷點上都是非常出格的,是跪舔用戶的狀態(tài)。
第三,不要命。在互聯網上有一種工作方式叫九九六。9點工作到9點,每周工作6天。這在很多創(chuàng)業(yè)公司和大一些的公司都是廣泛存在的。為什么互聯網的人能夠這樣瘋狂的工作?關鍵的一點是全員持股,硅谷最核心的一個發(fā)明就是告訴大家,這企業(yè)是你們都有份的,硅谷的全員持股是比所有的技術創(chuàng)新都重要。其他的技術創(chuàng)新是在這個基礎上產生的,如果我每個月拿三千工資,你看那個公司能搞出什么。他是在這個激勵下產生的。包括馬老板說的,馬老板把自己的股份給員工分了多少,他自己就剩下百分之七點幾的股份,這個事情是大家拼命在阿里加班的前提,我覺得不是價值觀。
我們重點看第一點,后向變現,或者叫商業(yè)化。
第一,商業(yè)模式探索。所有免費用戶產品在做到一定量以后都會面臨這樣一個詞:商業(yè)化。商業(yè)化是一個很大的領域,跟商業(yè)化相關的問題也很多。我這邊舉了一些例子,碰到這些問題你就要從商業(yè)化里面找答案,而不僅僅是要用用戶的角度去找問題。
第二,流量變現。
第三,數據變現,通過免費的用戶產品,積累了一些用戶行為或者其他用戶相關的數據,這些數據怎么變成錢?近些年來大家發(fā)現數據變現的能力在某種意義上還要強過流量變現的能力。數據怎么變現?大家先不要去看大數據領域講的東西,你先好好學習學習廣告,因為數據的變現、數據的交易、數據隱私保護的邊界在廣告領域得到了充分的研究和工業(yè)界實戰(zhàn)。你要不了解廣告,你一定是從頭走一遍彎路,這個彎路是非常多的。
第四,具體操作層面的東西,商業(yè)產品的建設和運營。比如說一個公司有廣告,有游戲聯運,返利購買,他們之間是不是有內在的聯系?其實他們都是泛廣告產品,他背后的商業(yè)邏輯基本是一致的。應該共用某些產品和技術平臺去實現一個公司整體的商業(yè)化戰(zhàn)略,這些大家在實際工作中才有感覺,前幾個問題都是蠻有意思。我特別希望同學們如果在你的學習之余,除了了解一些用戶產品,還能了解一些商業(yè)產品的思維、技術,對于你將來參加互聯網公司的工作很有幫助。
從大數據說起,大數據這個詞是一個咨詢公司提出來的,這個詞并不是來自于學術界。第二,也并不是來自于純粹的工業(yè)界。這個詞的立意非常好,讓大家在大的場景下了解數據的價值和作用。由于它這樣的起源,在中國現在的狀態(tài)上,它與工業(yè)界實際發(fā)生的數據運用的現狀以及學術界可落地的研究存在一定的距離,很多時候是概念到概念。所以我常常講BIG是漢語的英譯,是逼格的音譯。我認為必須要找到一個落地的點來看看大數據到底做什么。
我自己對大數據的認識,我是從工業(yè)界來的,工業(yè)界對大數據最直觀的認識是傳統的工具用不了了,微博上有一些朋友來問我,我現在學大數據是不是應該學SASS這個軟件,這讓我覺得很難回答,我覺得跟那個沒有關系,但是賣這個軟件的人肯定跟我過不去。因為我們要了解大數據研究的是什么東西,傳統的IOE的企業(yè)研究的是交易數據的加工和處理,交易數據的加工和處理是非常困難的,因為他要求正確率極高,一條都不能錯,實時性要求極高,所以IOE整個這套系統就是IBM、Oracle和EMC。你別以為現在拉一個互聯網企業(yè)出來就能做系統,他們絕對是吹牛。
可是互聯網企業(yè)處理的大數據和IOE處理的交易數據有點不一樣,我們關注的大數據是指行為數據,行為數據跟交易數據的區(qū)別,交易數據指業(yè)務實施過程中不得不計的數據,比如說存取款、利息,這些數據你不能不記,你不記你的業(yè)務沒有辦法開展,但是行為數據是可計可不計的數據,比如說網站的瀏覽日志?;ヂ摼W企業(yè)一開始也不是想到要記這些數據,因為他的服務器自然而然的給它記下來了,后來他就想能不能給廣告變現帶來一點作用,于是他就開始挖掘這些數據。交易數據如果是1,行為數據一般都在100以上。第二,它對一致性的要求是比較低的,網站的日志丟千分之一對大多數業(yè)務都沒有關系。意味著原來IOE所有架構對于處理這種行為數據是不合適的,因為它太貴,我們要用一種更便捷、更低成本的方案來處理。所以工業(yè)界我們看到的變化是我們所用到的工具完全的變掉了,去IOE化,阿里這么說他有他的技術,如果現在互聯網企業(yè)一擁而上,把銀行系統都換掉,那是災難性的??墒窃瓉鞩OE的你也不要輕易的說你們在做大數據,你們做的事情跟大數據嚴格來說也沒有關系,你們還是在做傳統交易數據的挖掘和整理。
這個圖,A曲線,我認為的大數據是什么樣的,如果數據可以采樣,就不是大數據的問題,C類的數據可以采樣,比如說我要統計360在各個省的用戶占比,顯然是我先對用戶數據采樣,采樣十萬分之一??墒悄悻F在碰到大多大數據都拿這樣的案例在糊弄大家,他們把數據大,就當成大數據。這種問題的特點是稀疏的采樣數據,結果不變,或者結果的基本不變。就不是大數據的問題。大數據應該是A種曲線。什么樣的問題是典型的大數據問題?什么樣的問題不能采樣?所謂的個性化問題,廣告是一個個性化問題,我們要對每一類用戶描述他的行為特征和個性偏好。如果我采十億人,這十億人描述完了,我采樣一百萬人,所有的事情照做,你能影響的廣告效果和空間的那部分人群就變成了一百萬人,這個系統使得你的系統收益大幅度下降。比如說個性化推薦,依然不能采樣?,F在新的業(yè)務,個人征信業(yè)務,他也知道每一個人都做描述,所有的個性化問題基本上是大數據問題。我們也可以從另外一個角度理解大數據的應用。我個人是這樣認為的,如果你的數據出來的結果是給人看的,不能成為大數據的問題,一定是要給機器看的,你要形成一個閉環(huán)的決策過程。
廣告是大數據的最典型的應用。數據應用分成兩類,一類是Insight,洞察,比如說360對每個省的人口占比,這個結果打出來的是一張表,財務報表、人口統計、百度遷徙地圖,這就叫洞察,洞察是整體上把握一些宏觀規(guī)律,宏觀的決策、運營人員和領導用的。這樣的領域不能說沒有大數據的問題,也有一些采樣以后做不了的問題存在,但是大多數問題跟大數據毫無關系。
另外一類應用叫Automation,自動化,我輸出的是個體的行為特征信息,如果我對十億人分析完了,顯然領導是不能看的,只有機器能看。在這種情況下數據的結果主要用于微觀的數據實施,面向機器和銷售人員。我個人覺得自動化的應用,大數據的成分要多很多,洞察的這類應用有很多跟大數據沒有關系。我特別不希望大家被很多宣傳帶歪了,不能弄一張報表就叫大數據,那個叫商業(yè)分析。大數據簡要說就是面向大規(guī)模的加工行為數據,并且把這個加工結果自動的反饋給機器做決策的應用。這是我的看法??隙ㄓ泻芏嗳瞬徽J同,但是沒有關系。
數據怎么變成錢的。左邊這個廣告位投放的吉列剃須刀的廣告,這個廣告位賣一萬塊錢,是流量的價值,每天來十萬人,這十萬人看到這個廣告,你就得給我一萬塊錢。吉列是主要面對男性的廣告主,只給男性用戶投吉列廣告,省出來的用戶都是女性用戶,找一個化妝品的廣告投給女性用戶,找每一個廣告主各收六千塊錢。對媒體來說,投入產出比也提高了,我收到了一萬兩千塊錢。特別要強調,多出來的兩千塊錢是什么,這兩千塊錢就是數據變現的價值。你知道了每一個人是男是女,在原來一萬塊錢基礎上可以憑空多掙兩千塊錢。僅僅知道一個性別就可以多掙兩千,你要知道更多這個人的信息和購物偏好,你顯然可以掙更多的錢,這些錢都是數據變現帶來的錢。
廣告對于數據變現和流量變現,你們在學??赡懿惶私鈴V告,但是它太重要了,我們從三個點說明它的重要性。首先整個互聯網的意義來說,整個互聯網行業(yè)的大半部分的收入是來自于廣告,大概要到七成到八成左右。當然有人說互聯網是不是沒有別的掙錢方法了才用廣告掙錢?這種說法是錯誤的。互聯網公司做的產品好用,還是微軟做的產品好用?免費產品一定做的比收費產品好用。因為在互聯網公司里,用戶產品的部門和商業(yè)產品的部門是分開的,管這個產品的老大根本不考慮掙錢的事,沒有這個KPI,沒有把他所有的精力和能力解放出來,他可以全身心的服務用戶。我的觀點是:沒有任何的收費產品現在還能做得過免費產品。你要想了解互聯網,你如果不了解后向變現,不了解廣告,你真的不可能徹底的了解廣告,谷歌、臉書90%以上來自于互聯網廣告,淘寶八成是來自于廣告,騰訊一半來自于廣告,騰訊游戲業(yè)務里面有很大一塊是游戲聯運業(yè)務,本質上仍然是CPS收費的廣告業(yè)務,算上那一塊應該有七成以上。百度沖O2O的業(yè)務,那是一個賠錢的業(yè)務,賠錢的業(yè)務把這個收入沖上去,很難說他將來怎么樣,總之現在從利潤環(huán)境來說,八成以上來自于廣告是一點問題都沒有,這是一個先進的商業(yè)模式,不是無可奈何的事。
大數據有很多應用,這兩天很火那么規(guī)模化的應用我認為目前只有這樣幾個:個性化推薦、計算廣告、個人征信。普蘭替爾(音)蠻獨特的,但是它面向公眾數據的大數據應用。但是其中形成規(guī)?;癄I收的行業(yè)只有廣告。
廣告很復雜,除了計算技術,還有經濟學、社會學、心理學,都有非常具體的應用,非常具體的公式都要用上。
規(guī)?;癄I收,在北美2013年在線廣告總收入是四百億美金,中國2013年達到了一千億人民幣,去年達到一千五百億人民幣。中國從07年到2013年在線廣告漲了10倍,從17億美金漲到180億美金。對比的電視廣告增長了一倍,全球沒有增長這么快的電視市場了。美國從07到13年基本上沒有漲,08、09年的時候跌了很多,就是因為當時的經濟危機,經濟危機對整個廣告市場的影響是巨大的。網絡廣告07年美國已經很成熟了,兩百億美金,但是它仍然增長了一倍多。報紙的數字慘不忍睹,中國的報紙可能跌下去的速度比美國還要快,我家附近的方圓一公里以內的幾個報亭都沒有了。特別是北京、上海,報紙跌的速度非???。當然也不完全是,很多紙媒的老板跟我討論,我們辦電子版是不是就能解決問題呢?我個人認為是解決不了。這個圖我希望告訴大家,在線廣告是一個發(fā)展及其迅速的市場,它的季度復合增長率都達到兩位數。并且這個增長速度現在沒有變慢,而是在變快,因為移動互聯帶來了大量的新的機會。
傳統廣告主要做Brand為Awareness,品牌廣告,是為了帶動長期的利潤率和離線的轉化率,他希望你記住這個品牌,將來選擇它的可能性變大,承擔的利潤空間也會變大。可是互聯網廣告除了能做上面這種廣告,互聯網廣告創(chuàng)造了一種嶄新的市場---效果廣告的市場。效果廣告的市場有意思就在于,為什么互聯網可以做效果?酷旁在線下發(fā)的效果是很低的,可是在線上發(fā),數字廣告可以很方便的對每個人投送不同的內容,短期有購買欲望的人一定是很少一部分人,數字化媒體特別適合做這個。你并沒有看到在互聯網廣告快速增長的過程中,電視廣告快速下降,其實沒有這個,因為以谷歌、臉書為代表的互聯網廣告面對的是中小型的效果型的廣告主,這部分的廣告主傳統電視廣告對谷歌他們是不在意的。谷歌根本不屑于搶電視廣告的生意,那些中小企業(yè)加起來比五百強的廣告費多太多了。對銷量比較在乎的情況下,長期的比如說到京東這種體量,他一定是效果和品牌要并重,只有品牌廣告能拉動他的利潤率,效果廣告拉動不了企業(yè)的利潤率。
說到計算,為什么上面這些事要用計算來解決呢?因為商業(yè)產品或者廣告特別好的一點是,我可以用一個公式來表達我有話的東西,這一點比用戶產品要簡單很多。微信火了以后有很多分析師就來討論,為什么微信比手機QQ好?但是這些討論都是馬后炮,或者并不能根據這些討論重新造一些產品出來,因為用戶是非理性的,我選擇微信或者QQ,有一些調研說95后更喜歡手機QQ,這就證明在用戶產品優(yōu)化過程中很難找到一個明確的優(yōu)化目標讓他變得更好。但是廣告不一樣,我們的優(yōu)化目標很清楚。這個大括號里面有兩項,一個是R,一個是Q,都是一個概念,沒有任何數學成分在里面,R是收入,你投一次廣告出去掙了多少錢,Q是成本,你得到這次展示的機會付了多少錢,這兩個一減就是你的利潤,你投廣告的目的就是為了優(yōu)化利潤。前面那個求和,我優(yōu)化的是一組廣告展示上的總利潤。
廣告跟個性化推薦最大的差別在,廣告比個性化推薦復雜得多。最大的差別,廣告主有預算,我今天最多投多少錢,還有一個是你今天至少要給我投多少,這使他的計算變得很復雜。R有一個詞叫做eCPM——期望千次展示收益。M是一千次可能是幾塊到幾十塊錢,一次就是幾厘,說起來很別扭。eCPM是廣告系統最想要優(yōu)化的指標,提高R,降低Q。降低Q對于大多數的廣告主來說不是一個核心任務。只有在DSP里面,Q才是可以優(yōu)化的,有一個出價策略的問題,大多數的產品主要是優(yōu)化R。廣告的過程也很簡單,但是也很重要,我們從廣告的展示頁,首先用戶如果對他發(fā)生興趣,發(fā)生一次點擊,他在鏈接頁上進行更復雜的操作,他如果想要這個東西,他會到轉化頁下單。點擊的過程是發(fā)生在媒體上的,新浪上投的廣告,點擊是發(fā)生在新浪上,轉化的過程是發(fā)生在廣告主站內,點擊和轉化兩個量發(fā)生在不同的媒體,這產生了一個有意思的分工,這一次點擊到了廣告主站內以后,他平均能夠給廣告主帶來多少錢。這兩個量的分解,決定了我們廣告的很多有意思的付費模式。
我重點跟大家講講廣告產品的發(fā)展過程,讓大家了解一下數據在廣告業(yè)務里發(fā)展的核心動力作用。在廣告行業(yè)里,我們的生產力是越來越多越精細的數據要用到廣告產品的交易過程中。由于我們要用數據,我們在不斷的變,才產生了現在非常復雜的產品形態(tài)。左上角幾個灰色的我們叫做合約廣告,合約廣告是從線下廣告直接演化而來的,線下廣告以雜志舉例,雜志每期給你開一個位置,讓你填上廣告合同,這一期開你的,你給我多少錢。線上最早的時候也是這種方式,最早做這種廣告的還是雅虎,當時最大的門戶有一個叫做美國在線,美國在線跟雅虎是不一樣的,美國在線當時是收費的,雅虎是免費的,不掙錢,雅虎就開出一個欄,當時是叫刊例價,你投在我這個位置上,投一天或者投幾個小時多少錢,簽一個合同,簽完了我們就執(zhí)行,這是最原始的方式。前面講的數據變現的模式用不了,因為你把刊例的位置給一家放在那兒,他一定不是一個高效的模式,其實這種方式叫CPT,按照時間來付費的廣告模式。它主流存在的時間并不是很長,很快進化到展示量合約的模式,展示量和約就是要用到我前面講的數據量變現的模式。我把流量分成男女兩部分分別收買。希望大家掌握一些商業(yè)產品設計和運營的思路。
我一旦把流量分成男女在賣的時候就有一個問題了,你說你這里面一半是男的,一半是女的,這可不一定,比如說你是一個汽車網站,你九成都是男性,只有一成女性,你要告訴我,你應該給我投放多少次女性的廣告。那個位置都給我,我可以雇公司來檢查。但是你現在說女性給我,我沒有辦法檢查,我只能要求你給我一個量的保證。我只能把展示量加在里面,這種叫展示量和約。在這兒產生了廣告領域第一個里程碑式的技術和產生,我把人分成產品了,可以說也是一個根本性的變化,根據人群來售賣,售賣的標志已經變成人群了,不再是位置了。位置也只是一個載體。他讓廣告的售賣方式也發(fā)生變化,廣告售賣方式要適用數據的使用,不得不發(fā)生變化。
這個變化進一步發(fā)展你會遇到問題,如果我希望用特別精細的數據來變現。我常舉的例子是母嬰人群,我們定義女性里面孩子在負一歲到正二歲之間的女性產品。他的變現價值高,因為這部分女性購物上呈現出全天侯且非理性的狀態(tài),我深有體會,因為我有兩個孩子。我多賣20%,這部分人群單價可能比正常人要高三四倍,我希望把他單拿出來賣??墒菃文贸鰜碛幸粋€小問題,這部分人的量很少,有兩重原因,第一重是確實量就不多,第二,我知道的不多。這部分人是母親,我不一定知道,我知道是母親的就那一點人,那一點人我單簽一個合同,我會發(fā)現合同執(zhí)行不了。因為那個量很小,就意味著不穩(wěn)定。對原來的售賣構成挑戰(zhàn),雅虎現在的技術都解決不了這個問題,所以他的廣告主一千到兩千就上限不了了。還有一種方式是搜索,搜索的標的物是關鍵字,有的恨不得三個月來一次展示,你賣是不賣。
這兩方面的要求需要有一種新的售賣模式,這種售賣模式就是我們真正廣告產品上一個里程碑式變化:競價廣告。把定價權交給需求方,原來的定價權是供給方的。競價的方式是這個東西你出多少錢,誰出的錢高,這個展示就給誰。數據交易將來關鍵的走勢也在于定價權向需求方轉移,我不跟你約定你拿不拿得到,你自己出價,拿到算你的。這樣把整個市場盤活了,大量的中小企業(yè)主涌入進來。
繼續(xù)發(fā)展,又發(fā)展成現在的實時競價廣告,或者是程序化交易。這個詞現在很火,它是最新的廣告售賣模式,它的本質還是希望數據進入到市場里面,是第一方數據,第一方是指廣告主。前面我們說的那么多數據,母嬰也好,都是供給方給的定義,但是會有一些定義,比如說京東,我的流失用戶這是我自己的定義,別人沒有任何能力給我定義,因為你沒有這個數據,前兩個月來過京東,現在不來了,谷歌的數據再強你也不會知道。我希望用我的數據來影響我的營銷。這種數據的價值是極高的,甚至遠遠超過第二方數據的價值。要想這種數據用起來,交易過程中,我沒有辦法預先開出來這樣一個數據的展示讓你來買?,F在大家認為比較先進的合理的模式就是程序化的模式,我實時問你,我這里有一次展示的機會,在這個展示即將發(fā)生的那一刻,我把請求送到京東的服務器,問你一下,你要不要這次廣告展示機會,你如果要,你自己定一個價格傳給我,仍然是需求方定價。除了定價以外,把這個選擇的機會也都交給需求方。這盤活了很多東西,比如說今天的數據交易,如果沒有需求方選擇模式,數據交易量沒有這么大,數據交易是程序交易規(guī)?;\轉起來以后,才成為一個選擇。
注:相關網站建設技巧閱讀請移步到建站教程頻道。
上面這個框是廣告交易,下面這個框是數據加工和交易,但是下面這個是廣告市場重要的支撐,如果你對數據感興趣,對大數據的價值和交易感興趣,廣告里面的產品你是不能忽視的。因為這里面你確實已經做過很多東西了。它遠遠先進于其他行業(yè)所做的廣告交易。
在這兒解釋一下三方數據的概念,廣告平臺是第一方,廣告主是第二方,其他的不跟廣告關系的是第三方。
廣告系統是一個典型的個性化系統,它由一個在線的投放引擎,一個分布式計算平臺,分布式計算平臺現在我們一般用的是Hadoop,對于大量的海量的數據,我要對十億的Cookie,歷史上三個月的數據做一次很淺的分析和挖掘,像這樣大規(guī)模的數據,現在Hadoop仍然是唯一的選擇,用spark也做不了,spark適合中等建模。他們兩個長期共存,各有各的優(yōu)勢。機器性能越來越好,spark的能力越來越強,數據增長的速度比機器性能增長的速度還要快。流計算我們會用到,它的功能跟分布式計算平臺是一樣的,一個處理長時,一個處理短時的。
這個系統數據都是環(huán)形流動,盡量避免單點、高在線的同時讀寫。跟線上打交道的所有環(huán)節(jié)應該沒有關系型數據庫。你可以看出一個真正的大數據系統跟傳統的商業(yè)智能和數據挖掘不一樣的,盡量避免碰數據庫,如果你線上系統發(fā)生了與數據庫的數據交換,你一定不是一個自由體,一定是不太對的。他一定是更輕量級的,吞吐量更高的、容錯量稍微高一點的系統來實現。
數據交易是很有意思的一個問題,國內最近有兩個數據交易所,一個是貴陽交易所、一個是長江交易所,我也關注了他們做的事情,我覺得很好,讓大家認識到數據的價值,并且想辦法用商業(yè)化的方式來運作數據,因為如果你不以商業(yè)化的方式來運作,這個數據很難用起來??墒俏矣挚吹剿麄冊诮灰讬C制上的設計,或者他們對交易數據的理解,跟我認為的大家的狀態(tài)有一點距離。數據交易應該是什么樣的?它關鍵的問題和障礙都在哪?不是說現在廣告市場對數據的認識就完善了,其實有很多問題還沒有解決,這些問題是什么?我把總結成三個定律,也是我的看法。我跟一些業(yè)界的人交流過。
第一定律,數據只能交易,不能共享。因為數據變成錢太容易了,你能夠設想,現在有人在忽悠,百度拿數據拿出來大家共享一下,你還不如說讓李彥宏把他帳戶里面的錢打給你一部分。但是數據共享在有些層面是發(fā)生了,發(fā)生的情況有兩種:一種是子公司和母公司之間,比如說搜狗跟騰訊是有數據共享,但是因為人家都是子公司和母公司,接近控股的狀態(tài)。另外,政府的數據可以共享,政府的數據沒有直接盈利、變現的需求,他的數據希望拿出來給大家用??墒俏胰匀挥X得如果政府的數據簡單拿出來共享也不見得是好的模式,還是要用商業(yè)化的手段做成轉移支付的辦法??傊业牡谝粋€觀點:數據是不能共享的,只有交易,交換也很難,一定是做價的交換,做價的交換本質上就是交易。
第二定律,數據交易該怎么做?我看過貴陽和長江做的交易,他們的交易有一個最大的問題,在廣告數據交易里面碰到過這個問題,并且部分的解決了。數據交易必須要實現部分的交易才會有真正的市場,我知道全國每一個人的男女,打成一個包拿出去賣,可能有人買,但是買的人會非常少。我就在華東五省投廣告,我買其他省的男女對我而言都是成本。在廣告里的數據交易比這還進了一步,不僅僅是部分交易,而且是按效果交易。你在Xchange上買了一個廣告位,我贏得了這次廣告位我才交錢,我不贏得這次廣告位我不交錢。這也是把定價權向需求方轉移的過程。我認為在將來任何一個行業(yè),如果能做到定價權向需求方轉移,這個行業(yè)就有機會做大。按照部分數據交易、并且按照效果交易,這是我們在廣告市場里摸索數據交易得到的共識。上海電信我打過一些交道,他賣了一年數據,我覺得他也賣不下去,他的意思是我這個數據很值錢,我打一個包給你,我只能用上一部分,其他的對我都沒有用。也許今年我這個系統還在開發(fā),今年數據我根本沒有用,也交了一部分錢,這個事情表面上看起來上海電信占了便宜,但是他是吃了大虧,因為他沒有真正把數據用起來,更談不上將來用競價的方式獲得更高的收益。
第三定律,怎么給數據定價?這個問題廣告商也沒有解決好,有解決的方案,但是解決的不好。有一個數據交易平臺叫BLU KIY,4億美金賣給了oracle,它的數據量很大,但是它不怎么掙錢。后來仔細討論,今年我深入的研究了這個事,我覺得數據的交易跟流量交易不一樣,它反而有點像,比如說你知道一個人是男是女,這個信息你是可以賣給很多人的,你賣給一兩個人、十個人,你會發(fā)現他不一樣,你賣給十個人以后這個數據就貶值了。這塊地,有的瓷磚下面有金子,有的瓷磚下面沒有金子。有個人有一個藏寶圖,這個藏寶圖對他來說就是數據。但是我們每個人都知道這個藏寶圖,會發(fā)生一個事情,大家都知道這塊地上有金子,大家先來搶這塊地,大家先把這個地價抬高。十個DSP都知道,我都出一個高價去買流量,數據就向流量價值發(fā)生了轉移,這是一個理論。我個人的設想,將來數據交易應該是一種限量的,流量本身是限量的,一個流量就是一個人投,不可能三個廣告疊在一起投。但是數據可以賣給很多人,賣的越多越不值錢。能不能把這個量限下來,這個人是母親,一定時間段只讓產生三次或者五次交易,這樣的話有可能解決問題,并且這有一個巨大的好處,這樣有可能讓數據交易也變成一種競價方式。這個母親的信息我只給三個人用,我給哪三個人用,你們自己來競價,最后排的比較高的三個人我給你們用。一旦數據交易能夠變成競價的方式,并且是在這么細的力度上競價,前提是我們能夠部分交易,整體交易競價也沒有意義。整體交易本身需求就很少,部分交易的基礎上如果能做競價,這個市場才能真正把它的市場打開。
數據定價和交易本身是特別有意思的問題,而且有可能激發(fā)一個巨大的市場,而且這些問題工業(yè)界都沒有解決,將來大家如果從事大數據,這是很有意思的一個點。
大數據的隱私問題,我發(fā)現沒有人明白這個事,交易所還好,他賣的協會數據并不見得很多,隱私問題運營商提一個詞:脫敏。脫敏就是我們這兒對應的第一條:PII,有些信息是你絕對不能用的,因為有一些信息你賣給他以后,他可以直接接觸到客戶,比如說電話,我直接打給你了,家庭住址、身份證號、姓名,這種信息在我們的原則里面很早就有A29的原則,不能使用。很多做數據的人理解的脫敏就是把PII去掉,我今天要告訴大家的是,PII去掉解決不了問題。有時候你看到一張表,你看到你們單位的工資表,假設會計把前面的電話、姓名都抹掉了,就剩下下面的幾欄,但是有他的歲數、部門、家庭住址,在公司這個范圍內,你對你熟的人,你看這幾欄,一看就知道是誰,這種信息單拿一欄都沒有辦法定位一個人,但是一組放在一塊,對熟人來說,他可以很清楚的定位一個用戶,這種行為叫半定位。
隱私的顧慮在于熟人之間的隱私,不在于陌生人之間,我們最在乎的并不是有人把數據庫黑了,把那個東西八毛錢一條往外賣,這件事不是我們今天最大的顧慮,最大的顧慮是對你有一些背景調查的人,在一些環(huán)境里能夠把你的信息定位出來,從而了解你更多的隱私信息,這些事情是我們真正的顧慮。脫敏是不能解決這些問題的,而且這個問題是根本無法避免的。對互聯網的用戶來說,他的行為比前面會計那張表還要麻煩,他的行為是極為稀疏的,曾經有一個例子,前兩年微博上傳的一個例子,清華的一個同學是王珞丹的粉絲,他看王珞丹的微博,仔細一條一條分析,他就分析出王珞丹住哪,幾棟樓,幾號。
有一個最生動的例子,Netflix推薦大賽,這個大賽很有名,因為它的獎金很高,它出了一個事,有人對這個比賽感興趣,在數據庫里看,特別湊巧看到一條記錄,他發(fā)現這條記錄是他的一個同事的,因為那個太清楚了,這個人看過什么電影,同時給了多少分,你都有這種經歷,你跟你們熟悉的人會經常討論什么電影好看,評價如何。我們這個屋子和清華大學很難找到兩個人看電影的記錄是一樣的。對于你熟悉的人,你一條一條記錄掃出來,你一定可以把你的朋友對應出來,要不計代價的找到某一個人的隱私的數據,對這種場景,成本不是顧慮。當然這個案例他也是正好碰到了,他把那個數據拿給他的朋友看了。這個同事還有一些影片是沒有跟他溝通過的,那些片子全部是同性戀影片。至少這個同事不希望自己看同性戀影片這個事被其他人知道,這是他的隱私范圍內的,所以他很惱火,他就把Netflix告上了法庭,結論是沒有辦法解決,大家要把它上升到比較模糊的態(tài)度去解決,這件事情并不是一定不能解決,也有數學家研究比較前沿的問題,怎么從數學的角度解決這個問題。在互聯網的稀疏的數據下面,在熟人的前提條件下,隱私在行為數據里很容易被破解。他真正的風險在哪?比如說電信把他原始的數據,上海電信就是賣裸數據賣過一年。它的風險在于,假設有一個人不計代價的一條一條看,假如我跟上海某個副市長有仇,我把他的數據一定是能夠找出來,找出來這個副市長有沒有貪腐行為,不見得發(fā)現不了。
總之,告訴大家要有這個認識,隱私真正的顧慮是熟人之間的,不是陌生人之間的。關心你的人,這種關心有可能是負面的,有可能是正面的。這種人對你的影響最大,由于他可以不計成本,并且由于互聯網的行為數據本身是極為稀疏的,基本上沒有任何兩個人一樣,所以他的風險是很大的。而這種風險在今天來看是被低估了,因為沒有出現哪個副市長因為這事被抓起來,將來他一旦出事,一定是有大事的。總之我的一個判斷,隱私現在來看是大數據頭上的一個達摩克里斯之劍。
大概告訴大家一個觀點,你要想了解數據的變現和數據的交易,了解計算廣告是一個必不可少的環(huán)節(jié),甚至說是最重要的環(huán)節(jié)。因為所有的數據使用的歷史和產品發(fā)展的歷史在廣告行業(yè)走過一條完整的彎路。你沒有必要再走一遍,后面這半段涉及到數據本身,從我的經驗來看,數據的變現和交易都是有市場基礎的,并且有它的價值所在,但是數據交易本身有很多問題,有的是在廣告市場里已經得到了驗證和解決的,有的是我們在廣告市場發(fā)現問題但沒有解決的,還有一些是隱私問題。
今天借這個機會,我希望以計算廣告作為一個引子,從這一點希望大家了解行為數據的使用、加工的過程,將來這一定也是我們大數據市場非常重要的一塊??创蠹疫€有什么問題。
精彩問答
提問:從您剛才說的整個過程來看,您是不是認為現在的廣告模式已經到了比較成熟和適合商業(yè)化的階段?您個人對將來新的廣告模式可能的突破點在什么地方?
劉鵬:我那個產品圖我有一半沒有講,現在的廣告產品比較成熟,這句話可以認為是正確的。因為它從98年到現在,計算廣告已經發(fā)展了快二十年的時間?,F在大家認為對數據已經使用過了,隱私問題我們有很多顧慮。我們忽視了一個問題,我們用數據的理論是我們希望了解這個人歷史上看過什么,對什么感興趣,但是對用戶現在的場景和情景的把握,在過去的廣告產品里是不夠的,這就涉及到我們講的原生的概念和新的廣告模式,這在移動上越來越重要。這個我今天沒有時間講,確實,原生是今后一個廣告市場從產品發(fā)展的重要模式。把數據和場景結合起來使用。就現在利用數據的廣告模式,從廣告交易到數據交易本身,我覺得是比較穩(wěn)定、比較成熟的。
提問:我有一些朋友也做過廣告實時競價的事情,聽他們的意思,做這個事情如何能夠確認數據的真實性是一個很大的問題,是使用方在定價,但是他們很多人都無法監(jiān)督廣告發(fā)放者你到底給我發(fā)了多少,到底發(fā)給誰了。這個事情有沒有進一步解決的可能性?因為您剛才說,數據能不能只賣給一部分人,如果這樣做的話,就像電影一樣人為的提高了這個價格,您最開始的邏輯,因為數據再賣一份的邊際成本是零,如果我是有流量的人,我免費去賣,這樣才能把我的流量價值抬起來,更符合您一開始說的邏輯的方式。
劉鵬:對于有流量的人來說可能就是這么想的,數據只要提高流動性,提高流量價值就可以。但是很多數據提供方并不是流量擁有方,這個市場有意思就在于,有廣告需求方、廣告供給方、數據提供方,這些人的利益出發(fā)點都是不一樣的,都是博弈的,對于數據提供方來說,不是我們前面說的概念,因為我們前面說的概念有一個基礎,我這個商品本身是能夠規(guī)?;瘋€性化傳播信息的。數據本身已經不再是能繼續(xù)傳播信息的能力。所以我覺得數據提供方,數據跟流量的性質是不一樣的,流量我可以搭別的東西,數據并不能再搭別的東西賣。前面實時競價的問題,這跟需求方定價不僅不矛盾,而且恰恰是一致的,首先,展示量的問題是可以監(jiān)測的,數展示量,數男女這種有確定標準的,人頭屬性流量,這都非常容易監(jiān)測,而且也有第三方監(jiān)測公司。其他的標簽,我說這個人是一個體育愛好者,這種標簽有一個特點,你不知道什么算體育愛好者,我去年打過一次羽毛球算不算,對于這種模糊的標簽恰恰是要用需求方定價的方式來解決,你不用管我這個東西對還是錯,你覺得他對你值多少錢,你覺得我這個東西質量差、摻水,你出低一點的價格,那個人質量好一點,我出高一點的價格。因為標準上是沒有答案的,不存在哪些人都是體育愛好者,不如說每個人根據自己的需求來,根據你認為他的價值來定價。數據也是一樣,供給方定價比流量還不靠譜。有的數據對有些人很值錢,對有些人不太值錢,如果都是供給方定價,這個市場很難發(fā)展起來。
提問:你剛才提到原生廣告和情境廣告,現在從一個實際的用戶來看,天貓的、京東的或者在手機上推送的廣告,包括網盟的廣告?zhèn)€性化具體的表現都不是令人滿意的。從你來說,做個性化的分析瓶頸在目前這個階段來看表現在哪幾個方面?上下文場景數據、情緒數據、情感數據,怎么采集、怎么分析?對模型的訓練和效果的提升哪個方面去發(fā)力提升效果比較明顯一點?
劉鵬:個性化廣告和原生廣告是兩個緯度的意思。原生,首先希望這個廣告跟內容長的差不多,搜索里的廣告最典型,搜索里的廣告和內容長的差不多,很多人分不出來廣告和內容。你在微博和FACEBOOK里看的廣告也有這種特點。還有一種是情境廣告,用戶當前在干什么,如果這一點做到原生,我們叫做意圖原生,搜索表現好在表現和搜索都是原生。過去所有的廣告媒體是不參與的,媒體只是把代碼放一個京東的代碼,他就不管了,月底結賬。淘寶的自然源處理能力去分析頁面里的上下文,從而得知用戶意圖,這件事情靠譜不靠譜呢?基本上他能分析的東西很淺,深入的東西必須要媒體的參與。媒體怎么樣重新參與到廣告交易的過程中,提供有價值的上下文信息,如果這件事情能做好,真正符合你的預期的、在你任務里的廣告就會發(fā)生。這是產品和運營體系上的問題,不見得完全是一個技術問題。搜索為什么能做到呢?因為搜索的用戶意圖就是他要搜索的東西。其他的網站里面用戶意圖也很明確,你通過自然語言處理是分析不出來的。我的看法是讓媒體重新參與到廣告的投放、決策過程中。但是目前有很多產品和運營商的障礙,不是一兩天能發(fā)生。淘寶處理能力再強,也不可能投出符合你情境的廣告,必須跟媒體想辦法從數據和運營層面上有一些接口。
提問:我對數據交易比較感興趣,您今天提的競價是很新穎的一個觀點。您能提供一些更細節(jié)的考慮分享一下嗎?
劉鵬:考慮蠻簡單的,我的出發(fā)點數據交易從BLUKIY的角度來看,是沒有體現它的價值的。數據很大,但是它不掙錢。但是流量的價值往上走,競價更激烈,所以我進一步考慮,數據的交易跟流量交易不同的特點,因為它可以不限量供應,流量天生就是限量供應。這里面存在機會。這些說法基本上是我個人的說法,不見得很成熟??墒俏艺J為,競價這個點是所有人都在往這個方向努力?,F在這個時代任何一個行業(yè)要想有爆發(fā)式成長機會,一定要變成需求方定價和競價的模式,供給方定價模式不可能爆發(fā)式成長。這是很開放的問題,你也可以提你的想法,沒有什么標準答案。
競價有很多問題,但是現在數據市場沒有真正被激發(fā)出來,因為純做數據變現掙不著什么錢。大家真正的熱情沒有被激發(fā)出來??偸且胍粋€辦法把有數據的人的熱情激發(fā)出來,讓他真正掙錢,他才能夠市場發(fā)展的快。至于你說的有很多問題,或者將來這個模式比較復雜,我倒不覺得這是障礙。商業(yè)產品的市場就是復雜,而且越來越復雜,用戶產品發(fā)展的規(guī)律是越來越簡單,給懶人用,商業(yè)產品的規(guī)律就是越來越復雜,因為他的目標很清楚,就是優(yōu)化利潤。只要利潤提升1%,我的系統多復雜一倍都沒有關系。
提問:我是來自華陽民眾的,我也是這個行業(yè)里面從業(yè)者之一。我們現在也在跟BAT談數據的設想,我感興趣的是360這一塊對數據變現和數據開放的思路是什么樣的?
劉鵬:我們公司跟BAT是有點像,或者更保守,基本上是沒有數據變現的需求。這個事情首先也變不了錢,你現在這種方式其實掙不了錢。首先BAT也不可能拿這個變現,他變現了也掙不了多少錢。公司的態(tài)度,不會說這是有一條產品線來做這個事情。
提問:阿里都是電商的數據,都是效果的數據,他自己本身的流量池也非常大,阿里媽媽的整合,整合流量的變現,包括對品牌廣告主的開放。
劉鵬:他開放有一個前提,他必須是這些廣告主的落地在淘內。
提問:至少數據變現的價值增值,數據競價的問題,如果流量被競價,數據的價值也就被競價了,至少他自己本身淘內和體系內的流量的價值也會變大。在這里面加成的效果,他變現的體量也不會小,至少他現在一家一家的品牌廣告主在談,越來越多的廣告主在天貓開體驗點,或者有自己陣地的品牌商越來越多了,這個流量消化在自己體系內,對他是價值不菲的。
劉鵬:原來阿里幾任負責DSP的人也都比較熟,因為各個部門的利益是有博弈的,未必數據部門的利益一定跟公司戰(zhàn)略是一致的,我在里面看到很多的博弈。首先阿里現在用數據的方式還談不到數據變現,更多還是用數據去提升他內部的投放。因為你在阿里投,阿里知道每一個cookie男女,你并沒有圖,跟你在百度選關鍵字是一個道理,你必須在他封閉的體系內消化掉,你不能把你男女的cookie帶出來。這跟數據交易和變現是兩回事,還是傳統的封閉體系的話題。
提問:現在在各大應用市場上有專業(yè)的廣告?zhèn)鞑テ脚_,他既可以給廣告主發(fā)布,也可以一鍵轉發(fā),用多種傳播的渠道平臺一鍵托管的方式,這樣的話對廣告主也有預算,傳播費用在平臺上是透明的。對于用戶來說,廣告主可以把用戶閱讀自己定價,方便用戶來傳播,用戶看到這個廣告,覺得他值得傳播,他就產品。
劉鵬:這種叫激勵類的廣告,積分墻之類的。這種廣告?zhèn)鞑サ男Ч蛘劭?,雖然它的傳播量很大。比如說積分墻,你玩游戲,讓你下一個,得多少分,但是你下了以后馬上就得刪了,這是一個很大的廣告市場,但是它的價格比較低,積分墻是正常廣告價格的五分之一以下,同樣的一個安裝,因為它的后期效果很大。一些大的手機廠商,蘋果對這個打擊很厲害,主要它影響榜單的排名。這類廣告總體上是在走下坡路。因為它有點違反本質的規(guī)律,你是用激勵的方法在傳播。
提問:APP上廣告主投放廣告,激勵用戶幫助他們傳播。
劉鵬:我正常買一個CPM的價格是10塊錢,投這種廣告他們只能給兩塊錢。
提問:我對廣告的監(jiān)測和追蹤很感興趣,大的廣告公司和網盟公司都有自己的監(jiān)測中心,第三方獨立的監(jiān)測和追蹤系統在這個行業(yè)里面發(fā)展的趨勢怎么樣?
劉鵬:監(jiān)測和跟蹤,看監(jiān)測什么東西,廣告是展示、點擊、轉化。點擊不需要監(jiān)測,轉化是需要檢索的,主要是移動應用下載,移動應用下載要溯源,他比較復雜,轉化的監(jiān)測也是由第三方公司提供。國際上都是按照一次點擊多少錢。FLAS、MAT等等幾個公司在做這個。展示是在人家的網站,你不知道,你要委托一個第三方來做檢測。展示付費你才需要檢測,如果你按點擊收費就不需要間。CPM付費大部分是品牌廣告,品牌廣告才有監(jiān)測的需求,大多數效果廣告沒有曝光監(jiān)測的需求。這個市場你可以計算一下,假設品牌廣告的預算一百億,會有1%的錢交給監(jiān)測廠商,這個市場就是一億,總體的市場不大。轉化監(jiān)測也不是很大,監(jiān)測本身不是一個特別大的市場。
提問:比如說You Tube一上來放廣告,然后給你一個按紐就可以關了,但是國內的廣告他就一直放,一直放五分鐘,這兩種方式哪種是對的?
劉鵬:我當然認為You Tube的方式是對的,如果他放五秒你就關了,你對他產生的效果不大,他放五分鐘對你的效果仍然不大,你可能去干別的了。國內的市場是劣幣驅逐良幣的市場。他由于對廣告主,我承諾了多少量給你,我不得不去完成,為了充這個量,插進來一些低質量的量。廣告主會進一步調低他的單價,我再參更多低質量的,變成了惡性循環(huán)。我賣一個iPhone你給我一百塊錢,我跟你說它什么都能干,你就買了,我得了一百塊錢。但是賣完了以后的售后服務不是我負責了。我個人傾向于You tube的方式,國外一般都是這種方式。
提問:注意到您說的數據交易,您提到了兩個交易所,一個是貴陽,一個是長江,現在數據交易不掙錢,而且量也比較少,現在這種交易所有盈利的能力嗎?對于交易所未來的發(fā)展方向應該是什么樣的?
劉鵬:交易所的盈利能力,關于行為數據的交易,如果按照這種交易方式,就是不work,按照貴陽的方法。如果是統計數據或者其他數據,那跟賣報告是一樣的。統計各個縣的什么情況。至于怎么發(fā)展,特別是行為數據的交易,不管是標簽還是更細的數據,一定要結合在具體的數據應用上做交易才有可能快速的發(fā)展。這個廣告市場做的很好,因為數據交易都附著在廣告上,他沒有獨立的數據交易,Xchange,你買的數據是廣告直接帶過來的,而且所有的過程都是順的,一定要附著在具體的應用上去設計交易模式。純粹的數據交易很難解決部分交易的問題,很難解決按效果交易的問題。更談不上競價的方法。
提問:第一,個性化推薦和計算廣告的區(qū)別點在哪里?第二,關系型數據庫,來做這種廣告投放平臺,根據它的計算模式應該采用什么樣的分布式計算系統?第三,這個計算平臺,針對計算廣告學這個特定的業(yè)務和狀態(tài),怎么樣來設計一個能夠支持他這種有限的條件的模式下,他的整個過程追蹤和快速計算、實時處理的平臺架構,應該在哪些點上考慮的比較多一些?
劉鵬:第一,推薦和廣告的區(qū)別,廣告的核心引擎跟推薦是差不多的,廣告最大的區(qū)別是多了一個預算和量的保證。推薦是很多很多的利益博弈,推薦是一個游戲,廣告真的是市場,市場就涉及到機制,這是推薦里面沒有的。如果僅僅是排序、檢索算法,兩者是非常相似的,但是宏觀的設計和保證下的優(yōu)化是有非常大的差別。
第二,我說的主要是線上不適合用關系型數據庫,線下還是可以用的。你有一個sever,sever在做決策的時候不適合做計算,你算的空間很小。如果再有關系型數據庫,基本上你的成本很高,而且效率一定不是最高的。關系型數據庫就是準,一致性高,一致性高對廣告來說無所謂,我有一千次展示,有一次算錯了沒有關系。
第三,這兒也說不清楚,你要有興趣可以看看我書里講的東西,基本上對框架有介紹,這個在業(yè)界來說相對成熟一點。
作者介紹:劉鵬現任360商業(yè)產品首席架構師,負責 360 商業(yè)化變現的產品和技術。曾任微軟亞洲研究院研究員、雅虎北京研究院高級科學家 ( 負責全球搜索廣告、受眾定向廣告、個性化內容等項目 ) 、 MediaV 首席科學家 ( 負責算法和數據平臺 ) 、以及搜狐集團研究院負責人,WOT 技術峰會特約講師。
聯系客服