轉(zhuǎn)眼,做策略產(chǎn)品經(jīng)理已經(jīng)有190天了。當(dāng)初想做策略產(chǎn)品經(jīng)理,一是想了解策略產(chǎn)品經(jīng)理到底和功能產(chǎn)品經(jīng)理有什么不同,二是覺得滿足個(gè)性化需求是未來的趨勢。
策略產(chǎn)品經(jīng)理屬于產(chǎn)品經(jīng)理的一個(gè)細(xì)分工種,為什么會出現(xiàn)這種細(xì)分,我理解是因?yàn)樾畔⒁约坝脩襞c信息的交互方式已經(jīng)發(fā)生了天翻地覆的變化。早期人們只能從報(bào)紙,電視,門戶等有限媒介獲取有限的信息,這個(gè)時(shí)候信息的生成門檻高,生成速度慢,用戶只能在有限的范圍內(nèi)去選擇,更多的是通過主動(dòng)表達(dá)的方式去獲取新知識(帶著明確需求去搜索)。隨著信息技術(shù)的發(fā)展,信息的生產(chǎn)成本顯著降低,人人都在生成信息,這種爆炸式增加的信息和用戶有限的注意力、有限的時(shí)間,形成了尖銳的矛盾,用戶的需求也由明確需求向更高級的模糊需求轉(zhuǎn)變。同一代人看五六遍西游記的時(shí)代已經(jīng)過去了。
除了用戶需求,另一個(gè)讓個(gè)性化推薦快速發(fā)展的原因,在于大數(shù)據(jù)、機(jī)器學(xué)習(xí)、云計(jì)算、分布式計(jì)算等技術(shù)的發(fā)展。用戶需求,大數(shù)據(jù),算法以及計(jì)算硬件共同促進(jìn)了用戶需求向個(gè)性化的方向前進(jìn)。
策略產(chǎn)品經(jīng)理需要解決的核心問題,是人與物(信息)的匹配問題。讓用戶在有限的碎片化時(shí)間里,盡可能多地看到他感興趣且盡可能有價(jià)值的內(nèi)容。個(gè)性化推薦的效果極強(qiáng)地依賴技術(shù)方案,在工作期間,經(jīng)常會困擾我的一個(gè)問題是策略產(chǎn)品經(jīng)理的價(jià)值在哪?不同于功能產(chǎn)品經(jīng)理,策略產(chǎn)品經(jīng)理寫不出幾十頁的需求文檔,不需要定義清楚每一個(gè)按鈕的邏輯,每一種交互的邊界情況,策略產(chǎn)品經(jīng)理的價(jià)值更多的體現(xiàn)在對用戶價(jià)值和用戶體驗(yàn)的判斷。例如,拿一種新的資源來說,策略產(chǎn)品經(jīng)理需要思考這類資源對于目標(biāo)用戶有什么價(jià)值,目標(biāo)用戶都會滿足哪些特征,這種資源用什么樣的形式,什么樣的比例,什么樣的方式出現(xiàn)在用戶的信息流中,哪些因素會影響用戶的最終體驗(yàn),怎樣衡量最終為用戶帶來了什么價(jià)值等等。上述這些雖然很多也受制于技術(shù)實(shí)現(xiàn)方案,但是策略產(chǎn)品經(jīng)理需要思考清楚以及把控底線。舉個(gè)極端的例子,純粹依賴機(jī)器和算法進(jìn)行個(gè)性化推薦,最終絕大多數(shù)展現(xiàn)的資源都是偏低俗敏感的低價(jià)值資源,機(jī)器更擅長的是根據(jù)用戶的行為去迎合用戶的喜好,而策略產(chǎn)品經(jīng)理需要能夠從人的角度,去權(quán)衡用戶喜好和用戶價(jià)值之間的關(guān)系。
吳軍在《智能時(shí)代》中說到,解決不確定問題最好的方法是大數(shù)據(jù)。所謂的不確定性,是指無法用因果關(guān)系來描述,根據(jù)統(tǒng)計(jì)學(xué)原理,通過足夠多的數(shù)據(jù),可以發(fā)現(xiàn)其中的相關(guān)性,來把握不確定問題的規(guī)律。這里值得一提的是,大數(shù)據(jù)背后代表的是一種思維方式的改變,即解決問題的思路由傳統(tǒng)的因果關(guān)系代表的確定性思維轉(zhuǎn)向?yàn)橐源髷?shù)據(jù)為代表的不確定性思維。工業(yè)革命代表的確定性思維開始逐漸轉(zhuǎn)變?yōu)橐源髷?shù)據(jù)為核心的不確定性思維。
為了更簡單地了解推薦算法,我們可以將一篇資源X和一個(gè)用戶Y之間的匹配程度抽象定義為相關(guān)系數(shù)P,P值越高,代表這個(gè)用戶對這篇資源的點(diǎn)擊欲望越強(qiáng),P=1代表這個(gè)用戶一定會點(diǎn)這篇文章,P=0代表這個(gè)用戶一定不會點(diǎn)這篇文章。推薦算法的本質(zhì)就是計(jì)算這個(gè)P值,然后將P值最高的那篇內(nèi)容推薦給用戶。推薦效果好壞的關(guān)鍵取決于P值計(jì)算的準(zhǔn)確性。根據(jù)香農(nóng)信息熵理論,數(shù)據(jù)之間的相關(guān)性,可以消除噪音,降低信息熵,從而降低不確定性。
顧名思義,按照資源的熱度,對資源進(jìn)行排序。認(rèn)為熱度高的資源,P值越高,用戶點(diǎn)擊的可能性就越大。實(shí)質(zhì)是利用資源的熱度來消除資源和用戶匹配的不確定性,熱度為500的資源相對于熱度100的資源而言,用戶點(diǎn)擊前者的可能性(概率)更高。這種算法的優(yōu)點(diǎn)是,啟動(dòng)成本低,只要定義清楚了熱度的計(jì)算方法,每篇資源都可以計(jì)算出熱度值,可以作為冷啟動(dòng)方式,為個(gè)性化推薦策略積累數(shù)據(jù)。自然,這種簡單粗暴的方式也會有很多明顯的缺點(diǎn):
實(shí)際需求中,每個(gè)人對熱度的定義是不一樣。例如:我愛看NBA,那同樣是熱度500的NBA和美妝的兩篇文章,很明顯NBA的文章對我來說更熱,我點(diǎn)擊的可能性更大。所以在熱度算法中,需要考慮一些對用戶有價(jià)值的因素,以提高P值的準(zhǔn)確性。例如,有沒有一個(gè)初始熱度值,初始熱度值有沒有類別差異?需要找出有價(jià)值的信息維度,提高P值的準(zhǔn)確度。判斷這些信息是否有價(jià)值,可以看這個(gè)場景是否對于絕大多數(shù)的用戶都是成立的。
熱度算法無法根據(jù)用戶的興趣點(diǎn)和行為實(shí)現(xiàn)細(xì)粒度的個(gè)性化推薦。
新入庫的資源由于沒有歷史數(shù)據(jù)的累積,很難被展現(xiàn),需要對新資源制定一些保護(hù)策略。尤其對一些強(qiáng)時(shí)效的重大事件,可以維系一個(gè)熱詞詞典進(jìn)行提權(quán),如有必要,甚至可以結(jié)合人工干預(yù),進(jìn)行強(qiáng)制展現(xiàn),以保證快速的時(shí)效性要求,例如”九寨溝地震事件”。
熱度高的資源會排在前面,得到更多的展現(xiàn),反過來會進(jìn)一步提高資源的熱度,為了避免這種滾雪球式的馬太效應(yīng),提高資源時(shí)效性的感知,需要對熱度進(jìn)行合理的衰減,衰減趨勢應(yīng)該是越來越快,也就是說用戶此時(shí)此刻的行為價(jià)值最大,一篇資源今天被點(diǎn)擊了100次的熱度價(jià)值高于昨天被點(diǎn)擊100次,明顯高于前天被點(diǎn)擊的100次。
協(xié)同的百科解釋是協(xié)調(diào)兩個(gè)或者兩個(gè)以上的不同資源或者個(gè)體,協(xié)同一致地完成某一目標(biāo)的過程或能力。我理解協(xié)同就是相關(guān)熵的概念,利用兩個(gè)及以上資源(用戶)之間的相關(guān)性來進(jìn)行推薦,降低不確定性,提高P值的準(zhǔn)確性。目前,常見的協(xié)同過濾有三種,基于內(nèi)容的協(xié)同過濾,基于用戶的協(xié)調(diào)過濾和基于模型的協(xié)同過濾。
基于內(nèi)容的協(xié)同過濾,就是計(jì)算內(nèi)容之間的相似度,將和用戶以往喜歡資源相似的資源推薦給該用戶,例如下圖用戶A喜歡資源A、B、C,系統(tǒng)發(fā)現(xiàn)資源A和資源D非常相似,就會嘗試把資源D推薦給用戶A。這是利用兩個(gè)資源的相似度來降低資源與用戶匹配的不確定性程度。
圖1 基于內(nèi)容的協(xié)同過濾
基于用戶的協(xié)同過濾,就是計(jì)算用戶之間的相似度,將與你相似用戶所喜歡的內(nèi)容推薦給你。例如下圖,系統(tǒng)發(fā)現(xiàn)用戶A和用戶B是相似用戶,就可以將用戶A喜歡的資源C推薦給用戶B。這是利用相似用戶的愛好相似來降低資源與用戶匹配的不確定性程度。
圖2 基于用戶的協(xié)同過濾
基于模型的協(xié)同過濾就是基于已有的用戶與資源之間喜好關(guān)系的樣本,訓(xùn)練模型,通過該模型計(jì)算P值,進(jìn)行推薦。訓(xùn)練樣本越多,有效特征越多(輸入的有效信息維度),訓(xùn)練的模型越準(zhǔn)確,也就是P值的準(zhǔn)確度越高。
基于協(xié)同過濾的推薦效果依賴于數(shù)據(jù)樣本的大小,數(shù)據(jù)維度的多少,以及數(shù)據(jù)的完備性。一般而言,這些技術(shù)方案的實(shí)現(xiàn)不需要策略產(chǎn)品經(jīng)理的參與,但如果可以,其實(shí)從數(shù)據(jù)維度來看,策略產(chǎn)品經(jīng)理可以從用戶需求和場景化的角度,去考慮哪些維度對于用戶是有價(jià)值的,在什么場景下有價(jià)值,價(jià)值有多大。
基于內(nèi)容的個(gè)性化推薦,本質(zhì)上是計(jì)算單篇資源與用戶的之間的相關(guān)性。對于用戶而言,會建立一個(gè)用戶模型,可以簡單抽象為一個(gè)用戶向量,這個(gè)向量種記錄了用戶的各種個(gè)性化的興趣點(diǎn)及其權(quán)重,對于資源而言,會建立一個(gè)內(nèi)容模型,可以簡單抽象為一個(gè)內(nèi)容向量,這個(gè)向量中記錄了跟單篇內(nèi)容相關(guān)的各種關(guān)鍵詞和權(quán)重。通過計(jì)算用戶向量和資源向量的相關(guān)性,求得單篇資源和用戶之間的相關(guān)系數(shù)P。
這些是我對策略產(chǎn)品經(jīng)理以及推薦算法的一些非常簡單和粗糙的想法,其實(shí)不管是策略還是功能產(chǎn)品經(jīng)理,解決問題的思路都是一樣的,都是從用戶的需求出發(fā),分析用戶需求,建立目標(biāo),拆解目標(biāo),推進(jìn)項(xiàng)目,數(shù)據(jù)驗(yàn)證,再進(jìn)行不斷地迭代優(yōu)化。
聯(lián)系客服