提升用戶體驗的搜索與推薦
最近幾年來,相對于線下賣場的萎靡不振,電子商務市場卻每年都在以近乎翻倍的速度增長。這不是,“雙11”引發(fā)的高燒尚未消退,許多消費者就開始摩拳擦掌地翹首期盼“雙誕”,完全是停不下來的節(jié)奏。
而在電商平臺的購物過程中,搜索和推薦可以說占據了至關重要的地位,并且涵蓋了PC端、APP端、微信、手機QQ、定向營銷、廣告等各種渠道、各個平臺。由于普通消費者對自己想購買的商品不可能個個都達到專家水準,所以在搜索與推薦上普遍都有較重的依賴習慣。在實際使用過程中,相信許多用戶也有著切身感受:根據用戶的消費習慣和產品偏好,電商的搜索推薦頁面也正凸顯出愈發(fā)強烈的個性化特點,稱其“千人千面”并不為過。
由此可見,做好搜索推薦,不但可以幫助店家增長營收,而且還能夠提升用戶的購物體驗,從而進一步增加平臺對用戶的黏性。而作為國內首屈一指的自營式電商平臺,京東在電商搜索與推薦領域的探索與實踐,無疑具有極高的參考與借鑒價值。
京東電商推薦系統(tǒng)與算法優(yōu)化
京東搜索推薦部總監(jiān)劉思喆透露,在數據規(guī)模方面,京東在自營式業(yè)務方面已經做到了國內第一,包括第三方業(yè)務目前也在迅猛增長當中,因此從數量上來看非常龐大。而京東在電商領域的推薦系統(tǒng)主要有四大主旨,每一款推薦產品,甚至每一個環(huán)節(jié)上的推薦產品其實都和這四個主旨當中的一個或多個密切相關:
1、挖掘用戶潛在的一個購買需求;
2、盡可能縮短用戶到商品的距離;
3、用戶需求不明確的時候,能提供比較好的參考;
4、滿足用戶的好奇心和比價需求。
電商推薦系統(tǒng)的這四大主旨,在網購的每一個環(huán)節(jié),包括單品頁、商品詳情頁、推薦搭配、交叉銷售等等多種場景,所承擔的作用都是不一樣的。針對用戶的個性化行為,京東也會將其行為數據接入系統(tǒng)來對用戶進行長期的畫像以及實時的畫像。
劉思喆表示,在算法優(yōu)化方面,京東同樣也有四個方向:
1、對業(yè)務要有非常好的理解,通過大量數據分析對數據的質量及覆蓋度進行考量,這在算法的優(yōu)化提升上大概占到25%的權重;
2、測試大量的召回結果,測試不同算法在不同數據源上的效果,提高召回模型的質量,這一項在算法優(yōu)化上大約占50%的權重;
3、要實時拿到用戶反饋,然后使用不同類型不同維度的數據源對結果重新排序,這在算法優(yōu)化上大約占15%;
4、盡量把推薦系統(tǒng)由離線往在線推,加快系統(tǒng)數據響應用戶需求的更新頻率,這對算法優(yōu)化也會有幫助。
用戶畫像是如何“畫”出來的
京東個性化與排序平臺部高級總監(jiān)鄒宇表示,目前大數據領域非常熱門,很多公司都在做相關的業(yè)務,其中很大一部分在做所謂的用戶畫像。而京東集團也有類似的項目叫做“京東大腦”,并且是公司戰(zhàn)略級別。從電商廣告的角度來看,實時用戶的興趣非常重要。也就是說用戶可能基于比較突發(fā)的興趣在幾分鐘前有一個搜索行為,然后搜索系統(tǒng)會對這一實時的用戶興趣給出相應的商品或者廣告推薦。另外針對長期的用戶興趣,因為相對比較穩(wěn)定所以作用也更大,這就可以離線分析一位用戶所有的數據,判斷該用戶對哪一類商品或者哪一類關鍵詞比較感興趣,然后去構建其長期的用戶興趣,這對于匹配和個性化推薦非常重要。
如果現在來了一位新用戶,搜索系統(tǒng)里完全沒有他的行為部分,沒有他的相關數據,那么應該怎么做?這就是推薦里最難的問題,也就是所謂的“冷啟動”。事實上關于這個問題并沒有什么特別完美的解決辦法,只能提供一些參考思路,譬如說“物以類聚,人以群分”,也就是先把用戶依照其社會屬性進行歸類、分群,因為不論是學生,還是白領,又或是碼農,基于相同社會屬性的人群通常消費興趣也比較接近。另外基于微博、微信等社交網絡的朋友連接關系,也可以給出一種比較討巧的推薦類別。如果連這些信息都沒有的話,那就只能根據性別、年齡、地域等信息進行分群,只是這種分法力度比較粗獷,效果并不會太好。在最極端的情況下,對于一個完全沒有任何信息資料的新用戶,系統(tǒng)也可以做一些多樣化的嘗試,將每一類都挑一些當前最流行的拼在一起展示給新用戶,這其實是一個試探的過程,根據用戶的交互反饋再來分析用戶的興趣所在。
鄒宇表示,在互聯網公司做數據有一大好處,就是數據采集非常容易。而如果在學校里做算法或者模型,能夠采集幾千個樣本就已經很了不得了?;ヂ摼W公司比較討巧的是,前端有真實用戶流量驅動,后端有服務和認知系統(tǒng),其日志也就是所謂的數據非常有價值,前端的用戶交互返回后有日志收集并上傳至存儲,有了較大規(guī)模的數據存儲之后,算法科學家或者說數據科學家就可以根據收集的數據做分析或者建模,生成推薦結果的數據然后推送到線上系統(tǒng)。當線上系統(tǒng)加載完這些數據之后,就可以針對用戶在頁面上的交互行為和請求提供搜索和推薦服務了。
為用戶提供更好的服務
作為京東的老用戶同時也是第一批鉆石級會員,我在很長的一段時間里其實幾乎用不到京東的搜索功能,因為在主頁的導航頁就能進入自己想要的產品類別挑選商品。然而后期隨著商品類別的不斷增加,特別是京東加入第三方平臺之后,情況又發(fā)生了怎樣的變化呢?
對此鄒宇表示,京東的搜索功能很早以前就有了,但因為那時候商品庫并不是很多,許多用戶上京東網站也習慣先點左側的類目導航頁。那時候導航頁的貢獻比較大。但是隨著商品庫越來越龐大,特別是第三方平臺開放之后,服裝、圖書等類別的品類也非常多,商品數量增長越來越快,用戶找東西也越來越不容易,對搜索的倚重也會越來越大,像目前用戶通過搜索查找商品的比例已經攀升到了80%~90%。這對京東搜索來講,既是一件好事情,也是一項挑戰(zhàn),因為要對一個商品數量達到千萬甚至億級規(guī)模的數據庫進行檢索,而且還需要在短短的幾百毫秒內為用戶返回搜索結果,這已經遠遠超出了之前的規(guī)模和難度。為此京東搜索一直在不斷地對后端技術進行更新和迭代(目前每周大約能有數十個),并根據大數據技術演化為對用戶的個性化推薦,其核心目標就是不斷提升用戶體驗。
劉思喆也補充說,其實除了京東在大數據領域的探索之外,任何一家企業(yè)或者說任何一個社會環(huán)境下,我們都應該關注數據的內涵以及數據的外延。其中數據的內涵是指我們存儲和掌握了這些數據之后,如何去描繪現在商業(yè)架構下所有的問題;而數據的外延則是在擁有這些數據之后,怎樣去推斷接下來新用戶和老用戶在未來即將發(fā)生的行為。這也是京東搜索推薦部所承擔的任務——通過推斷大家將要做什么,來為他們提供更好更貼心的服務。
聯系客服