在大數(shù)據(jù)時(shí)代,企業(yè)首先要做的是收集大量數(shù)據(jù),但收集數(shù)據(jù)并非僅是把收集過來的數(shù)據(jù)放到數(shù)據(jù)存儲平臺里面那么簡單,更重要的是對數(shù)據(jù)進(jìn)行分類、加工及管理。不然數(shù)據(jù)存儲平臺就如同一個(gè)雜亂的儲藏室——放東西進(jìn)去的時(shí)候很輕松,等到要找出來用的時(shí)候就會(huì)浪費(fèi)大量的時(shí)間,甚至可能再也找不到。如今,數(shù)據(jù)在企業(yè)中已經(jīng)充當(dāng)了資產(chǎn)的角色,而既然是資產(chǎn)就要被估值。
從數(shù)據(jù)角度來說,估值就是通過不同的維度去計(jì)量數(shù)據(jù)的價(jià)值。只有基于對數(shù)據(jù)的分類和對數(shù)據(jù)價(jià)值的不同認(rèn)識,才能去對數(shù)據(jù)進(jìn)行篩選。如果連有多少種數(shù)據(jù)都不知道的話,那么很難描述數(shù)據(jù)被收集后到底如何進(jìn)行篩選,也不知道哪一個(gè)數(shù)據(jù)更有價(jià)值,更不知道哪一個(gè)數(shù)據(jù)需要更安全的處理,甚至不知道在它的生命周期中做備份的策略是什么。
對于數(shù)據(jù)的認(rèn)知,完全取決于企業(yè)是否擁有認(rèn)知自己所擁有數(shù)據(jù)的能力,是否能夠篩選出到底什么是企業(yè)的核心數(shù)據(jù),到底什么數(shù)據(jù)會(huì)被頻繁地使用。
一、數(shù)據(jù)分類為什么如此重要
數(shù)據(jù)作為一種資產(chǎn),不同的數(shù)據(jù)作用必然不同,自然就會(huì)產(chǎn)生不同的價(jià)值。而且,就同一組數(shù)據(jù)而言,在不同的環(huán)境下甚至價(jià)值也不同。
在大數(shù)據(jù)時(shí)代,每做一件事情都要知道確切的目的是什么。從企業(yè)自身的角度考慮,當(dāng)給數(shù)據(jù)分類之后,真的就能更容易理解大數(shù)據(jù)嗎?
“數(shù)據(jù)”本來就是一個(gè)既清晰又模糊的概念。之所以說“清晰”,是因?yàn)槊總€(gè)人對數(shù)據(jù)都有概念,而且每個(gè)人每天都會(huì)接觸到各種各樣的數(shù)據(jù);而說“模糊”,則是指數(shù)據(jù)本身包含了各種不同的類型,能夠產(chǎn)生完全不一樣的價(jià)值。
至于數(shù)據(jù)到底應(yīng)該怎么進(jìn)行分類,則需要視不同的場景而定。就好比“人類”一樣,如果拿人類和動(dòng)植物來做比較,人類整體必然有不同于其他物種的特性,這時(shí),“人類”就是一個(gè)非?!扒逦钡母拍?。但是,如果要對“人類”進(jìn)行更深層次的分析,顯然需要對不同類型的“人”進(jìn)行比較和分析。在很多場合下,可能還要對不同種族和不同年齡層進(jìn)行分類和分析。
數(shù)據(jù)作為一種資產(chǎn),不同的數(shù)據(jù)含金量必然不同,自然就會(huì)產(chǎn)生不同的價(jià)值。而且,就同一組數(shù)據(jù)而言,在不同的環(huán)境下甚至?xí)尸F(xiàn)出不同的價(jià)值。就好比衡量黃金和鐵這兩種金屬的經(jīng)濟(jì)價(jià)值,同樣重量的黃金其價(jià)值必然遠(yuǎn)勝于鐵;但是如果用來做刀劍,那柔軟的黃金顯然就不是合適的材料;而黃金和鐵的合金可能又能夠在另一個(gè)場合有一定的應(yīng)用。
對于數(shù)據(jù)而言,不同的場景也會(huì)產(chǎn)生不同的價(jià)值,有些數(shù)據(jù)可能會(huì)變成一個(gè)運(yùn)營指標(biāo),能夠讓管理者更好地對業(yè)務(wù)進(jìn)行決策;有些數(shù)據(jù)可以對未來進(jìn)行很好的預(yù)測,而不同的數(shù)據(jù)進(jìn)行有機(jī)結(jié)合之后又能夠?qū)τ脩糇龀龈玫纳唐吠扑]。
一個(gè)好的工匠必然對各種材料的性質(zhì)及使用方法了如指掌,而一個(gè)好的數(shù)據(jù)從業(yè)者則必須要對各個(gè)數(shù)據(jù)的價(jià)值和穩(wěn)定性洞若觀火。
遺憾的是,并不是每個(gè)數(shù)據(jù)從業(yè)者都能夠很好地對數(shù)據(jù)進(jìn)行分類和估值。很多時(shí)候,可能只看到了數(shù)據(jù)的一些應(yīng)用場景,卻不能夠更加深入地進(jìn)行數(shù)據(jù)的管理和應(yīng)用。
當(dāng)企業(yè)將焦點(diǎn)放在一組數(shù)據(jù)“能產(chǎn)生什么價(jià)值”上時(shí),往往會(huì)忽略其生產(chǎn)過程,因?yàn)楹芏鄶?shù)據(jù)是經(jīng)歷了加工才產(chǎn)生這個(gè)價(jià)值的,而往往其中整個(gè)加工鏈條的中間數(shù)據(jù)并未被區(qū)分出來。就好像我們在吃一盤西紅柿炒雞蛋,“好吃”是結(jié)果,但如果你問西紅柿給“好吃”貢獻(xiàn)了什么,雞蛋又貢獻(xiàn)了什么,你可能就回答不出來了。
古語有云:“治大國若烹小鮮?!逼鋵?shí)做數(shù)據(jù)也要有這樣的感覺,尤其是在大數(shù)據(jù)時(shí)代,更是要做到精細(xì)化。
在運(yùn)用數(shù)據(jù)上,這樣一個(gè)精密的過程就更加必不可少了。比如說,這次可能運(yùn)用了一個(gè)模型,效果不錯(cuò),這次用的這組數(shù)據(jù)效果也不錯(cuò),那下次是不是還能保證有類似的效果呢?或者說,場景變換了還能保證類似的效果嗎?這些都是需要去認(rèn)真思考的問題。
二、數(shù)據(jù)的四大分類
在觀察與分析數(shù)據(jù)中,要從中間抽象出來,更好地將數(shù)據(jù)進(jìn)行歸類和整理,從而更加清晰地識別出數(shù)據(jù)的價(jià)值。
在企業(yè)里,多數(shù)人把關(guān)注的焦點(diǎn)放在結(jié)果上,忽略了過程,而事實(shí)上這些過程其實(shí)也蘊(yùn)含了數(shù)據(jù)管理的過程和數(shù)據(jù)分類的過程。有些關(guān)鍵數(shù)據(jù)必須做好保護(hù),若這幾個(gè)數(shù)據(jù)變了,或者被污染了,前面的價(jià)值也就無法保證了。有人肯定會(huì)問,管理數(shù)據(jù)是一個(gè)過程,能不能分解?能不能區(qū)分哪些元素是比較重要的?哪些是有替代品的?哪些是無可取代的?哪些是不可或缺的核心?其實(shí),這些問題就包含數(shù)據(jù)戰(zhàn)略。所以,企業(yè)數(shù)據(jù)管理中不能含糊地應(yīng)對,要從大量的數(shù)據(jù)中抽象出來,更好地將數(shù)據(jù)進(jìn)行歸類和整理,從而更加清晰地識別出數(shù)據(jù)的價(jià)值。我們可以從以下四個(gè)維度將數(shù)據(jù)分類。
維度1:以是否可以再生為標(biāo)準(zhǔn)
按照是否可以再生的標(biāo)準(zhǔn)來看,數(shù)據(jù)可以分為不可再生數(shù)據(jù)和可再生數(shù)據(jù)。
不可再生數(shù)據(jù)通常就是最原始的數(shù)據(jù),比如用戶在訪問網(wǎng)站時(shí),瀏覽記錄會(huì)追蹤用戶的行為,如果當(dāng)時(shí)沒有被記錄下來,就沒有其他數(shù)據(jù)來還原用戶的行為了。這個(gè)有點(diǎn)像拿著相機(jī)拍閃電,抓拍很重要,一旦錯(cuò)過,閃電就不可能再重復(fù)剛才那一瞬間的光影了。因此,對于用戶日志類等不可再生數(shù)據(jù)而言,必須要有很完善的保護(hù)措施和嚴(yán)格的權(quán)限設(shè)置。現(xiàn)在,很多系統(tǒng)都有備份多份數(shù)據(jù)的功能,理想情況應(yīng)該是,因?yàn)榇疟P損壞而造成數(shù)據(jù)丟失的案例應(yīng)該越來越少。但是,因?yàn)橄到y(tǒng)升級失敗和誤操作等失誤造成的數(shù)據(jù)丟失在各家公司都屢見不鮮,。
可再生數(shù)據(jù)就是通過其他數(shù)據(jù)可以生成的數(shù)據(jù),原則上,指標(biāo)類數(shù)據(jù)的衍生數(shù)據(jù)都是可再生的——只要原始的不可再生數(shù)據(jù)還在,就可以通過重新運(yùn)算來獲得。不過千萬不能因?yàn)椤翱稍偕边@個(gè)詞語的存在,就對可再生數(shù)據(jù)掉以輕心。有些可再生數(shù)據(jù)是通過很長時(shí)間的積累不斷加工而成的,是長時(shí)間從海量數(shù)據(jù)中計(jì)算出來的,比如對某個(gè)用戶在數(shù)個(gè)月內(nèi)的連續(xù)購買行為產(chǎn)生的規(guī)律,如果未做保護(hù),雖然仍然可再生,但是再生的時(shí)間卻會(huì)給企業(yè)帶來問題。因?yàn)榧幢銓τ谟许敿庥?jì)算能力的公司來講,都可能是數(shù)日,甚至是數(shù)周、數(shù)月,而這個(gè)時(shí)間過程可能就會(huì)對公司的某一項(xiàng)核心業(yè)務(wù)造成毀滅性的打擊。
對不可再生數(shù)據(jù)而言,已有的數(shù)據(jù)要嚴(yán)格保護(hù),想要但是還沒有的數(shù)據(jù)就要及早收集。舉個(gè)例子,很多電子商務(wù)網(wǎng)站是不關(guān)注客戶在商品詳情頁面有沒有做滾屏操作的。如果這一類型的數(shù)據(jù)沒有被記錄下來,企業(yè)就無從知道詳情頁的有效性。當(dāng)商品頁面進(jìn)行改版,需要對此類數(shù)據(jù)進(jìn)行參考時(shí),就沒有辦法來獲得相應(yīng)的數(shù)據(jù)支持,最后能做的就只能是等待在頁面上進(jìn)行布點(diǎn)開發(fā),等待數(shù)據(jù)收集到之后再進(jìn)行決策,這就造成了決策的延誤。對可再生數(shù)據(jù)而言,要及早做好業(yè)務(wù)的預(yù)判和數(shù)據(jù)處理的規(guī)劃,這樣一來,數(shù)據(jù)在需要的時(shí)候就能夠快速地獲得應(yīng)用,我們把這一數(shù)據(jù)叫作數(shù)據(jù)中間層。
維度2:以數(shù)據(jù)所處的存儲層次為標(biāo)準(zhǔn)
按照數(shù)據(jù)所處的存儲層次來看,數(shù)據(jù)可以分為基礎(chǔ)層、中間層和應(yīng)用層。基礎(chǔ)層通常與原始數(shù)據(jù)基本一致,也就是僅僅存儲最基本的數(shù)據(jù),不做匯總,以盡量避免失真,從而用作其他數(shù)據(jù)研究的基礎(chǔ);中間層是基于基礎(chǔ)層加工的數(shù)據(jù),通常也被認(rèn)為是數(shù)據(jù)倉庫層,這些數(shù)據(jù)會(huì)根據(jù)不同的業(yè)務(wù)需求,按照不同的主體來進(jìn)行存放;應(yīng)用層則是針對具體數(shù)據(jù)問題的應(yīng)用,比如作為解決具體問題的數(shù)據(jù)分析和數(shù)據(jù)挖掘的應(yīng)用層的數(shù)據(jù)。
在存儲層這個(gè)層面上,最大的問題就是數(shù)據(jù)的冗余和管理的混亂。尤其是對于一些擁有海量數(shù)據(jù)的集團(tuán)企業(yè)而言,數(shù)據(jù)的冗余問題尤為嚴(yán)重,由此造成了大量的浪費(fèi)。在大型集團(tuán)中,進(jìn)行數(shù)據(jù)分析、開發(fā)、挖掘的人可能有數(shù)十甚至是數(shù)百人,這些人可能歸屬于不同的業(yè)務(wù)團(tuán)隊(duì),為了滿足不同的業(yè)務(wù)各自分析數(shù)據(jù)應(yīng)用。這樣一來,不同的人可能都從頭開始建立起了一套包含基礎(chǔ)層、中間層和應(yīng)用層的數(shù)據(jù),而彼此之間又沒有協(xié)同的交流方式,也就造成了工作的浪費(fèi)。那是不是應(yīng)該把所有的數(shù)據(jù)進(jìn)行更好的歸納或者管理呢?這也不是絕對的。任何管理方法,無論是集中式管理,還是分散式管理,都各有利弊,而且人和業(yè)務(wù)多了之后,企業(yè)也很難進(jìn)行集中式管理。
企業(yè)需要注意的是,基礎(chǔ)層必須統(tǒng)一,因?yàn)檫@是最基本的數(shù)據(jù),而且基本數(shù)據(jù)是原始數(shù)據(jù)。除了備份的需求外沒有必要在各個(gè)場合保留多份數(shù)據(jù)。只要保證這個(gè)數(shù)據(jù)有良好的元數(shù)據(jù)管理方式,就能極大地降低成本。而對于中間層和應(yīng)用層而言,則要視具體情況而定。如果公司的業(yè)務(wù)相對單一且成本壓力比較大,則建議集中式管理;如果公司的業(yè)務(wù)量非常大,則可以由多個(gè)數(shù)據(jù)團(tuán)隊(duì)來進(jìn)行分散式管理和應(yīng)用,以保證基礎(chǔ)層單位有最高的靈活性。
維度3:以數(shù)據(jù)業(yè)務(wù)歸屬為標(biāo)準(zhǔn)
按照數(shù)據(jù)業(yè)務(wù)歸屬來看,數(shù)據(jù)可以分為不同的數(shù)據(jù)主體。按照業(yè)務(wù)歸屬分類的意思就是,將數(shù)據(jù)按照不同的業(yè)務(wù)主體分門別類地進(jìn)行歸納。就好像倉庫一樣,將不同的物料進(jìn)行分類存放,可以提高其使用和管理的效率。按照業(yè)務(wù)歸屬分類的數(shù)據(jù)在不同公司體現(xiàn)出不同的內(nèi)容,在平臺型電商可以分為交易類數(shù)據(jù)、會(huì)員類數(shù)據(jù)、日志類數(shù)據(jù)等。交易類數(shù)據(jù)是指平臺型電商的訂單流水,其中包含了買家、賣家在什么時(shí)間成交了什么商品;會(huì)員類數(shù)據(jù)記錄了買家、賣家的身份信息,比如注冊時(shí)間、身份證號碼、信用等級等信息;日志類數(shù)據(jù)則更多的是指用戶的行為,即哪個(gè)用戶在什么時(shí)間段訪問了平臺的什么頁面、點(diǎn)擊了什么按鈕等。
對于數(shù)據(jù)的分類主體,則要根據(jù)業(yè)務(wù)特點(diǎn)進(jìn)行歸類,總體的原則就是讓數(shù)據(jù)的存儲空間更少,分析及挖掘的過程更簡單、快捷。
維度4:以是否為隱私為標(biāo)準(zhǔn)
按照是否為隱私來區(qū)分,數(shù)據(jù)可以分為隱私數(shù)據(jù)和非隱私數(shù)據(jù)。
隱私數(shù)據(jù)就是需要有嚴(yán)格的保密措施來保護(hù)的數(shù)據(jù),否則會(huì)對用戶的隱私造成威脅。用戶的交易記錄屬于隱私類數(shù)據(jù),對于一家有著良好數(shù)據(jù)管理機(jī)制的公司而言,通常的管理方法是對數(shù)據(jù)的隱私級別進(jìn)行分層,數(shù)據(jù)從安全的角度可以進(jìn)行兩種類型、四個(gè)層次的數(shù)據(jù)分層。兩種類型就是企業(yè)級別和用戶級別。企業(yè)級別的數(shù)據(jù),包括交易額、利潤、成交額等;個(gè)人級別的數(shù)據(jù)包括身份證號碼、密碼、用戶名、手機(jī)號等。四個(gè)層次是對數(shù)據(jù)進(jìn)行分類,分別有公開數(shù)據(jù)、內(nèi)部數(shù)據(jù)、 保密數(shù)據(jù)、機(jī)密數(shù)據(jù)。
隨著擁有大量數(shù)據(jù)的企業(yè)越來越多,數(shù)據(jù)安全就越來越成為核心問題——需要投入專門的人和專門的團(tuán)隊(duì)來進(jìn)行數(shù)據(jù)安全的管理。而數(shù)據(jù)安全工作的推動(dòng),初期往往會(huì)受到一線員工的反對,因?yàn)槿魏我粋€(gè)安全系統(tǒng)都意味著已有的權(quán)限被收回,也會(huì)因?yàn)楦淖児ぷ鞣椒ǘ档托省K?,擁有大?shù)據(jù)的企業(yè)高管必須要關(guān)注數(shù)據(jù)安全,避免給用戶和公司造成重大損失。
三、數(shù)據(jù)的五大價(jià)值
能夠辨別關(guān)系、身份的數(shù)據(jù)是最重要的。這些數(shù)據(jù)應(yīng)該是有多少存多少,永遠(yuǎn)不要放棄。在大數(shù)據(jù)時(shí)代,越能夠還原客戶真實(shí)身份和真實(shí)行為的數(shù)據(jù),就越能夠讓企業(yè)在大數(shù)據(jù)競爭中保持戰(zhàn)略優(yōu)勢。
如果說數(shù)據(jù)分類的目的是為了對其有更好的認(rèn)知和管理的話,那么,對不同數(shù)據(jù)價(jià)值的認(rèn)知就是讓數(shù)據(jù)更好地被應(yīng)用的前提。對于數(shù)據(jù)來說,如果僅是將數(shù)據(jù)收集起來不進(jìn)行運(yùn)用,那除了占用存儲空間、加大存儲成本之外沒有任何價(jià)值。在實(shí)際運(yùn)用中,需要認(rèn)清數(shù)據(jù)到底能夠產(chǎn)生什么價(jià)值:有時(shí)候,同一組數(shù)據(jù)可能會(huì)在不同場合產(chǎn)生完全不一樣的價(jià)值;有時(shí)候,單一的數(shù)據(jù)沒有什么特別的價(jià)值,需要組合起來才能產(chǎn)生價(jià)值。
數(shù)據(jù)價(jià)值1:識別價(jià)值
識別的價(jià)值,就是唯一能夠鎖定目標(biāo)的數(shù)據(jù)。最有價(jià)值的比如身份證、信用卡,還有E-mail、手機(jī)號碼等,這些都是識別和串聯(lián)價(jià)值很高的數(shù)據(jù)。電商網(wǎng)站識別“你”的方法就是你的登錄賬號。千萬不要小看這個(gè)賬號,如果沒有這個(gè)賬號,網(wǎng)站就只能知道有一些商品被用戶瀏覽了,但是卻無法知道是被哪個(gè)用戶瀏覽了,更不可能還原出用戶的購買行為。
在運(yùn)營數(shù)據(jù)的時(shí)候,經(jīng)常觀察到這樣的數(shù)據(jù),有時(shí)候能夠直接識別,有時(shí)候需要間接識別。電話號碼、生日這些都是非常重要的數(shù)據(jù),因此,把自己的生日放在社交網(wǎng)絡(luò)上,是非常不妥的做法。所以,千萬不要小看識別數(shù)據(jù)的價(jià)值,經(jīng)驗(yàn)告訴我們,能夠辨別關(guān)系和身份的數(shù)據(jù)是最重要的。這些數(shù)據(jù)應(yīng)該是有多少存多少,永遠(yuǎn)不要放棄。在大數(shù)據(jù)時(shí)代,越能夠還原用戶真實(shí)身份和真實(shí)行為的數(shù)據(jù),就越能夠讓企業(yè)在大數(shù)據(jù)競爭中保持戰(zhàn)略優(yōu)勢。
數(shù)據(jù)價(jià)值2:描述價(jià)值
比如搜索T恤,搜索的是什么品牌、材質(zhì)、尺碼等類似的數(shù)據(jù),而這些都是描述數(shù)據(jù),可以用來刻畫研究對象。研究對象可以是商品,可以是企業(yè),可以是用戶,而反過來,描述數(shù)據(jù)也可以幫助我們更好地理解研究對象。
在通常情況下,描述數(shù)據(jù)是以一種標(biāo)簽的形式存在的,它們是通過初步加工的一些數(shù)據(jù),這也是數(shù)據(jù)從業(yè)者在日常生活中做的最為基礎(chǔ)的工作。公司的營業(yè)收入、利潤、凈資產(chǎn)等數(shù)據(jù)都是描述性的數(shù)據(jù)。在電商平臺類企業(yè)日常經(jīng)營的狀況下,描述業(yè)務(wù)的數(shù)據(jù)就包括成交額、成交用戶數(shù)、網(wǎng)站的流量、網(wǎng)站詳情頁的流量、成交的賣家數(shù)等,我們就可以通過數(shù)據(jù)對業(yè)務(wù)的描述來觀察交易活動(dòng)是否正常。
對企業(yè)來說,數(shù)據(jù)的描述價(jià)值與業(yè)務(wù)目標(biāo)的實(shí)現(xiàn)并不呈正比關(guān)系,也就是說,描述數(shù)據(jù)不是越多越好,而是應(yīng)該收集和業(yè)務(wù)緊密相關(guān)的數(shù)據(jù)。描述數(shù)據(jù)對具體的業(yè)務(wù)人員來說,能夠使其更好地了解業(yè)務(wù)發(fā)展的狀況,讓他們對日常業(yè)務(wù)有更加清楚的認(rèn)知;對于管理層來說,經(jīng)常關(guān)注業(yè)務(wù)數(shù)據(jù)也能夠讓他對企業(yè)發(fā)展有更好的了解,以作出明智的決策。
描述數(shù)據(jù)最典型的方式就是分析數(shù)據(jù)的框架。在復(fù)雜的數(shù)據(jù)中抽象出核心的點(diǎn),讓使用者能夠在極短的時(shí)間里看到經(jīng)營狀況,同樣,又能夠讓使用者看到更多他想看的細(xì)節(jié)數(shù)據(jù)。
數(shù)據(jù)價(jià)值3:時(shí)間價(jià)值
在考慮了時(shí)間的維度之后,數(shù)據(jù)會(huì)產(chǎn)生更大的價(jià)值。對于時(shí)間的分析,在數(shù)據(jù)分析中是一個(gè)非常重要,但往往也比較有難度的部分。我們可以通過以下兩個(gè)案例來做更好的分析。
第一個(gè)案例是電商A首頁的焦點(diǎn)圖,是一個(gè)關(guān)于茶葉的廣告,但這個(gè)廣告并不是對每一個(gè)人都顯示,對我顯示的原因是我之前在電商A上買過茶葉。這個(gè)數(shù)據(jù)的價(jià)值就是廣告系統(tǒng)通過對我歷史數(shù)據(jù)的判斷,將我識別成一個(gè)可能會(huì)買茶葉的人,并通過廣告系統(tǒng)的內(nèi)在競價(jià)機(jī)制,將這一款茶葉推薦給了我。
第二個(gè)案例是關(guān)于一個(gè)類目的演進(jìn)路線,其中存在一些很有意思的現(xiàn)象。比如烘焙用品會(huì)有一個(gè)明顯的演進(jìn)路線,黃油、模具、芝士、包裝盒等用品會(huì)隨著烘焙產(chǎn)品周邊產(chǎn)品的演進(jìn)而不斷呈現(xiàn)出新的需求。這就是在大數(shù)據(jù)的基礎(chǔ)上,基于用戶的時(shí)間來對產(chǎn)品的演進(jìn)進(jìn)行分析,以讓消費(fèi)者更加快捷地找到所需要的商品。
大數(shù)據(jù)一個(gè)非常重要的作用就是,它能夠基于大量歷史數(shù)據(jù)進(jìn)行分析,而時(shí)間則是代表歷史的一個(gè)必然維度。數(shù)據(jù)的時(shí)間價(jià)值是大數(shù)據(jù)運(yùn)用最直接的體現(xiàn),通過對時(shí)間的分析,能夠很好地歸納出一個(gè)用戶對于一種場景的偏好。而知道了用戶的偏好,企業(yè)對用戶做出的商品推薦也就能夠更加精準(zhǔn)。
時(shí)間價(jià)值除了體現(xiàn)歷史的數(shù)據(jù)之外,還有一個(gè)價(jià)值是“即時(shí)”——互聯(lián)網(wǎng)廣告領(lǐng)域的實(shí)時(shí)競價(jià)(RTB,Real Time Bidding),它是基于即時(shí)的一種運(yùn)用。實(shí)時(shí)競價(jià)就是當(dāng)用戶進(jìn)入某一個(gè)場景之后,各家需求方平臺(DSP,Demand Site Platform)就會(huì)來進(jìn)行競價(jià),對用戶現(xiàn)實(shí)場景進(jìn)行數(shù)據(jù)推送。比如,用戶正在瀏覽一個(gè)和化妝品有關(guān)的頁面或者正在商場逛街,在這個(gè)場景中就會(huì)出現(xiàn)和化妝品有關(guān)的信息。這個(gè)化妝品的廣告不是預(yù)先設(shè)置好的,而是在這個(gè)具體的場景中通過實(shí)時(shí)競價(jià)出現(xiàn)的。
數(shù)據(jù)價(jià)值4:預(yù)測價(jià)值
數(shù)據(jù)的預(yù)測價(jià)值分成兩種。
第一種是對于某一個(gè)單品進(jìn)行預(yù)測。比如在電子商務(wù)中,凡是能夠產(chǎn)生數(shù)據(jù),能夠用于推薦的,就都會(huì)產(chǎn)生預(yù)測價(jià)值。比如,推薦系統(tǒng)推薦了一款T恤,它有多大的可能性被點(diǎn)擊,這就是預(yù)測價(jià)值。預(yù)測價(jià)值本身沒有什么價(jià)值,它只是在估計(jì)這個(gè)商品是有價(jià)值的,所以預(yù)測數(shù)據(jù)可以讓你對未來可能出現(xiàn)的情況做好準(zhǔn)備。推薦系統(tǒng)估計(jì)今天會(huì)有10個(gè)用戶來買這件T恤,這就是預(yù)測。再問一個(gè)追加問題:“你有多大的信心今天能賣出10件T恤?”你說有98%的可能性,那么這就是對未來的預(yù)判及準(zhǔn)確度的預(yù)估。
預(yù)測價(jià)值的第二種價(jià)值就是數(shù)據(jù)對于經(jīng)營狀況的預(yù)測,即對公司的整體經(jīng)營進(jìn)行預(yù)測,并能夠用預(yù)測的結(jié)論指導(dǎo)公司的經(jīng)營策略。
在今天的電商中,移動(dòng)端是一個(gè)重要的部門,對于新的移動(dòng)業(yè)務(wù)來說,核心指標(biāo)之一就是每天的活躍用戶數(shù),而且這個(gè)指標(biāo)也是對移動(dòng)團(tuán)隊(duì)進(jìn)行考核的重要依據(jù)。作為移動(dòng)團(tuán)隊(duì)的負(fù)責(zé)人,到底怎么判斷現(xiàn)在的經(jīng)營狀況和目標(biāo)之間存在著多大的差距呢?這就需要對數(shù)據(jù)進(jìn)行預(yù)測。通過預(yù)測,將活躍用戶分成新增和留存兩個(gè)指標(biāo),進(jìn)而分析對目標(biāo)的貢獻(xiàn)度分別是多少,并分別對兩個(gè)指標(biāo)制定出相應(yīng)的產(chǎn)品策略,然后分解目標(biāo),進(jìn)行日常監(jiān)控。這種類型的數(shù)據(jù)能夠?qū)菊w的經(jīng)營策略產(chǎn)生非常大的影響。
數(shù)據(jù)價(jià)值5:產(chǎn)出數(shù)據(jù)的價(jià)值
從數(shù)據(jù)的價(jià)值來說,很多數(shù)據(jù)本身并沒有特別的含義,但是在幾個(gè)數(shù)據(jù)組合在一起或者對部分?jǐn)?shù)據(jù)進(jìn)行整合之后就產(chǎn)生了新的價(jià)值。
在電商中,這樣的場景很常見。比如,在電子商務(wù)開始初期,很多人都關(guān)注誠信問題,那么如何才能評價(jià)誠信呢?于是就產(chǎn)生了兩個(gè)衍生指標(biāo):一個(gè)是好評率,一個(gè)是累積好評數(shù)。這兩個(gè)指標(biāo),就是目前在電商平臺的頁面上經(jīng)??吹降馁u家的好評率和星鉆級別,用戶能夠基于此了解這個(gè)賣家的歷史經(jīng)營狀況和誠信狀況。
但是,僅以這兩個(gè)指標(biāo)來對賣家進(jìn)行評價(jià),會(huì)顯得略微有些單薄,因?yàn)樗鼈儫o法很精確地衡量出賣家的服務(wù)水平。于是,又衍生出更多的指標(biāo),比如與描述相符、物流速度等,這些指標(biāo)最終變成了一個(gè)新的指標(biāo)叫作店鋪評分系統(tǒng)(DSR),可以用之來綜合評價(jià)這個(gè)賣家的服務(wù)水平。
當(dāng)然,某個(gè)單一的商品在電商網(wǎng)站上可能會(huì)出現(xiàn)幾千條評價(jià),而評價(jià)中又是用戶站在自己的立場描述的,但是推及到某個(gè)用戶上,每次買一樣?xùn)|西都要閱讀幾千條評價(jià)顯然是不太可能的,因此就需要把這些評價(jià)進(jìn)行重新的定位,以產(chǎn)生出新的能夠幫助用戶做出明智購買決策的數(shù)據(jù),這些數(shù)據(jù)就是關(guān)鍵概念的抽取。
四、總結(jié)
在認(rèn)識了數(shù)據(jù)的分類和明確了數(shù)據(jù)的價(jià)值后,就能更好地識別出哪些是企業(yè)想要的核心數(shù)據(jù),從而更好地發(fā)揮數(shù)據(jù)的作用。精細(xì)的數(shù)據(jù)分類、嚴(yán)格的數(shù)據(jù)生產(chǎn)加工過程,才能使企業(yè)數(shù)據(jù)資產(chǎn)發(fā)揮更大的價(jià)值,從而更好的支持生產(chǎn)、經(jīng)營、管理、戰(zhàn)略的決策。
關(guān)注星球,獲取知識
聯(lián)系客服