中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
玩轉(zhuǎn)大數(shù)據(jù),重要的是思維的變革

不知從何時(shí)開始,大數(shù)據(jù)這個(gè)詞從初次問世的新奇高逼格,變成了現(xiàn)在的爛大街。好像凡是家互聯(lián)網(wǎng)公司,就敢言必稱“大數(shù)據(jù)”。

那么,我們聽了這么久的大數(shù)據(jù),到底什么是大數(shù)據(jù)?既然有大數(shù)據(jù),那么是否就有小數(shù)據(jù)?一個(gè)新的概念的提出,必然是對(duì)原本概念的一個(gè)挑戰(zhàn),那么大數(shù)據(jù)和小數(shù)據(jù)相比又有什么區(qū)別呢?

我想這兩者的本質(zhì)區(qū)別并非只是數(shù)據(jù)量大小的差異,更是我們我們思維層面的變革。

今天,筆者就借舍恩伯格的《大數(shù)據(jù)時(shí)代》來和大家聊聊對(duì)于大數(shù)據(jù)的一些理解。舍恩伯格在書中提出來3個(gè)關(guān)于大數(shù)據(jù)時(shí)代思維變革的觀點(diǎn)。

一、 更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)

我們從中學(xué)時(shí)候,就開始接觸“抽樣”的概念。而抽樣其實(shí)就是小數(shù)據(jù)時(shí)代通用的一種方法?;诋?dāng)初的數(shù)據(jù)收集和處理的困難,我們無法做到對(duì)所有的研究對(duì)象進(jìn)行數(shù)據(jù)分析,因此就選擇抽樣的方法,隨機(jī)抽取部分樣本,希望通過對(duì)隨機(jī)樣本的研究來說明整體的情況。這種方法最重要的就是在樣本的選擇上,如果選擇樣本的時(shí)候不符合“隨機(jī)”性,那么其最終的研究結(jié)果便很有可能和事實(shí)相差甚遠(yuǎn)。

而隨著互聯(lián)網(wǎng)時(shí)代的到來,技術(shù)的飛速發(fā)展,我們記錄收集信息的成本越來越低。從事互聯(lián)網(wǎng)這一行的基本都知道,只要我們?cè)诋a(chǎn)品內(nèi)進(jìn)行埋點(diǎn),便能知道所有我們想知道的用戶在產(chǎn)品上的行為,而具備強(qiáng)大的數(shù)據(jù)分析能力的計(jì)算機(jī),更是使對(duì)所有數(shù)據(jù)進(jìn)行分析成為了可能。解決了數(shù)據(jù)收集和分析的難題,使“樣本=全體”得以實(shí)現(xiàn),而這也是大數(shù)據(jù)時(shí)代第一個(gè)特點(diǎn),我們?cè)龠M(jìn)行相關(guān)研究的時(shí)候無需進(jìn)行抽樣,對(duì)全量的研究是我們的結(jié)果更加全面。

二、更雜:不是精確性,而是混雜性

在以往的小數(shù)據(jù)時(shí)代,因?yàn)闃颖救萘康挠邢扌?,為了保證最終結(jié)果的可信性,分析人員務(wù)必需要保證所選擇樣本數(shù)據(jù)的準(zhǔn)確度。因?yàn)榛谛颖镜臄?shù)據(jù)分析,如果其中不幸參雜了一個(gè)錯(cuò)誤的數(shù)據(jù),那很有可能導(dǎo)致最終的結(jié)果完全偏離現(xiàn)實(shí)。

而到了大數(shù)據(jù)時(shí)代,我們所收集到的數(shù)據(jù)越來越多,而其中必然會(huì)慘雜著為數(shù)不少的錯(cuò)誤數(shù)據(jù)。但是在如此龐雜的數(shù)據(jù)庫中。只有5%的數(shù)據(jù)是結(jié)構(gòu)化且能用于傳統(tǒng)數(shù)據(jù)庫的,這也就意味著,如果我們還是如以往一般執(zhí)迷于精確性,那么剩下95%的的非結(jié)構(gòu)化數(shù)據(jù)都無法被利用,這將是一個(gè)多大的損失,我們坐擁寶山而不自知,白白讓這么豐富的數(shù)據(jù)浪費(fèi)。而如果要使用這些數(shù)據(jù),我們就必須接受不精確性,接受數(shù)據(jù)的混雜,這樣才能打開一扇從未涉足的世界的窗戶。

當(dāng)然,我們不再追求精確性,并不是意味著我們放棄準(zhǔn)確。恰恰相反,接受數(shù)據(jù)的混雜,正是為了能夠通過對(duì)更多數(shù)據(jù)的使用,來獲取更有說服力、更加準(zhǔn)確的結(jié)果。雖說混雜的數(shù)據(jù)中會(huì)參雜錯(cuò)誤數(shù)據(jù),但在龐大的全樣本下,個(gè)別錯(cuò)誤的數(shù)據(jù)對(duì)最終結(jié)果的影響也將被無限地縮小。

三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系

今日頭條根據(jù)用戶以往的閱讀數(shù)據(jù)來判定其感興趣的內(nèi)容,并進(jìn)行針對(duì)性的推薦,但從不去糾結(jié)用戶為什么喜歡這些內(nèi)容;支付寶年度賬單會(huì)根據(jù)各個(gè)省市的消費(fèi)情況制作相關(guān)的排行榜,但也并不深究是什么導(dǎo)致了各個(gè)省市消費(fèi)情況的差異......

諸如此類,絕大部分的互聯(lián)網(wǎng)公司都是通過數(shù)據(jù)的分析,向我們傳遞著“是什么”的信息,而非“為什么”。而這也正是大數(shù)據(jù)時(shí)代所帶來的第三個(gè)思維的變革:我們更多的開始關(guān)注相關(guān)關(guān)系,而不是因果關(guān)系。我們不必非得知道現(xiàn)象背后的原因是什么,我們更多的是讓數(shù)據(jù)自己“發(fā)聲'。

當(dāng)然,這并不意味著因果關(guān)系已經(jīng)沒有作用。在大多數(shù)情況下。一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,往往不會(huì)僅僅滿足于知道'是什么”,我們會(huì)繼續(xù)像更深層次進(jìn)行探索,去研究因果關(guān)系,找出背后的“為什么”。

我們只是不會(huì)再把因果關(guān)系作為意義來源的基礎(chǔ)。在大數(shù)據(jù)時(shí)代,即使很多情況下,我們依然指望用因果關(guān)系來說明我們所發(fā)現(xiàn)的相互聯(lián)系,但是,因果關(guān)系實(shí)際上只是一種特殊的相關(guān)關(guān)系。相反,大數(shù)據(jù)推動(dòng)了相關(guān)關(guān)系分析,相關(guān)關(guān)系往往能取代因果關(guān)系起作用,即使不可取代的情況下,它也能指導(dǎo)因果關(guān)系起作用。

大數(shù)據(jù)時(shí)代的來臨,是我們測(cè)量、記錄、分析世界的一個(gè)契機(jī),他能幫助我們更好的認(rèn)識(shí)社會(huì),認(rèn)識(shí)我們所生存的這個(gè)世界。而如果我們有意去抓住這個(gè)機(jī)遇,就務(wù)必需要從思維上去改變,去適應(yīng)大數(shù)據(jù)時(shí)代的生存法則。

著作權(quán)歸作者所有
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
大數(shù)據(jù)時(shí)代
壹周讀書:大數(shù)據(jù)時(shí)代
大數(shù)據(jù),我們認(rèn)識(shí)世界的一扇新門
大數(shù)據(jù)思維是什么?
大數(shù)據(jù)時(shí)代的利與弊
大數(shù)據(jù)時(shí)代讀后感
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服