中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
想成為數(shù)據(jù)科學(xué)家?你得先讀讀這篇文章

市場(chǎng)營(yíng)銷學(xué)者Kevin Gray對(duì)肯納索州立大學(xué)研究生院副院長(zhǎng)、統(tǒng)計(jì)學(xué)及數(shù)據(jù)科學(xué)教授Jennifer Priestley做了一個(gè)采訪,請(qǐng)教數(shù)據(jù)科學(xué)究竟是什么、一個(gè)好數(shù)據(jù)科學(xué)家應(yīng)具備哪些品質(zhì)以及如何成為一個(gè)好的數(shù)據(jù)科學(xué)家,訪談全文如下。

Q:您能否用簡(jiǎn)單、外行人也能聽得懂的話向我們解釋數(shù)據(jù)科學(xué)?

A:我認(rèn)為Slack的數(shù)據(jù)工程總監(jiān)Josh Wills給出的定義非常恰當(dāng)——“(數(shù)據(jù)科學(xué)家是)擅長(zhǎng)統(tǒng)計(jì)學(xué)的軟件工程師與擅長(zhǎng)軟件工程的統(tǒng)計(jì)學(xué)家的混合體。”,我還想在這里加上我本人的“Priestly推論”:“(數(shù)據(jù)科學(xué)家是)擅長(zhǎng)對(duì)數(shù)據(jù)分析結(jié)果進(jìn)行商業(yè)解釋的科學(xué)家與擅長(zhǎng)數(shù)據(jù)分析的MBA的混合體”。

Q:統(tǒng)計(jì)學(xué)家和數(shù)據(jù)科學(xué)家之間的區(qū)別是什么?

A:這是個(gè)好問題。我也經(jīng)常被問到計(jì)算機(jī)科學(xué)家和數(shù)據(jù)科學(xué)家之間的區(qū)別是什么。事實(shí)上這兩個(gè)學(xué)科也都在探索隱藏在數(shù)據(jù)中的新內(nèi)涵。雖然二者都對(duì)數(shù)據(jù)科學(xué)這一新生領(lǐng)域作出了令人矚目的貢獻(xiàn),他們并非完全獨(dú)立的。

數(shù)據(jù)的增長(zhǎng)不僅體現(xiàn)在其規(guī)模上,還體現(xiàn)在我們對(duì)數(shù)據(jù)這個(gè)詞定義的延伸上。舉個(gè)例子,文本和圖像已成為日益常見的數(shù)據(jù)形式并被納入分類及風(fēng)險(xiǎn)建模等分析范疇中。對(duì)數(shù)據(jù)定義的延伸迫使統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)從各自的傳統(tǒng)核心領(lǐng)域進(jìn)入邊緣領(lǐng)域——在這樣的邊緣領(lǐng)域里,新的思路開始萌發(fā)——兩個(gè)學(xué)科在邊緣領(lǐng)域的融合成為了數(shù)據(jù)科學(xué)的基礎(chǔ)。

統(tǒng)計(jì)學(xué)的多數(shù)傳統(tǒng)核心內(nèi)容還未做好處理以十億為單位的記錄及非結(jié)構(gòu)化數(shù)據(jù)的準(zhǔn)備。同樣,計(jì)算機(jī)科學(xué)的核心領(lǐng)域雖然擅長(zhǎng)高效獲取并存儲(chǔ)大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),但在通過建模、分類和可視化等形式將數(shù)據(jù)轉(zhuǎn)換成信息的能力上存在短板。

我同意統(tǒng)計(jì)學(xué)家在數(shù)據(jù)科學(xué)界容易處于弱勢(shì)的說法。我認(rèn)為這很不幸。幾年前,“簡(jiǎn)單統(tǒng)計(jì)學(xué)”(SimplyStatistics)博客發(fā)布了一篇名為《為什么大數(shù)據(jù)陷入了麻煩:他們忘了運(yùn)用統(tǒng)計(jì)學(xué)》的文章。這篇文章指出了人們興沖沖地倒騰機(jī)器學(xué)習(xí)、文本挖掘、神經(jīng)網(wǎng)絡(luò)卻忽視與數(shù)據(jù)行為(behavior of date)密切相關(guān)的變量、置信度、分布等基本統(tǒng)計(jì)學(xué)概念,導(dǎo)致了糟糕的決定。雖然數(shù)據(jù)科學(xué)不是統(tǒng)計(jì)學(xué),但統(tǒng)計(jì)學(xué)為這門學(xué)科貢獻(xiàn)了基礎(chǔ)方法。

Q:我們中絕大多數(shù)人直到最近幾年才聽說過數(shù)據(jù)科學(xué)。您能否向我們簡(jiǎn)要介紹它的歷史?

A:這個(gè)詞最早是計(jì)算機(jī)科學(xué)家Peter Naur在1960年提出的觀點(diǎn),但“數(shù)據(jù)科學(xué)”在統(tǒng)計(jì)學(xué)中也留下了進(jìn)化的種子。1962年,John W. Tukey(我們那個(gè)年代最為人所熟知和尊敬的統(tǒng)計(jì)學(xué)家之一)寫到:“在很長(zhǎng)一段時(shí)間里,我認(rèn)為我是一個(gè)統(tǒng)計(jì)學(xué)家,致力于通過特定樣本推斷總體的面貌。但自從我看到了數(shù)理統(tǒng)計(jì)的進(jìn)化,我發(fā)現(xiàn)我真正感興趣的領(lǐng)域是數(shù)據(jù)分析……數(shù)據(jù)分析本質(zhì)上是一門經(jīng)驗(yàn)科學(xué)?!?/p>

1996年,國(guó)際分類學(xué)聯(lián)合會(huì)(IFCS)在第五次大會(huì)中首次使用了“數(shù)據(jù)科學(xué)”一詞。大會(huì)標(biāo)題為“數(shù)據(jù)科學(xué),分類及相關(guān)方法”。 1997年,吳建福教授(目前在佐治亞理工學(xué)院)在密歇根大學(xué)統(tǒng)計(jì)系就任H. C. Carver講席教授的公開演講中呼吁將統(tǒng)計(jì)學(xué)更名為數(shù)據(jù)科學(xué),統(tǒng)計(jì)學(xué)家更名為數(shù)據(jù)科學(xué)家。

2002年發(fā)生了一件數(shù)據(jù)科學(xué)的關(guān)鍵里程碑事件,第一本學(xué)術(shù)同行評(píng)論期刊《數(shù)據(jù)科學(xué)學(xué)報(bào)》(Data ScienceJournal)正式創(chuàng)刊。此后又出現(xiàn)了其他幾個(gè)期刊,專門促進(jìn)和傳播這一領(lǐng)域的學(xué)術(shù)研究成果。

專門的學(xué)術(shù)期刊的出現(xiàn)對(duì)于學(xué)術(shù)界來說尤為重要——這些期刊促成了新的博士課程(比如我們的)和學(xué)術(shù)部門,為相關(guān)研究、獎(jiǎng)學(xué)金和發(fā)表提供了平臺(tái)。現(xiàn)在數(shù)據(jù)科學(xué)教師和博士生可以在自己的圈子里——而不是計(jì)算機(jī)科學(xué)、數(shù)學(xué)、商學(xué)的圈子里——開展研究和分享。

Q:2011年麥肯錫作出了一項(xiàng)廣為人知的研究預(yù)測(cè),在2018年“僅美國(guó)一國(guó)就會(huì)面臨14萬到19萬具備深度分析能力人才的缺口,與此同時(shí)存在至少150萬名懂得如何運(yùn)用大數(shù)據(jù)做出有效決定的管理人員和分析師的缺口?!边@個(gè)預(yù)測(cè)有多準(zhǔn)確?我們現(xiàn)在有其他替代方案嗎?

A:我被問到這個(gè)問題很多次了——具體來說,許多公司高管問過我諸如“數(shù)據(jù)科學(xué)這事是否只是一時(shí)的風(fēng)潮?”的問題。我想我們應(yīng)該重新給這個(gè)議題劃個(gè)框架。

我的觀點(diǎn)是,我們不需要具有深刻的分析能力的“19萬人”或“150萬管理者”。我認(rèn)為每個(gè)人都需要有一定程度的分析技能。我認(rèn)為基礎(chǔ)分析素養(yǎng)應(yīng)該像閱讀、數(shù)學(xué)一樣成為我們的教育體系的基礎(chǔ)部分。如今看到越來越多小學(xué)里也開始教授基礎(chǔ)的編程技巧讓我備受鼓舞。在大學(xué)的層面,我認(rèn)為數(shù)據(jù)科學(xué)應(yīng)成為基礎(chǔ)課的一部分。(我現(xiàn)在可以聽到我們的教務(wù)辦公室的人在大喘氣了)。

所以,雖然目前的人才缺口是實(shí)實(shí)在在的,但這是與市場(chǎng)需求不符的教育制度的造成的。各級(jí)教育正在轉(zhuǎn)向,并很可能在可預(yù)見的將來繼續(xù)下去。我預(yù)計(jì)在一代人中,對(duì)這些技能的需求不會(huì)減少,但供給方面會(huì)與之匹配得更密切。

Priestley推論:“數(shù)據(jù)科學(xué)家擅長(zhǎng)對(duì)數(shù)據(jù)分析結(jié)果進(jìn)行商業(yè)解釋的科學(xué)家與擅長(zhǎng)數(shù)據(jù)分析的MBA的混合體”。

Q:許多人,包括那些考慮到職業(yè)生涯中期轉(zhuǎn)型的人,已經(jīng)把目光投向了數(shù)據(jù)科學(xué)。但恐怕并非所有人都適合走這條路。請(qǐng)問數(shù)據(jù)科學(xué)工作中需要哪些能力和技能?成為數(shù)據(jù)科學(xué)家的最佳途徑有哪些?

A:這是個(gè)絕佳的問題。我們需要做些什么來讓我們的下一代準(zhǔn)備好,但實(shí)際情況是,從20多歲到40多歲的人里很多人正在尋找機(jī)會(huì)轉(zhuǎn)行進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域工作。

我在辦公室看到很多這樣的人。我已經(jīng)有不止一次遇上“我剛剛為了拿一張數(shù)據(jù)科學(xué)的文憑向XX大學(xué)付了一萬美元......而我還是找不到工作”之類的對(duì)話。雖說這些“文憑”中的一些很有含金量,但悲劇的是,大部分都是垃圾。

首先,你不能指望通過參加一個(gè)5天結(jié)業(yè)拿文憑的課程就從詩(shī)人變成數(shù)據(jù)科學(xué)家。指望線上的遠(yuǎn)程課程就更不靠譜了。

第二點(diǎn),我認(rèn)為人們需要對(duì)他們完成自己的職業(yè)目標(biāo)要付出的努力抱有正確的期望。這些技能之所以被如此熱切的需要并能給你帶來高薪是因?yàn)樗鼈兒茈y——你最最起碼也得主動(dòng)學(xué)習(xí)和精進(jìn)。

第三點(diǎn),我認(rèn)為人們需要清楚他們目前的技能有哪些,他們的目標(biāo)是什么。這個(gè)問題的答案將決定你如何實(shí)現(xiàn)目標(biāo)。那些受到了簡(jiǎn)單的在線證書課程誘惑并深陷其中的人應(yīng)該想想愛麗絲夢(mèng)游仙境里的那只Cheshire貓 - “如果你不知道要去哪里,走哪條路都沒用”。

我對(duì)向詢問這一領(lǐng)域相關(guān)問題的人給出以下建議:

  • 如果你是個(gè)想轉(zhuǎn)行做數(shù)據(jù)科學(xué)的詩(shī)人——我是說正兒八經(jīng)地的投入它并以一種深刻而有意義的方法將它作為你的事業(yè)——你需要放下你的羽毛筆,拿出你的牛仔褲和背包,上全日制的學(xué)校課程。大多數(shù)數(shù)據(jù)科學(xué)研究生課程時(shí)間不超過兩年,其中多數(shù)會(huì)提供各種形式的研究生助學(xué)金。你應(yīng)該爭(zhēng)取參與包括編程,統(tǒng)計(jì),建模的項(xiàng)目。而且還有充足的機(jī)會(huì)與當(dāng)?shù)毓?,非營(yíng)利組織,地方政府等等一起進(jìn)行真正接地氣的項(xiàng)目。

我覺得怎么強(qiáng)調(diào)實(shí)際操作、自己動(dòng)手,實(shí)際經(jīng)驗(yàn)對(duì)一切數(shù)據(jù)科學(xué)項(xiàng)目的重要性都不為過。這就是為什么在線/短期證書課程對(duì)于想在這一領(lǐng)域從頭開始的人來說不起作用。直接上手做項(xiàng)目會(huì)幫助你們了解數(shù)據(jù)科學(xué)的更多潛在方面 - 如講故事的作用,創(chuàng)造力(很遺憾地被忽視了)和項(xiàng)目管理。

  • 如果你是個(gè)計(jì)算機(jī)科學(xué)家/程序員,就去找找?guī)в蟹治稣n程或者經(jīng)常使用統(tǒng)計(jì)學(xué)的商學(xué)院課程。你的編程和數(shù)學(xué)技能多半是他們需要的——你則可能需要上些統(tǒng)計(jì)/建模/分析的課程——以及(又一次被)培訓(xùn)如何講述故事,并學(xué)習(xí)如何在和你有不同想法的人組成的團(tuán)隊(duì)中工作。
  • 我會(huì)鼓勵(lì)所有人去學(xué)習(xí)Tableau之類的基本的數(shù)據(jù)可視化工具。我同時(shí)鼓勵(lì)所有人定期參加線上/異步編程課程。這些課程都很便宜(有的還不要錢)并能讓你保持犀利的技術(shù)。

我的觀點(diǎn)是,并不是每個(gè)人都想成為一名計(jì)算機(jī)程序員——我就不是特別喜歡編程。我是為了獲得我的研究問題的答案而不得不去學(xué)編程。如果我能用我信賴的HP-12C計(jì)算器和自動(dòng)鉛筆就找到答案的話那我早那么做了。在21世紀(jì)里,你必須對(duì)基礎(chǔ)數(shù)學(xué)有所了解,你必須能夠閱讀、寫作并勝任基本編程的工作。

Q:數(shù)據(jù)科學(xué)家常談到在許多組織里,管理層并不真正知道如何將分析手段運(yùn)用于決策制定。決策制定仍然多數(shù)取決于直覺并且很大程度上受到公司政治的影響。您是否有相同經(jīng)歷?

A:我經(jīng)常對(duì)公司事務(wù)發(fā)表評(píng)論,只要問題發(fā)生,不管它多不引人注意我都會(huì)發(fā)表意見。我劃分了談話框架——組織可以大致分為原生數(shù)據(jù)組織和非原生數(shù)據(jù)組織兩類。

“原生數(shù)據(jù)公司”是那些現(xiàn)在占據(jù)頭條以及股票市場(chǎng)的公司,如亞馬遜、谷歌、臉書。這些公司在30年前不可能存在。不僅僅因?yàn)樽鳛樗麄兇嬖诤瓦\(yùn)營(yíng)模式基礎(chǔ)的數(shù)據(jù)在當(dāng)時(shí)并不存在,還因?yàn)榧词顾麄冏隽?,?dāng)時(shí)也不能獲取足夠的計(jì)算能力或執(zhí)行與人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方式相關(guān)的深度分析方法讓這些公司從事他們現(xiàn)在正在做的業(yè)務(wù)。

然而,這些公司的另一個(gè)維度往往被忽視:由于它們是原生于數(shù)據(jù)本身,也因此在企業(yè)文化上受到了巨大的影響。它們是從組織圖的頂部到底部都由數(shù)據(jù)驅(qū)動(dòng)的公司。數(shù)據(jù)貫穿于他們整個(gè)公司的DNA。大多數(shù)進(jìn)入這些公司的人都有以數(shù)據(jù)為中心的方向——并且可能會(huì)研究一個(gè)計(jì)算學(xué)科——越來越側(cè)重于數(shù)據(jù)科學(xué)。臉書、谷歌的員工年齡中位數(shù)是29歲,亞馬遜則為30歲(不包括倉(cāng)庫(kù)員工)。

“非原生數(shù)據(jù)公司”是在我們聽到諸如“數(shù)據(jù)科學(xué)”和“大數(shù)據(jù)”這樣的術(shù)語(yǔ)很久以前就取得成功的公司。例子包括沃爾瑪和Arby’s。它們都是非常成功的公司,成立之初并沒有數(shù)據(jù)貫穿于其DNA。

雖然這些公司現(xiàn)在已經(jīng)大力側(cè)重將數(shù)據(jù)用于公司決策及提供產(chǎn)品和服務(wù),但與建立在計(jì)算文化上的組織架構(gòu)有巨大的不同。這些公司的管理層非常有前瞻性,他們把自己的公司轉(zhuǎn)變?yōu)橐允聦?shí)為基礎(chǔ)、用數(shù)據(jù)做驅(qū)動(dòng)的組織,從而在市場(chǎng)上獲得了領(lǐng)先者地位。他們各自市場(chǎng)上的對(duì)手們(希爾斯百貨,梅西百貨 ... 麥當(dāng)勞,溫蒂快餐)則沒有。

Q:最后一個(gè)問題,您認(rèn)為人工智能和自動(dòng)化在未來10-15年里對(duì)數(shù)據(jù)科學(xué)造成怎樣的影響?

A:我并非這一領(lǐng)域的專家,但我認(rèn)為做出任何預(yù)測(cè)統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)或數(shù)據(jù)科學(xué)會(huì)因自動(dòng)化而消亡的預(yù)言都為時(shí)過早。計(jì)算器只是讓數(shù)學(xué)計(jì)算“自動(dòng)化”……但是如今的數(shù)學(xué)比以前的計(jì)算要更廣闊也更復(fù)雜。我期待在數(shù)據(jù)科學(xué)的領(lǐng)域中也是一樣。


原文發(fā)布時(shí)間為:2017-11-13

本文作者:文摘菌

本文來自云棲社區(qū)合作伙伴“大數(shù)據(jù)文摘”,了解相關(guān)信息可以關(guān)注“大數(shù)據(jù)文摘”微信公眾號(hào)

備注:

Jennifer Lewis Priestley, Ph.D.

Professor of Statistics and Data Science | Kennesaw State University

Kennesaw, GA, US 

Jennifer Lewis Priestley is the director of the Center for Statistics and Analytical Services at Kennesaw State.

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
數(shù)據(jù)科學(xué)十大技能
普通程序員如何向人工智能靠攏?(免費(fèi)教程,自學(xué)指南)
學(xué)科建設(shè) | 十字路口的統(tǒng)計(jì)學(xué): 誰(shuí)在應(yīng)對(duì)挑戰(zhàn)?
從入門到求職,成為數(shù)據(jù)科學(xué)家的終極指南
如果你想學(xué)數(shù)據(jù)科學(xué),這 7 類資源千萬不能錯(cuò)過
數(shù)據(jù)科學(xué)家必須具備的核心技能是什么?
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服