作者:Thomas
翻譯:王雨桐
校對(duì):丁楠雅
本文為剛剛接觸數(shù)據(jù)科學(xué)的新人,提出五個(gè)職場(chǎng)準(zhǔn)備的建議。
數(shù)據(jù)科學(xué)已經(jīng)成為21世紀(jì)最熱門(mén)的工作領(lǐng)域,但如何才能成為數(shù)據(jù)科學(xué)家呢? 作為一名有抱負(fù)的數(shù)據(jù)科學(xué)家,或是準(zhǔn)備從事數(shù)據(jù)科學(xué)工作的學(xué)生,你應(yīng)該做好哪些準(zhǔn)備? 需要什么技能?不要擔(dān)心! 本文將會(huì)回答以上所有問(wèn)題,并提供相關(guān)的資源鏈接,幫助你開(kāi)啟新的職業(yè)生涯!
數(shù)據(jù)科學(xué)是一個(gè)跨學(xué)科的領(lǐng)域,這意味著數(shù)據(jù)科學(xué)家要了解多個(gè)領(lǐng)域的知識(shí),并成為不同領(lǐng)域的專家。 數(shù)據(jù)科學(xué)家必須在以下方面具備堅(jiān)實(shí)的基礎(chǔ):
1. 計(jì)算機(jī)科學(xué)
2. 統(tǒng)計(jì)研究(需要扎實(shí)的基礎(chǔ))
3. 線性代數(shù)
4. 數(shù)據(jù)處理(數(shù)據(jù)分析的專業(yè)知識(shí))
5. 機(jī)器學(xué)習(xí)
6. 軟件工程
7. Python編程
8. R編程
9. 業(yè)務(wù)領(lǐng)域知識(shí)
為了成為一名高水平的數(shù)據(jù)科學(xué)家,下圖是你需要掌握的一些知識(shí)領(lǐng)域:
除非你像激光束一樣,將研究集中在這些領(lǐng)域,否則對(duì)上圖中的一個(gè)或多個(gè)主題感到陌生是很正常的。 或者你了解兩三個(gè)主題,但對(duì)其余主題了解甚少。 例如,你可能是一名計(jì)算機(jī)科學(xué)專業(yè)的學(xué)生,掌握數(shù)學(xué)知識(shí)但不了解統(tǒng)計(jì)研究分析所要求的高級(jí)統(tǒng)計(jì)知識(shí)。或者,你可能是一名有一些編程基礎(chǔ)的統(tǒng)計(jì)學(xué)家。
有很多方法可以幫助你開(kāi)啟數(shù)據(jù)科學(xué)的職業(yè)生涯。 其中,你必須做的五件事是:
1. 向具有多年經(jīng)驗(yàn)的前輩學(xué)習(xí)Python和R
2. 在GitHub上構(gòu)建數(shù)據(jù)科學(xué)作品集
3. 加入Kaggle并參加數(shù)據(jù)科學(xué)競(jìng)賽
4. 練習(xí)面試問(wèn)題
5. 做好基本的網(wǎng)絡(luò)聲譽(yù)管理,以提升形象
行業(yè)經(jīng)驗(yàn)是無(wú)可替代的。 比起一位熱心的業(yè)余愛(ài)好者(如在線提供的許多課程),擁有5年以上數(shù)據(jù)科學(xué)行業(yè)工作經(jīng)驗(yàn)的人將是講師的不二人選。 學(xué)習(xí)Python和R是一方面,掌握Python和R是完全不同的事情。如果想在這個(gè)行業(yè)做得好,需要做到掌握技能,而不僅僅是具備基本能力。一定要確保你的講師具有可靠的行業(yè)經(jīng)驗(yàn),因?yàn)檫@種經(jīng)歷會(huì)幫助你拿到頂尖的數(shù)據(jù)科學(xué)公司的offer。相比于擁有相關(guān)專業(yè)博士學(xué)位的學(xué)者,從擁有行業(yè)經(jīng)驗(yàn)的專家那里會(huì)學(xué)到最多。
在GitHub上擁有在線作品集(online portfolio)至關(guān)重要!
如果你不對(duì)學(xué)習(xí)的內(nèi)容進(jìn)行編程練習(xí),也沒(méi)有將課程應(yīng)用于實(shí)際數(shù)據(jù)和現(xiàn)實(shí)情景,那么再好的培訓(xùn)都是無(wú)效的。你需要做數(shù)據(jù)科學(xué)項(xiàng)目,并且盡量使你的項(xiàng)目具有吸引力。
GitHub作品集應(yīng)該遵循以下準(zhǔn)則:
Kaggle.com就是你的訓(xùn)練場(chǎng)。
如果你準(zhǔn)備入手?jǐn)?shù)據(jù)科學(xué),立即成為Kaggler吧! 或者,如果你更傾向于開(kāi)發(fā),請(qǐng)加入TopCoder?。═opCoder也有數(shù)據(jù)科學(xué)發(fā)展路徑)。 Kaggle是公認(rèn)的數(shù)據(jù)科學(xué)的發(fā)源地,因?yàn)镵aggle多年來(lái)一直舉辦數(shù)據(jù)科學(xué)競(jìng)賽,并且是國(guó)際上所有頂尖數(shù)據(jù)科學(xué)競(jìng)賽的集合地。 收到知名公司offer的最簡(jiǎn)單方法之一就是在Kaggle上獲得盡可能高的排名。 更重要的是,你可以將自己的表現(xiàn)與行業(yè)中的頂級(jí)競(jìng)爭(zhēng)對(duì)手進(jìn)行比較。
現(xiàn)在,很多網(wǎng)站都有數(shù)據(jù)科學(xué)崗位面試中使用的問(wèn)題集。沒(méi)有企業(yè)會(huì)讓你死記硬背200個(gè)面試問(wèn)題,但他們確實(shí)希望你能夠在代碼(最好是Python)或偽代碼中解決基本的數(shù)據(jù)科學(xué)和算法問(wèn)題。 最好還要了解基本概念,例如交叉驗(yàn)證是什么,維度的詛咒,過(guò)擬合的問(wèn)題以及在實(shí)際場(chǎng)景中如何處理它。此外,你還需要能解釋主要數(shù)據(jù)科學(xué)算法的內(nèi)部細(xì)節(jié),例如AdaBoost。 線性代數(shù),統(tǒng)計(jì)學(xué)和一些基本的多變量微積分的知識(shí)也可以幫助你在競(jìng)爭(zhēng)中搶占先機(jī)。
這似乎與數(shù)據(jù)科學(xué)無(wú)關(guān),但它是任何求職的基本要求。想想未來(lái)的雇主在看到求職者名姓名后的第一件事是什么?他會(huì)先百度這個(gè)名字。當(dāng)搜索你的名字時(shí),會(huì)出現(xiàn)什么內(nèi)容?你的網(wǎng)絡(luò)資料能否承受以下考驗(yàn)?
如果有以上這些潛在的問(wèn)題,你可能需要調(diào)整自己的網(wǎng)絡(luò)個(gè)人資料。你可以通過(guò)博客文章,成熟的網(wǎng)絡(luò)評(píng)論,甚至為自己創(chuàng)建博客,向世界展現(xiàn)積極的自己。在如今的這個(gè)在線、數(shù)字、互聯(lián)的世界,這對(duì)于求職者來(lái)說(shuō)至關(guān)重要。
人才市場(chǎng)上待挑選的產(chǎn)品
在人才市場(chǎng)上,你試圖將自己和你的網(wǎng)絡(luò)信譽(yù)銷售給從未見(jiàn)過(guò)你的人,他甚至沒(méi)有聽(tīng)過(guò)你的名字。因此,互聯(lián)網(wǎng)資料將成為關(guān)鍵,以確保你在競(jìng)爭(zhēng)中搶占先機(jī)。目前許多培訓(xùn)網(wǎng)站提供的課程,講師都是業(yè)余愛(ài)好者或具有不到2年行業(yè)經(jīng)驗(yàn)的人士。所以,不要滿足于低價(jià)課程,在互聯(lián)網(wǎng)上,一分耕耘一分收獲。如果這是你理想的職業(yè)領(lǐng)域,初期投資肯定會(huì)有更多的長(zhǎng)期回報(bào)。
記得保持終身學(xué)習(xí)的態(tài)度。 機(jī)器學(xué)習(xí)和AI是以驚人速度發(fā)展的領(lǐng)域。訂閱RSS源和在線資源,讓你了解領(lǐng)域的最新發(fā)展,這是必須要做的事情。隨時(shí)跟進(jìn)最新的研究最能體現(xiàn)你的卓越追求,這些可以通過(guò)Feedly和Inoreader之類的閱讀應(yīng)用程序輕松完成。學(xué)習(xí)可能是你在大學(xué)里做的事情,但掌握是你一生所追求的目標(biāo),別輕易放棄。如果你可以按照文中提到的那樣來(lái)完善自己,你一定可以獲得自己理想的工作。最后,再次強(qiáng)調(diào),一定要特別注意在GitHub上的數(shù)據(jù)科學(xué)作品集,可以幫助你在競(jìng)爭(zhēng)中脫穎而出!
聯(lián)系客服