每個人都有自己的學習方式。書籍對于一個人的吸引力是任何其他學習媒介所不能給予的。不過,關于數據科學的書籍多之又多,從何選擇?從何開始?有哪些書適合學習一種特定的技術或者領域?本文列出了按照不同領域劃分的27本必讀的書籍。
統(tǒng)計學類書籍
1. Statistics in Plain English
作者:Timothy C. Urdan
這本書完全是為小白寫的,通俗易懂。寫作風格和提供的解釋都與書名相對應——Statistics in Plain English。你可以把他們推薦給沒有任何技術背景的人。
2. Think Stats: Probability and Statistics for Programmers
作者:Allen B. Downey
你會發(fā)現這本書出現在眾多數據科學書籍清單里。這本書里的資源很豐富,在這本書里有很多數據文件、代碼和解決方案等。對于有Python基礎的人來講,這些都非常實用,這些計算機語言被用于驗證真實世界的案例。
3. Introduction to Statistical Learning
作者: Gareth James, Daniela Witten, Trevor Hastie和Robert Tibshirani
這本書非常經典,涵蓋了基本的統(tǒng)計學知識和機器學習技術。關于這本書最好的部分是每一個概念都在R語言中用案例進行解釋。所以,一旦你掌握編程,你就可以對每一個概念進行檢驗。還有比多次實踐更能檢驗概念的方法嗎?
概率類書籍
1. Probability: For the Enthusiastic Beginner
作者:David Morin
對于初學者來說,這本書是一個理想的選擇。這本書是面向大學生的,所以如果想要學習概率,你絕對會很喜歡這本書的寫作方式。這本書涵蓋了所有的基本概念——組合學、概率規(guī)則、貝葉斯定理、期望值、方差、概率密度、共同分布、大數定律、中心極限定理、相關性和回歸。
2. Introduction to Probability
作者:J. Laurie Snell和Charles Miller Grinstead
這本是也是一本入門級別的書,涵蓋了基本的概率概念。與上一本書一樣,這本書是面向大學生的綜合性的書。如果想要從頭開始學習概率,這本書就是最好的選擇,它面向從未涉及過這個領域的人。
3. An Introduction to Probability Theory and its Applications
作者:William Feller
正如封面所描述的,這本書是關于概率理論的理論和實踐應用的指南。如果你想深入了解概率,強烈推薦你讀這本書。這本書或許不太適合初學者,因為它的內容非常綜合。如果你學習概率只是為了進行到數據科學的領域,那么你可以讀推薦的以上兩本書。
機器學習類書籍
1. The Hundred-Page Machine Learning Book
作者:Andriy Burkov
Andriy Burkov在100多頁的內容里將諸多復雜的內容介紹清楚了。這本書寫得非常好,通俗易懂,連意見領袖Peter Norvig也對它進行了推薦。無論你是初學者還是已經有基礎的人,每一位數據科學家都應該讀一讀這本書。
2. Machine Learning
作者:Tom Mitchell
在所有宣傳之前,Tom Mitchell關于機器學習的書是理解各種技術和算法背后的數學的首選文本。在看這本書之前建議你先學習數學。但是,你不需要人工智能或統(tǒng)計數據的任何背景來理解這些概念。
3. Elements of Statistical Learning
作者:Trevor Hastie, Robert Tibshirani和Jerome Friedman
這本書非常經典,是由Hastie 和Tibsharani寫的。它是對Introduction to Statistical Learning一書的承接。雖然這本書有一些重疊,但這本書的內容更加高級,主要是關于機器學習算法、神經網絡、矩陣分解、譜聚類等主題的。
深度學習類書籍
1. Deep Learning
作者: Ian Goodfellow, Yoshua Bengio和Aaron Courville
Deep Learning一書被廣泛認為是初學者的最佳資源。它分為三個部分:應用數學和機器學習基礎,現代實踐深度學習框架和深度學習研究。它是迄今為止深度學習社區(qū)中被引用最多的書籍。把它放在床邊,經常翻閱——無論何時開始深度學習之旅,這本書都值得一讀。
2. Deep Learning with Python
作者:Francois Chollet
學習深度學習(或機器學習)的一種非常酷的方法是通過理論進行編程,這就是Francois Chollet在Deep Learning with Python一書中所遵循的方法。概念都是通過流行的Keras庫來進行將解釋的,Francois是Keras的創(chuàng)造者,所以誰更好地教你這個話題?建議在推特上關注Francois——我們可以向他學習很多東西。
3. Neural Networks and Deep Learning
作者:Michael Nielsen
這是一本免費的在線書籍,旨在了解支持深度學習的核心組件——神經網絡。 它提供了一種實用的教學方法,并從初學者的角度審視深度學習主題。你不會在本書中學習任何編程語言——它是一本關于神經網絡背后隱含見解的老式教科書。
自然語言處理類書籍
1. Natural Language Processing with Python
作者:Steven Bird, Ewan Klein和Edward Loper
你將獲得原本不具備的Python概念,并使用NLTK庫(Natural Language Toolkit)瀏覽自然語言處理的世界。雖然這不是你學習自然語言處理的唯一資源,但它提供了相當不錯的主題介紹。
2. Foundations of Statistical Natural Language Processing
作者:Christopher Manning和Hinrich Schutze
這本書出版于大約二十多年前,但內容非常經典。它是自然語言處理子領域的全面指南,如文本分類、詞性標注、概率分析以及其他各種事物。作者對數學和語言基礎進行了嚴謹的描述。這本書的內容非常詳細。
3. Speech and Language Processing
作者:Daniel Jurafsky和James H. Martin
本書的重點是自然語言和言語范圍內的實際應用和科學評價。閱讀這本書主要是為了擴展視野,也可以看一下語音識別。這是一個現在蓬勃發(fā)展的研究領域,每天都有大量的應用程序出現。Jurafsky和Martin撰寫了一本關于自然語言處理和計算語言學的深入研究。
計算機視覺類書籍
1. Computer Vision: Algorithms and Applications
作者:Richard Szeliski
本書介紹了一些常見的計算機視覺技術,尤其是用于分析和解釋圖像的技術。這本書已經出版了九年,但Richard Szeliski所示的例子和方法也適用于今天。這是一個全面的文本,采用科學的方法來解決基本的視覺挑戰(zhàn)。
2. Programming Computer Vision with Python
作者:Jan Erik Solem
在深入研究這本很棒的書之前,請訪問網站http://programmingcomputervision.com/下載數據集,代碼筆記本并復制提到的GitHub存儲庫。它們是計算機視覺介紹的絕佳伴侶。正如作者所述,“當你運用Python時,你將學習物體識別、三維重建、立體成像、增強現實和其他計算機視覺應用技術。”
3. Computer Vision: Models, Learning, and Inference
作者:Dr. Simon J.D. Prince
本書從頭開始向我們介紹概率的概念,并由此拓展。雖然這里介紹的一些框架已經出現了更多高級版本,但本書仍然與當前背景相關。本書已經引入了70多種算法,通過350多個插圖進行了精美的補充。
人工智能類書籍
1. Artificial Intelligence: A Modern Approach
作者:Stuart Russell和Peter Norvig
這本書是由Stuart Russell和Peter Norvig所寫的。這本書在人工智能學習領域非常有影響力。100多個國家的1300多所大學都將這本書列入其課程中。這本書非常具有深度,有1100多頁,涉及到的人工智能領域的內容也很豐富,包括語言識別、自動駕駛、機器翻譯、視覺學習等其他內容。這本書可以被視為人工智能領域的圣經。
2. Artificial Intelligence for Humans
作者:Jeff Heaton
人工智能背后有哪些基礎算法?這本書在222頁的篇幅中探究了很多深度技術。這是關于人工智能背后技術的一系列書籍的第1卷(維度、距離度量、聚類、誤差計算、爬山、Nelder Mead和線性回歸)。還有一個附帶的站點,其中包含書中引用的示例和包含代碼的GitHub存儲庫。
3. The Master Algorithm
作者:Pedro Domingos
如果你想看關于人工智能的技術書籍,這本書就不是最佳選擇了。但是,它是關于機器學習如何重塑商業(yè)、政治、科學和戰(zhàn)爭的精辟文本。這是一本深思熟慮且發(fā)人深省的書,介紹了人工智能現在的位置,以及它最終可能會在哪些領域取代人類,我們是否會找到能夠從數據中驅動所有知識的單一算法(或“主算法”)。
工具和語言類書籍
Python類書籍
1. Fluent Python: Clear, Concise, and Effective Programming
作者:Luciano Ramalho
正如你對編程書籍所期待的那樣,這是一本指南,能夠幫助你理解Python是如何運作的,如何寫出漂亮有效的Python代碼。Luciano Ramalho還列舉出了很有使用的資源庫,在一些數據科學項目中非常實用。這本書有794頁,內容非常豐富。
2. Programming Python: Powerful Object-Oriented Programming
聯系客服