“ 2019年已過去10天,回顧2018年,大家看過幾本跟專業(yè)相關的書?也可以給大家推薦一下你看過覺得很不錯的專業(yè)書。
今天學術哥先為大家推薦10本機器學習和數(shù)據(jù)科學的書籍,待大家收藏消化后,下周再為大家推薦另外10本。
PDF版本已為大家下載好
后臺回復“20190111”即可獲取
只能在線閱讀的書籍已附上地址
廢話不多說,正文開始。
1.Python Data Science Handbook
作者: Jake VanderPlas
簡介:
本書介紹了在Python中處理數(shù)據(jù)所必需的核心庫:特別是NumPy,Pandas,Matplotlib,Scikit-Learn和相關軟件包。
如果你需要快速了解語言本身,請參閱免費的入門項目, A Whirlwind Tour of Python:它是針對研究人員和科學家的Python語言的快節(jié)奏介紹。
2.Neural Networks and Deep Learning
作者:Michael Nielsen
簡介:
這是一本免費的在線書籍,神經(jīng)網(wǎng)絡和深度學習目前為圖像識別,語音識別和自然語言處理中的許多問題提供了最佳解決方案。本書將教您神經(jīng)網(wǎng)絡和深度學習背后的許多核心概念。
在線閱讀網(wǎng)址:http://neuralnetworksanddeeplearning.com/
3.Think Bayes
作者:Allen B. Downey
簡介:
Think Bayes是使用計算方法對貝葉斯統(tǒng)計的介紹。
本書以及Think X系列中的其他書籍的前提是:如果您知道如何編程,則可以使用該技能來學習其他主題。
大多數(shù)關于貝葉斯統(tǒng)計的書籍都使用數(shù)學符號,并根據(jù)微積分等數(shù)學概念提出想法。本書使用Python代碼而不是數(shù)學,并且使用離散近似而不是連續(xù)數(shù)學。因此,數(shù)學書中的積分將成為求和,并且大多數(shù)關于概率分布的操作都是簡單的循環(huán)。
4.Machine Learning & Big Data
作者:By Kareem Alkaseer
簡介:
其背后的目的是在理論和實現(xiàn)之間取得平衡,以便軟件工程師能夠輕松地實現(xiàn)機器學習模型,而無需過多依賴庫。
大多數(shù)情況下,模型或技術背后的概念是簡單或直觀的,但它會在細節(jié)或術語中丟失。此外,大多數(shù)情況下現(xiàn)有的庫可以解決手頭的問題,但它們被視為黑盒子,而且往往它們有自己的抽象和架構隱藏了潛在的概念。本書的目的是使基本概念清晰明了。
在線閱讀網(wǎng)址:http://www.kareemalkaseer.com/books/ml
5.Statistical Learning with Sparsity: The Lasso and Generalizations
作者:Trevor Hastie,;Robert Tibshirani,;Martin Wainwright
簡介:
這本書總結了正在快速發(fā)展的具有稀疏性的統(tǒng)計學習領域。 稀疏統(tǒng)計模型是一個具有少量非零參數(shù)或權重的模型。 它代表了一種經(jīng)典的“少即是多”的思想,即稀疏模型比稠密的模型更容易估計和解釋。在這個大數(shù)據(jù)時代,特征空間可能很大,而稀疏性假設可以幫助我們解決這些問題,并從大數(shù)據(jù)集中提取有用且可重現(xiàn)的特征模式。
6.Statistical inference for data science
作者:Brian Caffo
簡介:
本書是作為數(shù)據(jù)科學專業(yè)化的一部分編寫的統(tǒng)計推理課程的配套書。但是,如果你不上課,這本書大多是獨立的。本書的一個有用組成部分是一系列包含Coursera課程的YouTube視頻。
本書旨在成為統(tǒng)計推斷這一重要領域的低成本介紹。目標受眾是具有數(shù)學和計算知識的學生,他們希望將這些技能用于數(shù)據(jù)科學或統(tǒng)計學。這本書是免費提供的github上的一系列降價文件,以及LeanPub和零售店的更方便的形式(epub,mobi)。
在線閱讀網(wǎng)址:https://leanpub.com/LittleInferenceBook
7. Convex Optimization
作者: Stephen Boyd an; Lieven Vandenberghe
簡介:
本書是關于凸優(yōu)化的,這是一類特殊的數(shù)學優(yōu)化問題,包括最小二乘和線性規(guī)劃問題。眾所周知,最小二乘和線性規(guī)劃問題具有相當完整的理論,出現(xiàn)在各種應用中,并且可以非常有效地在數(shù)值上求解。本書的基本觀點是,對于更大類的凸優(yōu)化問題也可以這樣說。
8.Natural Language Processing with Python
作者:Steven Bird; Ewan Klein,;Edward Loper
簡介:
這是一本關于自然語言處理的書。“自然語言”是指用于人類日常交流的語言; 英語,印地語或葡萄牙語等語言。與人工語言(如編程語言和數(shù)學符號)相比,自然語言在代代相傳的過程中不斷發(fā)展,并且很難用明確的規(guī)則來確定。我們將從廣義上講自然語言處理 - 或簡稱NLP - 涵蓋任何類型的自然語言的計算機操作...
本書基于Python編程語言和一個名為Natural Language Toolkit(NLTK)的開源庫。
在線閱讀網(wǎng)址:https://www.nltk.org/book/
9.Automate the Boring Stuff with Python
作者:Al Sweigart
簡介:
如果你曾經(jīng)花費數(shù)小時重命名文件或更新數(shù)百個電子表格單元格,那么你就知道這些繁瑣的任務是多么繁瑣。但是如果你能讓讓你的電腦來做這些,是不是就可以省去很多工作呢?
在使用Python自動化無聊的東西時,你將學習如何使用Python編寫程序,這些程序可以在幾分鐘內完成耗時的手動操作- 無需任何先前的編程經(jīng)驗。一旦掌握了編程的基礎知識,你就可以創(chuàng)建Python程序,輕松地執(zhí)行有用且令人印象深刻的自動化功能。
在線閱讀網(wǎng)址:https://automatetheboringstuff.com/
10.Social Media Mining: An Introduction
作者:Reza Zafarani;Mohammad Ali Abbasi ; Huan Liu
簡介:
過去十年社交媒體的發(fā)展徹底改變了個人互動和行業(yè)開展業(yè)務的方式。通過社交媒體交互,共享和消費內容,個人以前所未有的速度生成數(shù)據(jù)。理解和處理這種新型數(shù)據(jù)以收集可操作的模式,為跨學科研究,新算法和工具開發(fā)提供了挑戰(zhàn)和機遇。社交媒體挖掘集成了社交媒體、社交網(wǎng)絡分析和數(shù)據(jù)挖掘,為學生、從業(yè)者、研究人員和項目經(jīng)理提供了一個方便,連貫的平臺,以了解社交媒體挖掘的基礎和潛力。
聯(lián)系客服