在這個暑假,有興趣的可以閱讀一下這些免費的有關機器學習和資料科學的書籍,他們能給你打開一扇看清機器學習和資料科學的窗。如果在閱讀完這一文章後想知曉更多免費的好書, 請檢視本系列的前一篇 或下面的相關内容。
1.Python Data Science
Handbook
作者:Jake VanderPlas
本書介紹了在
Python 中處理資料所必需的核心庫,特别是 IPython , NumPy Pandas Matplotlib Scikit-Lean 和相關的軟體包。在此之前您需要掌握 這種語言,如果您想快速掌握這門語言,可以參閱這個針對研究人員和科學家的 語言快速入門的“Python的旋風之旅(A
Whirlwind Tour of Python)
”。 2.Neural Networks and Deep
Learning
作者:Michael Nielsen
這是一本免費的線上書籍。通過這本書你會知道神經網絡是一個美麗的生物啟發式程式設計範例,使計算機可以從觀測資料中學習。而深度學習則是一套強大的神經網絡學習技術。
目前,神經網絡和深度學習為圖像識别、語音識别和
自然語言處理(NLP) 中的問題提供了很多效果不錯的解決方案。通過這本書您将會知道更多神經網絡和深度學習背後的核心概念。 3. Think Bayes作者:Allen B.Downey
這本書主要介紹了如何使用計算方法處理
貝葉斯統計。
如果您想使用本書中的技能來學習其他技能,您需要知道如何程式設計。
是根據數學概念(如微積分)提出的,有關它的大多數書籍也都使用的是數學符号。本書使用 代碼而不是數學,是以“積分”變成了“總和”。這是書中的一個特色。 4. Machine Learning & Big Data作者:Karee Alkaseer
這本書背後的目的是為了讓軟體工程師在不依賴庫的情況下可以輕松使用機器學習模型。大多數情況下,模型或技術背後的概念很簡單、直覺,但在細節或行話中會丢失。另外,一般情況下,現有的庫可以解決手頭的問題,但是有時候它們會用自己的方式抽象和隐藏基本概念,這就是它們被稱為“黑盒子”的原因。這本書也嘗試着将“黑盒子”裡被抽象和隐藏的基本概念清晰化。它是一個還在進行中的作品,它的内容将慢慢的豐富。
5.Satistical Learning
with Sparsity:The Lasso and Generalizations
作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright
在過去的十年中,計算和資訊技術得到了迅猛發展。随着它的應用,在醫學、生物學、金融和市場營銷等領域中湧現出了大量的資料。本書在一個共同的概念架構下,闡述了這些領域中的一些重要觀點。
6.Statistical inference for data
science
作者:Brian Caffo
作為
資料科學專業 的一部分 ,本書是統計推理課程(Statistical
Inference)
的一本配套書籍。如果你沒有上這門課,也可以配着YouTube上有關視訊單獨學習這本書。
本書旨在以低成本介紹統計推理這一重要領域,使得具有程式設計能力的學生将這些技能用到資料科學或統計學當中去。
7. Convex Optimization作者:Stephen Boyd & Lieven Vandenberghe
這本書的主要内容是關于
凸優化(convex
optimization)
,這是一類特殊的數學優化問題,它包括最小二乘和線性規劃問題。衆所周知,最小二乘和線性規劃問題有一個相當完整的理論,出現在各種應用中,并且可以非常有效地用數值求解。本書的基本觀點是,對于較大類的凸優化問題也可以如此。 8. Natural Language Processing with Python作者:Steven Bird & Ewan Klein & Edward Loper
本書基于
程式設計語言和一個叫 自然語言工具包(NLTK) 的開源庫寫作而成的。“自然語言”是指用于人類日常交流的語言,與程式設計語言和數字元号等語言不同,自然語言在代代相傳的過程中不斷發展,并且很難用明确的規則來确定。為了讓計算機更好地了解自然語言,我們開發運用了 。這本書就是有關 的書。 9. Automate the Boring Stuff with作者:AI Sweigart
你是否有過為花費數小時為檔案重命名或更新表格裡的數百個單元格而煩躁的經曆?在這本書中,你将會學到如何使用
來輕松搞定這些問題。 十分好上手,一旦掌握了程式設計的基礎知識,就可以建立 程式,就此輕松解決那些繁瑣的事情。 10.Social Media
Mining: An Introduction
作者:Reza Zafarani
& Mohammad Ali Abbasi & Huan Liu
社交媒體在過去十年的發展已經徹底革新了個人互動和行業開展業務的方式。個人通過社交媒體互動、共享産生了大量的資料。
在這本書中,你将了解到
社交媒體挖掘(Social
Media Mining)
整合了社交媒體,社交網絡分析和資料挖掘,為學生、從業人員、研究人員等提供了一個友善而一緻的平台。同時也将會了解到 社交媒體挖掘(Social Media Mining) 的潛力。 數十款阿裡雲産品限時折扣中,趕緊點選領券開始雲上實踐吧! 本文由北郵 @愛可可-愛生活 老師推薦, 阿裡雲雲栖社群組織翻譯。
文章原标題《10 More Free Must-Read Books For Machine Learning
and Data Science》
作者: Matthew Mayo
譯者:烏拉烏拉,審校:袁虎。
文章為簡譯,更為詳細的内容,請檢視
原文文章