機器學習 A-Z

這些參考學習書籍将會幫助你全面建立機器學習的知識架構，并且在Python和R裡建構不同的機器學習模型。

通過這些參考學習書籍的學習，你将能夠學習到以下技能，提升你的職場競争力：

完全掌握機器學習及在Python和R裡的應用
深刻了解各種機器學習的模型
做出準确的預測和強大的分析
利用機器學習創造更多價值
利用機器學習解決私人問題
掌握并熟練處理強大的算法，例如強化學習，自然語言處理，還有深度學習
掌握并熟練處理先進的技術，例如對降低資料次元
了解對不同的問題怎樣選擇合适的機器學習模型
建立起強大的機器學習知識架構，并且知道如何建立和運用不同的模型來解決任何問題
掌握 Python 和 R 上的機器學習
對許多機器學習模型有很好的直覺
做出準确的預測和強大的分析
建立可靠的機器學習模型
為您的業務創造強大的附加值
将機器學習用于個人目的
處理特定主題，如強化學習、NLP 和深度學習
處理降維等進階技術
了解為每種類型的問題選擇哪種機器學習模型
建構強大的機器學習模型大軍，并知道如何将它們組合起來解決任何問題

如果你對機器學習領域感興趣？那麼這些參考學習書籍将适合你！

這些參考學習書籍由專業資料科學家設計，在書中他們在分享他們的專業知識，并以簡單的方式幫助您學習複雜的理論、算法和編碼庫。

這些書籍将逐漸引導您進入機器學習的世界。通過每一本書的學習，您将發展新技能并提高您對資料科學這個具有挑戰性但利潤豐厚的子領域的了解。

這些書籍既有趣又令人興奮，但與此同時，我們深入研究了機器學習。它的結構如下：

第 1 部分 - 資料預處理
第 2 部分 - 回歸：簡單線性回歸、多元線性回歸、多項式回歸
第 3 部分 - 分類：邏輯回歸、SVM、核 SVM、樸素貝葉斯、決策樹分類、随機森林分類
第 4 部分 - 聚類：K 均值
第 5 部分 - 關聯規則學習：先驗
第 6 部分 - 強化學習：置信上限，湯普森抽樣
第 7 部分 - 自然語言處理：NLP 的詞袋模型和算法
第 8 部分 - 深度學習：人工神經網絡、卷積神經網絡
第 9 部分 - 降維：PCA、核心 PCA
第 10 部分 - 模型選擇和提升：k 折疊交叉驗證，網格搜尋。

此外，有些書籍中還包含基于現實生活中示例的實踐練習。是以，您不僅可以學習理論，還可以獲得一些建構自己的模型的動手實踐。

這些參考學習書籍面向哪些人：

所有對機器學習感興趣的人
任何有高中數學知識并且想開始學習機器學習的學生
任何有機器學習基本知識并想了解更多這個領域的人
任何不太了解程式設計但對機器學習感興趣，并希望将機器學習應用在資料上的人
任何想進入資料科學領域的大學生
任何想提高機器學習技能的資料分析師
任何對目前工作不滿意并想成為資料科學家的人
任何希望運用強大的機器學習工具擴大自己事業的人
任何對機器學習感興趣的人。
至少具有高中數學知識并希望開始學習機器學習的學生。
任何了解機器學習基礎知識的中級人員，包括線性回歸或邏輯回歸等經典算法，但想要了解更多并探索機器學習的所有不同領域。
任何對編碼不太熟悉但對機器學習感興趣并希望将其輕松應用于資料集的人。
任何想要開始資料科學職業生涯的大學學生。
任何想要在機器學習中更新的資料分析師。
任何對自己的工作不滿意并想成為資料科學家的人。
任何想要通過使用強大的機器學習工具為其業務創造附加值的人。

機器學習的參考學習書籍介紹：

《土木工程師的機率機器學習》

《土木工程師的機率機器學習》

為土木工程專業的學生和專業人士介紹機率機器學習的關鍵概念和技術;有許多分步示例、插圖和練習。

本書向土木工程專業的學生和專業人士介紹了機率機器學習概念，本書以一種沒有統計學或者計算機科學專業背景的讀者能夠了解的方式介紹關鍵方法和技術。它通過分步示例、插圖和練習清晰直接地介紹了不同的方法。掌握了這些材料後，讀者将能夠了解本書所借鑒的更進階的機器學習文獻。

本書介紹了機率機器學習三個子領域的關鍵方法：監督學習、無監督學習和強化學習。它首先涵蓋了了解機器學習所需的背景知識，包括線性代數和機率論。它繼續提出貝葉斯估計，這是監督和無監督學習方法的制定背後的理論，以及馬爾可夫鍊蒙特卡羅方法，它在某些複雜情況下能夠進行貝葉斯估計。然後，本書介紹了與監督學習相關的方法，包括回歸方法和分類方法，以及與無監督學習相關的概念，包括聚類、降維、貝葉斯網絡、狀态空間模型和模型校準。最後，本書介紹了不确定背景下的理性決策和不确定和順序背景下的理性決策的基本概念。在此基礎上，本書描述了強化學習的基礎知識，虛拟代理在與環境互動時學習如何通過反複試驗來做出最佳決策。

《機器學習在高風險中的應用：負責任的AI技術》

過去十年見證了人工智能和機器學習（AI/ML）技術的廣泛采用。然而，由于缺乏對廣泛實施的監督，導緻了有害後果，而這些後果本來可以通過适當的監督來避免。在我們實作AI / ML的真正好處之前，從業者必須了解如何降低其風險。

本書介紹了負責任的AI，這是一種改進AI / ML技術，業務流程和文化能力的整體方法，它建立在風險管理，網絡安全，資料隐私和應用社會科學方面的最佳實踐之上。這是一項雄心勃勃的事業，需要多樣化的才能、經驗和觀點。資料科學家和非技術監督人員都需要被招募并授權來審計和評估高影響力的 AI/ML 系統。作者帕特裡克·霍爾（Patrick Hall）為新一代審計員和評估員建立了本指南，他們希望使AI系統更好地為組織，消費者和廣大公衆服務。

本書的主要内容：

了解如何建立成功且有影響力的負責任的AI實踐
擷取有關采用 AI 技術的現有标準、法律和評估的指南
了解公司的現有角色如何演變以納入負責任的AI
檢查實施負責任 AI 的業務最佳實踐和建議
了解在系統開發的各個階段實作負責任 AI 的技術方法

《機器學習在地下能源資源管理中的應用：最新技術和未來預測》

在許多應用科學和工程學科（包括地能源）中，利用機器學習（ML）技術來了解隐藏模式并從複雜的多變量資料集建構資料驅動的預測模型正在迅速增加。在這些發展的推動下，《地下能源資源管理中的機器學習應用》展示了管理地下能源資源（例如石油和天然氣、地質碳封存和地熱能）的 ML 應用程式的最新技術和未來前景的目前快照。

本書的關鍵特色：

涵蓋多個應用領域（油藏表征、鑽井、生産、油藏模組化和預測性維護）的 ML 應用

提供代表營運公司、大學和研究機構的作者的各種觀點

提供一系列案例研究，說明幾種 ML 技術的最新應用

包括每個應用領域的文獻綜述和未來展望

本書面向有興趣廣泛了解多個地下領域的ML應用的實踐石油工程師或地球科學家。它還旨在作為研究所學生課程的補充閱讀，也将吸引從事水文地質學和核廢料處理的專業人員和研究人員。

《使用Spark擴充機器學習：使用 MLlib、TensorFlow 和 PyTorch的分布式機器學習》

快速了解 Apache Spark，這是用于大規模資料處理（包括機器學習和分析）的流行引擎。如果您希望使用 MLlib、分布式 PyTorch 和分布式 TensorFlow 擴充您的技能組合或在可擴充機器學習方面推進您的職業生涯，那麼本實用指南适合您。

使用 Spark 作為主要資料處理平台，您将發現幾種為豐富 Spark 的 ML 功能而設計和建構的開源技術。《Scaling Machine Learning with Spark（使用Spark擴充機器學習）》研究了基于 Apache Spark 生态系統建構端到端分布式 ML 工作流的各種技術，包括 Spark MLlib、MLFlow、TensorFlow、PyTorch 和 Petastorm。

本書向您展示了何時使用每種技術以及為什麼使用。如果你是一名使用機器學習的資料科學家，你将學習到如何：

建構實用的分布式機器學習工作流，包括特征工程和資料格式
通過橋接到分布式 TensorFlow 和 PyTorch 将深度學習功能擴充到 Spark 之外
使用 MLFlow 管理機器學習試驗生命周期
使用 Petastorm 作為存儲層，将資料從 Spark 橋接到 TensorFlow 和 PyTorch
使用機器學習術語來了解分布政策

《使用 Scikit-Learn、Keras 和 TensorFlow 動手的機器學習：建構智能系統的概念、工具和技術，第3版》

通過最近的一系列突破，深度學習推動了整個機器學習領域的發展。現在，即使是對這項技術幾乎一無所知的程式員也可以使用簡單、高效的工具來實作能夠從資料中學習的程式。這本暢銷書使用具體的例子、最小的理論和生産就緒的 Python 架構——scikit-learn、Keras 和 TensorFlow——來幫助你直覺地了解建構智能系統的概念和工具。

在更新的第三版中，作者Aurelien Geron探索了一系列技術，從簡單的線性回歸開始，發展到深度神經網絡。本書中的大量代碼示例和練習可幫助您應用所學知識。程式設計經驗是入門所需的全部内容。

本書的主要内容：

使用 scikit-learn 端到端跟蹤示例機器學習項目
探索多種模型，包括支援向量機、決策樹、随機森林和內建方法
利用無監督學習技術，如降維、聚類和異常檢測
深入了解神經網絡架構，包括卷積網絡、循環網絡、生成對抗網絡和轉換器
使用 TensorFlow 和 Keras 為計算機建構和訓練神經網絡視覺、自然語言處理、生成模型和深度強化學習
使用多個 GPU 訓練神經網絡，并使用 Google 的 Vertex AI 大規模部署它們

《可再生能源和現代混合動力系統的物聯網、機器學習和區塊鍊技術》

這本經過編輯的書籍包括描述可再生能源和現代混合動力系統的物聯網、機器學習和區塊鍊技術的章節，并附有仿真示例和案例研究。

閱讀本書後，使用者将通過仿真執行個體和案例研究，了解物聯網、機器學習技術、區塊鍊技術等最新技術，以及這些技術在可再生能源資源和現代混合動力系統中的應用。

《Python 中的動手資料預處理：了解如何有效地為成功的資料分析準備資料》

清理原始資料并準備好進行處理，以設計更好的資料分析解決方案

本書的主要特點

培養執行資料清理、資料內建、資料縮減和資料轉換的技能
通過強大的資料轉換和處理技術充分利用原始資料
執行徹底的資料清理，包括處理缺失值和異常值

本書的内容簡介

動手資料預處理是一本關于最佳資料清理和預處理技術的入門書，由一位開發過資料預處理和相關主題的大學水準課程的專家撰寫。

通過本書，您将從多個角度配備最佳的資料預處理技術，確定您從資料中獲得最佳見解。

您将了解資料預處理的不同技術和分析方面 - 資料收集，資料清理，資料內建，資料縮減和資料轉換 - 并掌握使用開源Python程式設計環境實作它們。

動手示例和易于遵循的章節将幫助您全面闡明資料預處理、原因和方式，并确定資料分析可以導緻更有效決策的機會。随着本章的深入，您還将了解資料管理系統和技術在有效分析中的作用，以及如何使用 API 提取資料。

在你學習這本 Python 資料預處理書籍結束時，您将能夠使用 Python 來讀取、操作和分析資料;執行資料清理、內建、縮減和轉換技術，并處理異常值或缺失值，以便有效地為分析工具準備資料。

你将學到什麼

使用 Python 對資料執行分析功能
了解資料庫的角色以及如何有效地從資料庫中提取資料
執行由分析目标定義的資料預處理步驟
識别并解決資料內建挑戰
确定資料縮減的需求并執行它
發現通過資料轉換改進分析的機會

這本書是為誰寫的

本書面向希望對大量資料進行預處理和資料清理的初級和進階資料分析師、商業智能專業人員、工程大學生和資料愛好者。您不需要任何資料預處理經驗即可開始使用本書。但是，基本的程式設計技能（例如使用變量、條件和循環）以及 Python 的初學者知識和簡單的分析經驗是先決條件。

本書的目錄

回顧NumPy和Pandas的核心子產品
回顧另一個核心子產品 - Matplotlib
資料 – 它到底是什麼？
資料庫
資料可視化
預測
分類
聚類分析
資料清理級别 I - 清理表
資料清理級别 II - 解包、重組和重新制定表
資料清理級别 III - 缺失值、異常值和錯誤
資料融合與資料內建
資料縮減
資料轉換和處理
案例研究 1 - 科技行業的心理健康
案例研究 2 - 預測 COVID-19 住院情況
案例研究3：美國縣聚類分析
總結、實踐案例研究和結論

《自然語言處理精裝的深度學習研究應用》

人類擁有最先進的交流方式，即自然語言。雖然人類可以使用計算機互相發送語音和文本消息，但計算機天生不知道如何處理自然語言。近年來，深度學習主要改變了人工智能（AI）各個領域的觀點，包括語音、視覺和自然語言處理（NLP）。深度學習在各種應用中的廣泛成功已成為人工智能許多下遊任務的基準。

近年來，由于深度學習和神經網絡的進步，計算機視覺領域取得了巨大的飛躍，在與檢測和标記對象相關的任務中超過了人類。《自然語言處理的深度學習研究應用》解釋了自然語言處理（NLP），語音和計算機視覺領域的概念和最先進的研究。它提供了将 Python 中的工具和庫用于實際應用程式的見解。涵蓋深度學習算法、神經網絡和進階預測等主題，這個首要的參考書籍是計算語言學家、軟體工程師、IT 經理、計算機科學家、高等教育學生和教師、圖書館、研究人員和院士的絕佳資源。

《自然語言處理項目：使用 AI 技術建構下一代 NLP 應用程式》

利用機器學習和深度學習技術建構成熟的自然語言處理（NLP）項目。本書中的項目越來越複雜，并展示了解決各種業務問題的方法、優化提示和技巧。您将使用現代 Python 庫和算法來建構端到端 NLP 項目。

本書首先概述了自然語言處理（NLP）和人工智能，以快速複習算法。接下來，它涵蓋了從傳統算法開始的端到端 NLP 項目和項目，例如客戶評論情緒和情感檢測、主題模組化和文檔聚類。從那裡，它深入研究與電子商務相關的項目，例如使用産品描述進行産品分類，檢索相關内容的搜尋引擎以及基于内容的推薦系統以增強使用者體驗。展望未來，它解釋了如何使用上下文嵌入建構系統來查找相似的句子，使用遞歸神經網絡（RNN）總結大量文檔，使用長短期記憶網絡（LSTM）自動單詞建議，以及如何使用遷移學習建構聊天機器人。最後，它探索了研究領域的下一代人工智能和算法。

在本書結束時，您将掌握使用NLP技術解決各種業務問題所需的知識。

通過本書您将學到什麼：

使用 Python 實作成熟的智能 NLP 應用程式
使用 NLP 技術翻譯文本資料上的實際業務問題
利用機器學習和深度學習技術執行智能語言處理
獲得實施端到端搜尋引擎資訊檢索、文本摘要、聊天機器人、文本生成、文檔聚類和産品分類等的實踐經驗

本書适合的讀者對象：

希望使用 Python建構自然語言應用程式的資料科學家、機器學習工程師和深度學習專業人員

《自動駕駛汽車的應用深度學習和計算機視覺：使用深度神經網絡和行為克隆技術建構自動駕駛汽車》

使用深度學習和人工智能技術和庫（如 TensorFlow、Keras 和 OpenCV）來探索自動駕駛汽車技術；

本書的主要特點

建構和訓練強大的神經網絡模型以建構自動駕駛汽車
實施計算機視覺、深度學習和 AI 技術來建立汽車算法
克服使用現代 Python 庫和架構實作駕駛不同方面的自動化時面臨的挑戰

本書的内容簡介

由于最近的一些突破，自動駕駛汽車技術現在是人工智能領域的一個新興主題，并将資料科學家的重點轉移到制造将改變汽車行業的自動駕駛汽車上。本書是使用深度學習和計算機視覺技術開發自動駕駛汽車的綜合指南。

本書将從自動駕駛汽車（SDC）的基礎知識開始，帶您了解啟動和運作建構自動駕駛汽車所需的深度神經網絡技術。一旦你熟悉了基礎知識，你将深入研究先進的計算機視覺技術，并學習如何使用深度學習方法來執行各種計算機視覺任務，如查找車道線、改進圖像分類等。您将探索語義分割模型的基本結構和工作原理，并掌握使用語義分割檢測汽車。本書還涵蓋了進階應用，例如使用OpenCV的行為克隆和車輛檢測，遷移學習和深度學習方法，以訓練SDC模仿人類駕駛。

在本書結束時，您将學習如何實作各種神經網絡，以使用現代Python庫開發自己的自動駕駛汽車。

通過本書你将學到什麼

使用 Keras 庫從頭開始實作深度神經網絡
了解深度學習在自動駕駛汽車中的重要性
掌握使用 OpenCV 庫處理圖像中的特征提取技術
設計檢測視訊中車道線的軟體管道
實作交通信号标志的卷積神經網絡（CNN）圖像分類器
通過在虛拟模拟器中駕駛汽車來訓練和測試神經網絡的行為克隆
探索各種最先進的語義分割和對象檢測架構

這本書是為誰寫的

如果你是一名深度學習工程師、人工智能研究員，或者任何希望實作深度學習和計算機視覺技術來建構自動駕駛藍圖解決方案的人，這本書适合你。任何想了解如何建構各種汽車相關算法的人也會發現這本書很有用。Python程式設計經驗以及對深度學習的基本了解對于充分利用本書是必要的。

本書的目錄

自動駕駛汽車的基礎
深入了解深度神經網絡
使用 Keras 實作深度學習模型
自動駕駛汽車的計算機視覺
使用 OpenCV 查找道路标記
使用 CNN 改進圖像分類器
使用深度學習檢測路标
語義分割的原則和基礎
語義分割的實作
使用深度學習的行為克隆
使用 OpenCV 和深度學習進行車輛檢測
後續步驟

機器學習技術介紹和參考學習書籍介紹

機器學習 A-Z

《土木工程師的機率機器學習》

《機器學習在高風險中的應用：負責任的AI技術》

《機器學習在地下能源資源管理中的應用：最新技術和未來預測》

《使用Spark擴充機器學習：使用 MLlib、TensorFlow 和 PyTorch的分布式機器學習》

《使用 Scikit-Learn、Keras 和 TensorFlow 動手的機器學習：建構智能系統的概念、工具和技術，第3版》

《可再生能源和現代混合動力系統的物聯網、機器學習和區塊鍊技術》

《Python 中的動手資料預處理：了解如何有效地為成功的資料分析準備資料》

《自然語言處理精裝的深度學習研究應用》

《自然語言處理項目：使用 AI 技術建構下一代 NLP 應用程式》

《自動駕駛汽車的應用深度學習和計算機視覺：使用深度神經網絡和行為克隆技術建構自動駕駛汽車》

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告