天天看點

書籍:python機器學習集合Cookbook Ensemble Machine Learning Cookbook - 2019

簡介

使用Keras,H2O,Scikit-Learn,Pandas等實作機器學習算法來建構集合模型

主要特點

  • 使用基于配方的方法應用流行的機器學習算法
  • 實施增強,裝袋和堆疊集合方法以改進機器學習模型
  • 發現真實世界的合奏應用,并在Kaggle比賽中遇到複雜的挑戰

集合模組化是一種用于提高機器學習模型性能的方法。它結合了兩個或多個相似或不同的機器學習算法,以提供卓越的智力。本書将幫助您實作流行的機器學習算法,以涵蓋不同的內建機器學習範例,如增強,裝袋和堆疊。

Ensemble Machine Learning Cookbook将首先讓您熟悉內建技術和探索性資料分析的基礎知識。然後,您将學習如何實作與統計和機器學習算法相關的任務,以了解多個異構算法的集合。它還将確定您不會錯過關鍵主題,例如重新采樣方法。随着您的進步,您将更好地了解套袋,增強,堆疊以及使用真實世界示例使用随機森林算法。本書将重點介紹這些集合方法如何使用多個模型來改善機器學習結果,與單個模型相比。在最後的章節中,您将深入研究使用神經網絡,自然語言處理等的進階內建模型。您還可以實施欺詐檢測,文本分類和情緒分析等模型。

在本書的最後,您将能夠利用內建技術和機器學習算法的工作機制,使用單獨的配方建構智能模型。

你會學到什麼

  • 了解如何将機器學習算法用于回歸和分類問題
  • 實施內建技術,例如平均,權重平均和最大投票
  • 掌握先進的整體方法,例如自舉,裝袋和堆疊
  • 使用随機森林進行分類和回歸等任務
  • 實作同構和異構機器學習算法的集合
  • 學習并實施各種提升技術,例如AdaBoost,Gradient Boosting Machine和XGBoost

這本書的目的是誰

本書專為資料科學家,機器學習開發人員和深度學習愛好者而設計,他們希望深入研究機器學習算法,以建構強大的內建模型。 Python程式設計和基本統計​​的工作知識是幫助您掌握本書概念的必要條件。

參考資料