Coursera機器學習基石筆記week3

Types of Learning

Learning with Different Output Space Y

機器學習按照輸出空間劃分的話，包括二進制分類、多元分類、回歸、結構化學習等不同的類型。其中二進制分類和回歸是最基礎、最核心的兩個類型。

Learning with Different Data Label

如果我們拿到的訓練樣本D既有輸入特征x，也有輸出yn，那麼我們把這種類型的學習稱為監督式學習（Supervised Learning）。監督式學習可以是二進制分類、多元分類或者是回歸，最重要的是知道輸出标簽yn。

與監督式學習相對立的另一種類型是非監督式學習（Unsupervised learning）。非監督式學習是沒有輸出标簽yn的，典型的非監督式學習包括：聚類（clustering）問題，比如對網頁上新聞的自動分類；密度估計，比如交通路況分析；異常檢測，比如使用者網絡流量監測。

介于監督式和非監督式學習之間的叫做半監督式學習（Semi-supervised Learning）。顧名思義，半監督式學習就是說一部分資料有輸出标簽yn，而另一部分資料沒有輸出标簽yn。在實際應用中，半監督式學習有時候是必須的，比如醫藥公司對某些藥物進行檢測，考慮到成本和實驗人群限制等問題，隻有一部分資料有輸出标簽yn。

除此之外，還有一種非常重要的類型：增強學習（Reinforcement Learning）。增強學習中，我們給模型或系統一些輸入，但是給不了我們希望的真實的輸出y，根據模型的輸出回報，如果回報結果良好，更接近真實輸出，就給其正向激勵，如果回報結果不好，偏離真實輸出，就給其反向激勵。不斷通過“回報-修正”這種形式，一步一步讓模型學習的更好，這就是增強學習的核心所在。

Learning with Different Protocol

batch learning是一種常見的類型。batch learning獲得的訓練資料D是一批的，即一次性拿到整個D，對其進行學習模組化，得到我們最終的機器學習模型。batch learning在實際應用中最為廣泛。

online是一種線上學習模型，資料是實時更新的，根據資料一個個進來，同步更新我們的算法。比如線上郵件過濾系統，根據一封一封郵件的内容，根據目前算法判斷是否為垃圾郵件，再根據使用者回報，及時更新目前算法。這是一個動态的過程。之前我們介紹的PLA和增強學習都可以使用online模型。

active learning是近些年來新出現的一種機器學習類型，即讓機器具備主動問問題的能力，例如手寫數字識别，機器自己生成一個數字或者對它不确定的手寫字主動提問。active learning優勢之一是在擷取樣本label比較困難的時候，可以節約時間和成本，隻對一些重要的label提出需求。

Learning with Different Input Space

這部分，我們将談談輸入X有哪些類型。

輸入X的第一種類型就是concrete features。比如說硬币分類問題中硬币的尺寸、重量等；比如疾病診斷中的病人資訊等具體特征。concrete features對機器學習來說最容易了解和使用。

第二種類型是raw features。比如說手寫數字識别中每個數字所在圖檔的mxn維像素值；比如語音信号的頻譜等。raw features一般比較抽象，經常需要人或者機器來轉換為其對應的concrete features，這個轉換的過程就是Feature Transform。

第三種類型是abstract features。比如某購物網站做購買預測時，提供給參賽者的是抽象加密過的資料編号或者ID，這些特征X完全是抽象的，沒有實際的實體含義。是以對于機器學習來說是比較困難的，需要對特征進行更多的轉換和提取。

簡單總結一下，根據輸入X類型不同，可以分為concetet, raw, abstract。将一些抽象的特征轉換為具體的特征，是機器學習過程中非常重要的一個環節。在《機器學習技法》課程中，會再詳細介紹。

總結

Coursera機器學習基石筆記week3

Coursera機器學習基石筆記week3

Types of Learning

Learning with Different Output Space Y

Learning with Different Data Label

Learning with Different Protocol

Learning with Different Input Space

總結

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告