天天看點

什麼樣的問題需要用機器學習?

機器學習第一問 --- 為什麼要用機器學習?(What can machine learn?)

答:傳統的計算機算法是定義一系列的規則,然後用規則來進行判斷,以此來解決問題,而某些問題無法用規則來進行描述。機器學習開發了另外一條道路,就像人類學習書本是書本,鉛筆是鉛筆一樣,都是通過不斷地觀察,進而得出結論,而不是根據記憶規則。

那麼什麼樣的問題需要用機器學習來解決呢?總結出來有以下三點:

1,訓練資料中有某些規律(pattern)可循

--- 比如說你無法用人的姓名來預測身高,因為姓名和身高之間并無關聯,無法找出規律,你也無法用以往的彩票中獎号碼來預測下一次的中獎号碼,因為中獎号碼完全是随機的,沒有規律可以學習到;而機器學習可以通過房子的位置,大小,年代等資訊來預測房價

2,無法輕易定義這些規律

--- 比如說識别圖像是不是一隻貓,就适合用機器學習來解決,貓的特征太多了,每隻貓的特征都不盡相同,而且每個品種的貓特征也不同,不可能做到完全概括這些規律;而識别圖像是不是一個圓,這就沒必要用機器學習了,因為描述一個圓很簡單

3,有足夠多的訓練資料可供學習(至于多少資料是足夠多,以後再說)

--- 比如說客戶在網頁停留的時間,是否點選了廣告等資料可以比較容易得獲得,因而可以有大量的資料可供我們對客戶進行分類;而判斷惡性良性腫瘤是良性的還是惡性的,則需要專業知識,此外,還需考慮到病人的隐私,是以,這類醫療資料不是那麼容易可以擷取的

繼續閱讀