天天看點

《從機器學習談起》讀書摘要

本文是對《從機器學習談起》一文的讀書摘要,這片文章很詳細的介紹了機器學習,很适合入門新手讀(我就是)

1. 什麼是機器學習

機器學習是一種讓計算機利用資料而不是指令來進行各種工作的方法

機器學習方法是計算機利用已有的資料(經驗),得出了某種模型,并利用此模型預測未來的一種方法

2. 機器學習的定義

從廣義上來說,機器學習是一種能夠賦予機器學習的能力以此讓它完成直接程式設計無法完成的功能的方法。

從實踐的意義上來說,機器學習是一種通過利用資料,訓練出模型,然後使用模型預測的一種方法。

機器學習界“資料為王”, 一般來說(不是絕對),資料越多,最後機器學習生成的模型預測的效果越好

“訓練”産生“模型”,“模型”指導 “預測”

3. 機器學習的範圍

模式識别=機器學習 模式識别源自工業界,而機器學習來自于計算機學科

統計學習近似等于機器學習

資料挖掘=機器學習+資料庫 大部分資料挖掘中的算法是機器學習的算法在資料庫中的優化

計算機視覺=圖像處理+機器學習

語音識别=語音處理+機器學習

自然語言處理=文本處理+機器學習

4. 機器學習的方法

1、回歸算法

線性回歸 處理的是數值問題,預測出的結果是數字 “最小二乘法” “數值計算” “梯度下降”以及“牛頓法”

邏輯回歸 預測結果是離散的分類, 邏輯回歸隻是對對線性回歸的計算結果加上了一個Sigmoid函數,将數值結果轉化為了0到1之間的機率

資料 “标簽” “特征”

2、神經網絡

也稱之為人工神經網絡,ANN, 分解與整合 生物科學成分

輸入層,接收信号

隐藏層,對資料的分解與處理

輸出層

神經元 -> 層 -> 神經網絡

神經元: 處理單元事實上就是一個邏輯回歸模型

3、SVM(支援向量機)

支援向量機算法從某種意義上來說是邏輯回歸算法的強化, 數學成分

高斯“核” 是一種特殊的函數 最典型的特征就是可以将低維的空間映射到高維的空間。

4、聚類算法

K-Means算法

5、降維算法(無監督學習算法)

主要特征是将資料從高維降低到低維層次

主要作用是壓縮資料與提升機器學習其他算法的效率

資料的可視化

PCA算法(即主成分分析算法)

6、推薦算法

推薦算法較為特殊,既不屬于監督學習,也不屬于非監督學習,是單獨的一類

一類是基于物品内容的推薦: 每個物品都需要貼标簽,是以工作量較大

一類是基于使用者相似度的推薦

協同過濾算法

7、其他

高斯判别,樸素貝葉斯,決策樹

梯度下降法,主要運用線上型回歸,邏輯回歸,神經網絡,推薦算法中

牛頓法,主要運用線上型回歸中;

BP算法,主要運用在神經網絡中;

SMO算法,主要運用在SVM中

8、分類

按照訓練的資料有無标簽分類

監督算法:訓練資料都是包含标簽

無監督算: 訓練資料都是不含标簽

監督學習算法:

線性回歸,邏輯回歸,神經網絡,SVM

無監督學習算法:

聚類算法,降維算法

特殊算法:

推薦算法

5. 機器學習的應用–大資料

大資料并不等同于機器學習,同理,機器學習也不等同于大資料。

大資料中包含有分布式計算,記憶體資料庫,多元分析等等多種技術

大資料也包含以下四種分析方法:

 1.大資料,小分析:即資料倉庫領域的OLAP分析思路,也就是多元分析思想。

 2.大資料,大分析:這個代表的就是資料挖掘與機器學習分析法。

 3.流式分析:這個主要指的是事件驅動架構。

 4.查詢分析:經典代表是NoSQL資料庫。

分布式計算Map-Reduce

機器學習模型的資料越多,機器學習的預測的效率就越好

成功的機器學習應用不是擁有最好的算法,而是擁有最多的資料!

6. 機器學習的子類–深度學習

深度學習:傳統的神經網絡發展到了多隐藏層的情況

1.多隐層的神經網絡具有優異的特征學習能力,學習得到的特征對資料有更本質的刻畫,進而有利于可視化或分類;

2.深度神經網絡在訓練上的難度,可以通過“逐層初始化” 來有效克服。

具有多個隐藏層的神經網絡被稱為深度神經網絡,基于深度神經網絡的學習研究稱之為深度學習

7. 機器學習的父類–人工智能(AI)

發展階段:從早期的機器學習推理,到中期的專家系統,現在的機器學習

智慧是對生活的感悟,是對人生的積澱與思考

機器學習的思想:通過經驗擷取規律,指導人生與未來。沒有經驗就沒有智慧。

深度學習屬于機器學習的子類, 機器學習是人工智能子類

《從機器學習談起》讀書摘要

8. 機器學習的思考–計算機的潛意識

明意識 “吾日三省吾身”

潛意識

闡述一個觀點時,用一個事實,或者一個故事,比大段的道理要好很多

9. 總結

機器學習的核心思想:統計和歸納

機器學習的真正應用不是通過概念或者思想的方式,而是通過實踐。隻有當把機器學習技術真正應用時,才可算是對機器學習的了解進入了一個層次。

參考:

  1. 從機器學習談起