學習目标
- 目标
- 了解什麼是KNN算法
- 知道KNN算法求解過程
1 什麼是K-近鄰算法
- 根據你的“鄰居”來推斷出你的類别
1.1 K-近鄰算法(KNN)概念
K Nearest Neighbor算法又叫KNN算法,這個算法是機器學習裡面一個比較經典的算法, 總體來說KNN算法是相對比較容易了解的算法
- 定義
如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數屬于某一個類别,則該樣本也屬于這個類别。
來源:KNN算法最早是由Cover和Hart提出的一種分類算法
- 距離公式
兩個樣本的距離可以通過如下公式計算,又叫歐式距離 ,關于距離公式會在後面進行讨論
1.2 電影類型分析
假設我們現在有幾部電影
其中? 号電影不知道類别,如何去預測?我們可以利用K近鄰算法的思想
分别計算每個電影和被預測電影的距離,然後求解
1.3 KNN算法流程總結
1)計算已知類别資料集中的點與目前點之間的距離
2)按距離遞增次序排序
3)選取與目前點距離最小的k個點
4)統計前k個點所在的類别出現的頻率
5)傳回前k個點出現頻率最高的類别作為目前點的預測分類
2 小結
- K-近鄰算法簡介【了解】
- 定義:就是通過你的"鄰居"來判斷你屬于哪個類别
- 如何計算你到你的"鄰居"的距離:一般時候,都是使用歐氏距離