天天看點

K-近鄰算法簡介

學習目标

  • 目标
    • 了解什麼是KNN算法
    • 知道KNN算法求解過程

1 什麼是K-近鄰算法

K-近鄰算法簡介
  • 根據你的“鄰居”來推斷出你的類别

1.1 K-近鄰算法(KNN)概念

K Nearest Neighbor算法又叫KNN算法,這個算法是機器學習裡面一個比較經典的算法, 總體來說KNN算法是相對比較容易了解的算法

  • 定義

如果一個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數屬于某一個類别,則該樣本也屬于這個類别。

來源:KNN算法最早是由Cover和Hart提出的一種分類算法
  • 距離公式

兩個樣本的距離可以通過如下公式計算,又叫歐式距離 ,關于距離公式會在後面進行讨論

K-近鄰算法簡介
K-近鄰算法簡介

1.2 電影類型分析

假設我們現在有幾部電影

K-近鄰算法簡介

其中? 号電影不知道類别,如何去預測?我們可以利用K近鄰算法的思想

K-近鄰算法簡介

分别計算每個電影和被預測電影的距離,然後求解

K-近鄰算法簡介

1.3 KNN算法流程總結

1)計算已知類别資料集中的點與目前點之間的距離

2)按距離遞增次序排序

3)選取與目前點距離最小的k個點

4)統計前k個點所在的類别出現的頻率

5)傳回前k個點出現頻率最高的類别作為目前點的預測分類

2 小結

  • K-近鄰算法簡介【了解】
    • 定義:就是通過你的"鄰居"來判斷你屬于哪個類别
    • 如何計算你到你的"鄰居"的距離:一般時候,都是使用歐氏距離

繼續閱讀