基于密度峰值的聚類方法,首先定義點的①局部密度ρi②點i的距離γi
點的局部密度指的是某一點在一定範圍内附近點的數量或該數量的函數。
對于離散資料分布而言,點i的密度函數可以定義為
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsIyZuBnL1ATO3ATOwYTM2ATNwkTMwIzLc52YucWbp5GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.png)
對于連續資料分布,點i的密度函數可以利用高斯函數定義為:
點的距離:指的是在所有比某個資料點的局部密度都大的資料點中,與該資料點
之間的距離的最小值。即可以了解為将所有點的密度都求取一遍之後按照密度從大到小将資料點進行排列。點i與密度比點i大的點中最小的點的距離即為點i的距離。密度最大的點的距離定義為距離與該點最小的距離即可。