天天看點

簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分

簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分

初級或中級算法崗面試題主要有四類:數理統計基礎、機器學習模型原理、程式設計能力、項目經驗。項目經驗因人而異,是以僅總結前三個方面的基礎知識,分享給朋友。(進階或資深算法崗面試内容不在本文範圍内)

1.大數定律

弱大數定律:獨立同分布的n個随機變量,當n充分大時,n個随機變量的均值依機率收斂于數學期望值,即可以用均值代替數學期望值。

伯努利大數定理:獨立重複試驗次數足夠大時,事件A發生的頻率收斂于機率。注:以上為口頭簡述,非标準化的數學表述。

2.中心極限定理

n個獨立同分布的随機變量,當n充分大時,其均值服從正态分布。注:以上為口頭簡述,非标準化的數學表述。

3.條件機率/分布律(乘法公式)

P(A|B)=P(AB)/P(B),演化式P(A|B)*P(B)=P(B|A)*P(A)

4.全機率公式

P(A)= P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn),其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。

5.貝葉斯公式

P(Bi|A)= P(A|Bi)*P(Bi)/[P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn)],其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。

6. 常見三大正态抽樣分布
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
7. 參數檢驗(總體分布已知的情況下,對參數取值的檢驗)
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
8. 非參數檢驗(總體分布形式未知情況下的檢驗)
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
(3) 偏度、峰度檢驗
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
9. 置信區間
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分

注:單側置信區間省略

10. 模型拟合優度
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分

(4)A/Btest Score

(5)殘差檢驗:一般要求殘差分布接近正态分布。

寫在最後:原理和思想很重要,一定要了解透徹!!! “數學算法的世界”專注資料分析、資料科學技能傳播,後期會陸續推出資料分析、資料科學面試題彙總系列文章,敬請關注!
簡述isodata算法的原理_算法常見面試題彙總(一):機率論與數理統計部分
往期回顧 在資料分析/科學中的競争力如何?一張圖幫你讀懂資料科學需要掌握的技能 抖音日活3.2億,可能有 3.3億使用者在同一天内使用抖音嗎?(泊松分布的Python實作) 常見資料分析(Python)面試題(一) 什麼影響了你的工資?方差分析告訴你 我放棄了國企工作,轉行做了資料分析