初級或中級算法崗面試題主要有四類:數理統計基礎、機器學習模型原理、程式設計能力、項目經驗。項目經驗因人而異,是以僅總結前三個方面的基礎知識,分享給朋友。(進階或資深算法崗面試内容不在本文範圍内)
1.大數定律弱大數定律:獨立同分布的n個随機變量,當n充分大時,n個随機變量的均值依機率收斂于數學期望值,即可以用均值代替數學期望值。
伯努利大數定理:獨立重複試驗次數足夠大時,事件A發生的頻率收斂于機率。注:以上為口頭簡述,非标準化的數學表述。
2.中心極限定理n個獨立同分布的随機變量,當n充分大時,其均值服從正态分布。注:以上為口頭簡述,非标準化的數學表述。
3.條件機率/分布律(乘法公式)P(A|B)=P(AB)/P(B),演化式P(A|B)*P(B)=P(B|A)*P(A)
4.全機率公式P(A)= P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn),其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。
5.貝葉斯公式P(Bi|A)= P(A|Bi)*P(Bi)/[P(A|B1)+P(A|B2)+P(A|B3)+…+P(A|Bn)],其中A為樣本空間的事件,B1、B2、B3…Bn為樣本空間的一個劃分。
6. 常見三大正态抽樣分布 7. 參數檢驗(總體分布已知的情況下,對參數取值的檢驗) 8. 非參數檢驗(總體分布形式未知情況下的檢驗) (3) 偏度、峰度檢驗 9. 置信區間注:單側置信區間省略
10. 模型拟合優度(4)A/Btest Score
(5)殘差檢驗:一般要求殘差分布接近正态分布。
寫在最後:原理和思想很重要,一定要了解透徹!!! “數學算法的世界”專注資料分析、資料科學技能傳播,後期會陸續推出資料分析、資料科學面試題彙總系列文章,敬請關注! 往期回顧 在資料分析/科學中的競争力如何?一張圖幫你讀懂資料科學需要掌握的技能 抖音日活3.2億,可能有 3.3億使用者在同一天内使用抖音嗎?(泊松分布的Python實作) 常見資料分析(Python)面試題(一) 什麼影響了你的工資?方差分析告訴你 我放棄了國企工作,轉行做了資料分析