文章目录
- 机器学习面试题汇总
-
- 1. 必备技能
- 2.面试中问到的问题
- 3.可能问到的代码题
机器学习面试题汇总
1. 必备技能
2.面试中问到的问题
- Adam和SGD优化器哪个更好,好在哪里,哪个使模型更加容易发散?
- KNN和SVM的细节
- 离线过采样和在线过采样哪个更快?
- 如何针对已有的网络做改进,提升速度?
- 如何解决类别不平衡问题?
- 训练网络的指标,除了基本的的acc,loss,roc、auc有了解吗?
- 数据增强用过哪些
- 推导logistic回归
- bagging boosting 的区别,谁是更关注方差 ,谁是更关注偏差
- SVM, FM, 协同过滤,树
- SVM大概说一下(不用写公式)
- XGB lightgbm GBDT的关系和区别
- 模拟退火算法介绍
- lightgbm GBDT xgb,问的超级细,可能持续了7 8分钟,XGB残差怎么用一次和二次梯度求,分裂点怎么求,思想原理是什么。XGB实际使用中重要的超参数,你们比赛中用的目标函数是什么,为什么lightgbm速度更快,其并行计算如何实现(这点没回答上)
- 如何防止过拟合,项目中用过哪些手段
3.可能问到的代码题
- 实现softmax,包括init,forward,backward。
- kmeans聚类,手写
- 先问我bagging boosting 的区别,我愉快的回答了,然后题就来了,bagging 中随机有放回采样,假如一共有N个样本 采样了N次,得到N个采样数据,去重后有X个数据 求E(X),我只列出了暴力计算的方法,是有简单的我没想出来,各位大神知道的可以讲讲