天天看点

machine learning参数确定

需要确定的参数:

1. training set的大小m。

2. regularization parameter λ 。

3. 多项式的项数 θ 的数目n。

4. *在神经网络中还可以优化神经网络层数

优化方法:

1. 把data set分成三部分,比例是training set: 60%,CV set: 20%,test set: 20%。

2. 用training set确定最优 θ 。

3. 用CV set 确定需要选择的参数m, λ 或n。

4. 用test set 验证优化后的machine learning模型的最终效果。

优化方式选择:

high bias(underfitting):more features, smaller λ

high variance(overfitting):larger training set, fewer features, larger λ

继续阅读