需要确定的参数:
1. training set的大小m。
2. regularization parameter λ 。
3. 多项式的项数 θ 的数目n。
4. *在神经网络中还可以优化神经网络层数
优化方法:
1. 把data set分成三部分,比例是training set: 60%,CV set: 20%,test set: 20%。
2. 用training set确定最优 θ 。
3. 用CV set 确定需要选择的参数m, λ 或n。
4. 用test set 验证优化后的machine learning模型的最终效果。
优化方式选择:
high bias(underfitting):more features, smaller λ
high variance(overfitting):larger training set, fewer features, larger λ