机器学习笔记7 高偏差/低偏差,学习曲线,模型选择
Andrew Ng cs229 Machine Learning 笔记
原文:https://share.coursera.org/wiki/index.php/ML:Advice_for_Applying_Machine_Learning
面对一个机器学习问题,我们提取好特征,挑选好训练集,选择一种机器学习算法,然后学习预测得到了第一步结果。然而我们不幸地发现,在测试集上的准确率低得离谱,误差高得吓人,要提高准确率、减少误差的话,下一步该做些什么呢?
可以采用以下的方法来减少预测的误差:
- 获得更多的训练样本
- 减少特征的数量
- 增加特征的数量
- 使用多项式特征
- 增大或减小正则化参数$\lambda$
但不要盲目在这些可行的方法里随便选一种来提升模型,需要用一些诊断模型的技术来帮助我们选择使用哪种策略。