交叉验证是在机器学习建立模型和验证模型参数时常用的办法。交叉验证,顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的某样本在下次可能成为测试集中的样本,即所谓“交叉”。
那么什么时候才需要交叉验证呢?交叉验证用在数据不是很充足的时候。比如在我日常项目里面,对于普通适中问题,如果数据样本量小于一万条,我们就会采用交叉验证来训练优化选择模型。如果样本大于一万条的话,我们一般随机的把数据分成三份,一份为训练集(Training Set),一份为验证集(Validation Set),最后一份为测试集(Test Set)。用训练集来训练模型,用验证集来评估模型预测的好坏和选择模型及其对应的参数。把最终
继续阅读与本文标签相同的文章
上一篇 :
Scikit-Learn决策树算法类库使用小结
下一篇 :
漫谈分布式计算框架
-
随着RPA的发展,人类将越来越多地退居二线
2026-05-21栏目: 教程
-
Qt编写自定义控件7-自定义可拖动多边形
2026-05-21栏目: 教程
-
Qt编写自定义控件8-动画按钮组控件
2026-05-21栏目: 教程
-
Qt编写自定义控件9-导航按钮控件
2026-05-21栏目: 教程
-
Qt编写自定义控件10-云台仪表盘
2026-05-21栏目: 教程
