交叉验证1

发表于2025-03-28|更新于2025-03-28|辉夜の编程之路

|字数总计:393|阅读时长:1分钟|阅读量:

拟合情况

泛化能力：模型对于未见过数据的预测能力（使用测试集）
比如有500组数据，可以用400组用于训练，即训练集，剩下100组作为测试集。
模型误差：
- 偏差大：多次训练，训练集平均拟合不好。离得太大了。
- 方差大：多次训练，测试集上效果抖动厉害。在测试集对比时，上下抖动太厉害。
- 泛化误差 = 偏差+误差+噪声，偏差小方差小才是好模型。
欠拟合与过拟合：
- 欠拟合：模型在训练集上拟合的不好。还没上测试集的时候就已经表现出明显拟合欠缺。
- 过拟合：模型在训练集上拟合的很好，但在测试集上拟合的不好。
- 好的模型应该对训练集和测试集的拟合上都很好。

交叉验证

原理
等分后，进行训练，将测试结果（mse）保存，最后平均，得到总的结果。如果结果差→偏差大，波动大→方差大
交叉验证
实际操作中，可以先73分，作为训练集测试集，进行测试，没必要完全使用交叉验证。

模型调参的评估指标——模型在具体问题上的适用性

MSE：真实值与预测值的差的平方和/N；RMSE：MSE开根；MAE：如图；
SSr：预测Y点到真实Y平均值的距离；SST：实际Y点到真实Y平均值的距离。
R方接近于1更好，MSE越接近于0越好。

<center>适用性

适用性

交叉验证1

https://www.noctuna.cc/2025/03/28/Cross-validation1/

作者

Noctuna

发布于

2025-03-28

更新于

2025-03-28

许可协议

CC BY-NC-SA 4.0

人工智能机器学习回归模型

相关推荐

正则化线性回归1

正则化线性回归2

决策树模型1

数据库加载中