交叉验证(Cross-validation)是一种常用的机器学习模型评估方法,目的是用来验证机器学习模型的泛化能力。在交叉验证中,将原始数据分为训练集和测试集,然后在训练集上训练模型,在测试集上测试模型性能,得到一个测试误差。重复这个过程多次,每次选择不同的训练集和测试集,得到多个测试误差,最终对这些测试误差进行平均,作为模型的性能评估指标。
交叉验证的目的是避免模型对某一数据集过拟合(Overfitting),即模型在训练数据上表现良好,但在测试数据上表现很差的情况。通过交叉验证,可以评估模型的泛化能力,提高模型的鲁棒性。常用的交叉验证方法包括 K-fold 交叉验证、Leave-one-out 交叉验证等。