留出法 (hold-out)直接将数据集 $D$ 分成互斥的两个集合,作为训练集 $S$ 与测试集 $T$ ,使用 $S$ 训练模型,使用 $T$ 进行测试误差。如果从采样的角度看待数据集合划分,则保留类别比例的采样方法叫做“分层采样”(stratified sampling),也就是保持每个 label 的数据在训练集与测试集的比例不变。为了提高模型测试的保真性(fidelity),我们经常取出

- 阅读全文 -