ML 变形器“训练结果”(Training Results)窗口会显示一个包含训练误差率的图表,使您可以识别训练期间影响变形器性能的趋势,例如过度拟合。
打开 ML 变形器“训练结果”(Training Results)窗口
ML 变形器“训练结果”(Training Results)窗口
蓝色线显示训练数据点,橙色线显示验证数据点。
将光标悬停在数据点上可查看各次训练的数据。
过度拟合是一种机器学习概念,当预测结果与现有数据过于相似时会出现过度拟合。当预测模型在训练数据中学习太多细节时,将很难应用到新数据。
举个简单的例子:假设有一条规则按颜色对苹果和桔子进行分类,其中任何红色水果都将标记为“Apple”,而任何橙色水果都将标记为“Orange”。如果该过程遇到绿色苹果,则规则可能会错误地将其标识为“Orange”。出现识别错误是因为规则对初始数据过于严格,无法处理新数据:绿色苹果。这个示例属于过度拟合,说明在进行预测时需要使用多个变量。
在学习过程中,数据可能过度拟合的一个迹象是训练数据与验证数据的误差率之间存在差距。上面的屏幕截图显示了一个明显的过度拟合示例,其中训练数据点和验证数据点之间的差距很大。