机器学习中模型选择-偏差Bias和方差Variance
[TOC]
概述
模型性能的评价
在监督学习中,已知样本$(x_1, y_1),(x_2, y_2),…,(x_n, y_n)$,要求拟合出一个模型(函数) $\hat{f}$ ,其预测值 $\hat{f}(x) $与样本实际值 y 的误差最小。
考虑到样本数据其实是采样, $y$ 并不是真实值本身,假设真实模型(函数)是$ f $,则采样值$ y=f(x)+\varepsilon$ ,其中 $\varepsilon$ 代表噪音,其均值为0,方差为$ \sigma^2$ 。
拟合函数 $\hat{f} $的主要目的是希望它能对新的样本进行预测,所以,拟合出函数$ \hat{f}$ 后,需要在测试集(训练时未见过的数据)上检测其预测值与实际值 $y$ 之间的误差。可以采用平方误差函数(mean squared error)来度量其拟合的好坏程度,即$ (y-\hat{f}(x))^2$
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 麦溪·在路上!
评论
ValineDisqus