[TOC]

概述

模型性能的评价

在监督学习中,已知样本$(x_1, y_1),(x_2, y_2),…,(x_n, y_n)$,要求拟合出一个模型(函数) $\hat{f}$ ,其预测值 $\hat{f}(x) $与样本实际值 y 的误差最小。

考虑到样本数据其实是采样, $y$ 并不是真实值本身,假设真实模型(函数)是$ f $,则采样值$ y=f(x)+\varepsilon$ ,其中 $\varepsilon$ 代表噪音,其均值为0,方差为$ \sigma^2$ 。

拟合函数 $\hat{f} $的主要目的是希望它能对新的样本进行预测,所以,拟合出函数$ \hat{f}$ 后,需要在测试集(训练时未见过的数据)上检测其预测值与实际值 $y$ 之间的误差。可以采用平方误差函数(mean squared error)来度量其拟合的好坏程度,即$ (y-\hat{f}(x))^2$