[TOC]

概述

模型性能的评价

在监督学习中，已知样本$(x_1, y_1),(x_2, y_2),…,(x_n, y_n)$，要求拟合出一个模型（函数） $\hat{f}$ ，其预测值 $\hat{f}(x) $与样本实际值 y 的误差最小。

考虑到样本数据其实是采样， $y$ 并不是真实值本身，假设真实模型（函数）是$ f $，则采样值$ y=f(x)+\varepsilon$ ，其中 $\varepsilon$ 代表噪音，其均值为0，方差为$ \sigma^2$ 。

拟合函数 $\hat{f} $的主要目的是希望它能对新的样本进行预测，所以，拟合出函数$ \hat{f}$ 后，需要在测试集（训练时未见过的数据）上检测其预测值与实际值 $y$ 之间的误差。可以采用平方误差函数（mean squared error）来度量其拟合的好坏程度，即$ (y-\hat{f}(x))^2$