[ML] 均方误差、方差、均方差
来源:网友推荐 更新:2025-05-17
线性回归中,目标是寻找参数,以使得对训练集的真实值与预测值之间的均方误差最小。均方误差(MSE),作为预测结果衡量指标,计算为预测值与真实值之差的平方和的平均值。
均方误差的公式为:(真实值 - 预测值)^2 / 数据数量
均方差,即标准差,描述数据集的离散程度,它是方差的算术平方根。方差通过计算样本实际值与样本平均值之差的平方和的平均值来定义。
方差公式:(样本实际值 - 样本平均值)^2 / 数据数量
标准差公式:方差的算术平方根
标准差和方差都用于度量数据集的离散程度。值得注意的是,标准差亦有定义为:(样本实际值 - 样本平均值)^2 / (数据数量 - 1) 的形式,这在统计学中称为样本标准差。
在编程中,MATLAB 默认采用此定义计算标准差。若想计算总体标准差,可设置参数 w = 1。Python 的 Numpy 默认采用数据数量 N 计算标准差,可通过设置 ddof=1 来得到样本标准差的计算结果。
均方误差的公式为:(真实值 - 预测值)^2 / 数据数量
均方差,即标准差,描述数据集的离散程度,它是方差的算术平方根。方差通过计算样本实际值与样本平均值之差的平方和的平均值来定义。
方差公式:(样本实际值 - 样本平均值)^2 / 数据数量
标准差公式:方差的算术平方根
标准差和方差都用于度量数据集的离散程度。值得注意的是,标准差亦有定义为:(样本实际值 - 样本平均值)^2 / (数据数量 - 1) 的形式,这在统计学中称为样本标准差。
在编程中,MATLAB 默认采用此定义计算标准差。若想计算总体标准差,可设置参数 w = 1。Python 的 Numpy 默认采用数据数量 N 计算标准差,可通过设置 ddof=1 来得到样本标准差的计算结果。