测试一波回归模型的误差
如何衡量一个线性回归模型准确性
上一篇文章讲了怎么使用线性回归来预测,但是没有对这个模型的性能和准确性进行有效评估。
一般来讲,误差越小,预测就越准确。但是如果误差过于小,也要考虑是否过度拟合。
下面几个指标是用来衡量一个模型的误差大小:
平均绝对误差(Mean Absolute Error,简称 MAE)
它的数学公式是:
scikit-learn 里对应的函数如下:
复制代码
其中 y_true 是真实的目标值,y_pred 是预测目标值。MAE 越小,说明模型的预测能力越好。
均方误差(Mean Squared Error,简称 MSE)
它的数学公式是:
mean_squared_error(y_true, y_pred)MSE 越小,表示模型的预测值与实际观测值之间的差异较小,即模型具有较高的预测精度。
均方对数误差(Mean Squared Log Error,简称 MSLE):
mean_squared_log_error(y_true, y_pred)MSLE 的值越小,表示预测结果与真实值的差异越小,即模型的拟合程度越好。
绝对误差中值(Median Absolute Error,简称 MedAE):
median_absolute_error(y_true, y_pred)
MedAE 越小的模型,通常意味着它在大多数数据点上的预测更为准确。
实际使用中我用得最多的是 MSE 和 MEdAE 以及 r2 score(它用来描述自变量和因变量的关联性,通常值为 0-1 之间),具体代码如下所示:
复制代码
文章转载自:freephp
评论