您的位置:首页 > 游戏 > 游戏 > 购物网站建设的原理_开发微信微商城_关键词挖掘ppt_拼多多关键词优化步骤

购物网站建设的原理_开发微信微商城_关键词挖掘ppt_拼多多关键词优化步骤

2025/4/24 22:15:23 来源:https://blog.csdn.net/IT_ORACLE/article/details/144338131  浏览:    关键词:购物网站建设的原理_开发微信微商城_关键词挖掘ppt_拼多多关键词优化步骤
购物网站建设的原理_开发微信微商城_关键词挖掘ppt_拼多多关键词优化步骤

 调整 R^2(Adjusted R^2)概念及详细解释

调整 R^2 是回归分析中的一个指标,用于评估回归模型的拟合优度。与标准 R^2 不同,调整 R^2 引入了对模型复杂度的惩罚,以避免因加入过多变量而导致的虚高拟合效果。


1. 标准 R^2

标准 R^2(决定系数)定义为:

R^2 = 1 - \frac{\text{SSR}}{\text{SST}}

其中:

  • SSR 是残差平方和(Sum of Squares for Residuals),衡量模型未能解释的误差;
  • SST 是总平方和(Total Sum of Squares),衡量数据的总变异性;
  • 1 - \frac{\text{SSR}}{\text{SST}}​表示模型解释的变异比例。

问题:标准 R^2 随着模型中自变量数量的增加而单调不减,甚至当增加的变量对解释力无贡献时,R^2 也可能上升,容易导致过拟合。


2. 调整 R^2

调整 R^2 修正了标准 R^2 的缺陷,通过引入模型自由度(自变量数量)对 R^2 进行调整,使得它对模型复杂度更敏感:

\text{Adjusted } R^2 = 1 - \left( \frac{\text{SSR} / (n - k - 1)}{\text{SST} / (n - 1)} \right)

等价于:

\text{Adjusted } R^2 = 1 - (1 - R^2) \cdot \frac{n - 1}{n - k - 1}

其中:

  • n 是样本数量;
  • k 是自变量数量;
  • n−k−1 是自由度。

解释

  • 调整 R^2 考虑了模型自由度(样本数量与自变量数量的关系),如果加入的自变量对模型没有显著贡献,调整 R^2 可能会减小。
  • 当 k 增加(自变量数量增多)时,调整 R^2 对模型复杂度进行惩罚,鼓励更简洁的模型。

3. 性质与特点

  • 范围:调整 R^2 的值通常小于或等于 R^2,但不会大于1(可能为负数,当模型表现很差时)。
  • 变量筛选:调整 R^2 更适合作为变量筛选和模型选择的标准,避免因加入无效变量而虚高的拟合效果。
  • 模型比较:对于不同的回归模型,调整 R^2 提供了更公平的比较基础,尤其是当模型的自变量数量不同。

4. 优缺点

优点
  1. 避免过拟合:通过对模型复杂度的惩罚,有效避免过拟合问题。
  2. 公平比较:可比较不同复杂度的模型拟合效果。
缺点
  1. 灵敏度:对样本数量和自变量数量非常敏感,样本量不足时,调整 R^2 的可靠性可能下降。
  2. 解释性:尽管调整 R^2 有助于评估模型,但它并不直接说明预测性能。

5. 调整 R^2 的应用场景

  • 变量选择:用于衡量新增变量是否显著提高模型解释力。
  • 模型评价:比较多个回归模型的拟合效果,选择调整 R^2 较高的模型。
  • 模型简化:评估减少变量后的模型是否依然具有良好的拟合性能。

6. Python 示例代码

以下代码展示如何计算标准 R^2 和调整 R^2

import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score# 示例数据
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([1.1, 2.0, 2.9, 4.1, 5.1])# 回归模型
model = LinearRegression()
model.fit(X, y)# 标准 R^2
r2 = r2_score(y, model.predict(X))# 样本数和自变量数
n = len(y)  # 样本数
k = X.shape[1]  # 自变量数# 调整 R^2
adjusted_r2 = 1 - (1 - r2) * (n - 1) / (n - k - 1)print(f"标准 R^2: {r2:.4f}")
print(f"调整 R^2: {adjusted_r2:.4f}")

输出结果

标准 R^2: 0.9970
调整 R^2: 0.9960

7. 总结

调整 R^2 是回归模型评估中的重要指标,能够平衡模型的拟合优度和复杂度。通过引入惩罚项,它在选择最优模型时尤为有效。与标准 R^2 相比,调整 R^2 更适合多变量回归分析,并能帮助我们避免过拟合风险。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com