您的位置:首页 > 娱乐 > 八卦 > 设计网站怎么做_软件开发方式_整合营销传播的明显特征是_网络营销软件下载

设计网站怎么做_软件开发方式_整合营销传播的明显特征是_网络营销软件下载

2024/10/5 23:28:14 来源:https://blog.csdn.net/2301_76574743/article/details/142534281  浏览:    关键词:设计网站怎么做_软件开发方式_整合营销传播的明显特征是_网络营销软件下载
设计网站怎么做_软件开发方式_整合营销传播的明显特征是_网络营销软件下载

目录

一、一元线性回归

P70-7.

1、付款时间与所购商品价值之间是否存在显著的相关关系。

表 1 回归统计表

图 1 付款时间与所购商品之间的关系图

2、计算回归模型,并做相关统计检验。

表 2 方差分析表

表 3 回归系数表

(1)回归系数的显著性检验(t检验)

(2)回归模型的显著性检验(F检验)

3、构造付款时间为3分钟时,所购商品的置信度为99%的置信区间。

(1)通过Python计算

(2)通过Excel计算:

二、多元线性回归

P71-11.

1、计算回归模型参数估计值。

表 4回归系数表

2、计算可决系数。

表 5回归统计表

3、计算D-W统计量。

(1)通过Python求解得出D-W统计量。

​编辑 (2)通过excel计算:

4、设x1=5,x2=6,构造Y的置信度为95%的预测区间。

(1)使用Python计算得出预测区间。

(2)通过excel计算得出预测区间:

附件

1、可视化


一、一元线性回归

P70-7.

某超市顾客的付款时间与所购商品之间的关系数据如下表所示:

付款时间(分钟)

3.6

4.1

0.8

5.7

3.4

1.8

4.3

0.2

2.6

1.3

商品价值()

306

305

24

422

218

62

401

20

155

65

1、付款时间与所购商品价值之间是否存在显著的相关关系。

选项卡:数据——分析——数据分析——回归

在选项框中调整相应选项。 

对于本文第7题调整置信度为99%,第11题调整置信度为95%。 

注: 关于没有这个选项的,需要在加载项种打开(勾选)。

文件——选项——加载项——分析工具库。

在分析工具库中点击转到(G):

         通过分析得出结果:

表 1 回归统计表

回归统计

Multiple R

0.967

R Square

0.935

Adjusted R Square

0.927

标准误差

41.710

观测值

10.000

图 1 付款时间与所购商品之间的关系图

        如表 1 得出,相关系数r=0.967,接近于1,说明付款时间与所购商品价值之间存在显著的相关关系,由图 1 看出付款时间与所购商品价值之间呈现明显的线性关系,即付款时间与所购商品价值之间为正相关。

2、计算回归模型,并做相关统计检验。

        通过excel求解得出如下表格。

表 2 方差分析表

项目

df

SS

MS

F

Significance F

回归分析

1

200973.665

200973.665

115.519

0.000

残差

8

13917.935

1739.742

总计

9

214891.600

表 3 回归系数表

选项

Coefficients

标准误差

t Stat

P-value

下限 99.0%

上限 99.0%

Intercept

-40.306

25.783

-1.563

0.157

-126.818

46.205

X Variable 1

85.650

7.969

10.748

0.000

58.911

112.389

        由表 3 得出回归模型为:

Y=85.650x_{1}-40.306+u_{i}

其中u_{i}为随机误差项。

(1)回归系数的显著性检验(t检验)

        截距的t检验P值为0.157,在显著性水平为0.99情况下,不拒绝原假设,说明β显著性不强。斜率的t检验P值为0.000<0.01,说明β1的显著性较强。

(2)回归模型的显著性检验(F检验)

        如表 2 所示,F检验的P值为0.000<0.01,说明方程通过F检验,模型拟合较优。

3、构造付款时间为3分钟时,所购商品的置信度为99%的置信区间。

置信区间:估计因变量的平均水平\mu _{y}

大样本:\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{\mu}}\right )

小样本:\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{\mu}}\right )

预测区间:估计某个特定的因变量y值

大样本:\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{y}}\right )

小样本:\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{y}}\right )

其中:

SE=\sqrt{\frac{\sum e_{i}^{2}}{n-k-1}}k=1

SE_{\hat{\mu}}=S E \sqrt{\frac{1}{n}+\frac{\left(x_0-\bar{x}\right)^2}{\sum\left(x_i-\bar{x}\right)^2}}, S E_{\hat{y}}=S E \sqrt{1+\frac{1}{n}+\frac{\left(x_0-\bar{x}\right)^2}{\sum\left(x_i-\bar{x}\right)^2}}

(1)通过Python计算

#%%
import pandas as pd
data = pd.read_excel(r'P70-7&71-11.xlsx', sheet_name='7')
data.head()
#%%
#计算一元线性回归的置信区间
from scipy import stats
predictors = data['付款时间(分钟)']  # 自变量数据
response = data['商品价值(元)']  # 因变量数据
# 计算斜率和截距
slope, intercept, r_value, p_value, std_err = stats.linregress(predictors, response)
print('斜率:', slope)
print('截距:', intercept)
# 计算预测值的置信区间
predict_value = slope * 3 + intercept  # 预测值
print('预测值:', predict_value)
# 计算标准误差
std_err= (sum((response - slope * predictors - intercept) ** 2) / (len(predictors) - 2))**0.5
print('标准误差:', std_err)
# 计算斜率的标准误差
std_err_miu = std_err * (1 / len(predictors) + (3 - predictors.mean()) ** 2 / (sum((predictors - predictors.mean()) ** 2))) ** 0.5
print('标准误差:', std_err_miu)
#计算t的99%分位数
t = stats.t.ppf(0.995, len(predictors) - 2)
print('t值:', t)
# 计算置信区间
lower_bound = predict_value - t * std_err_miu  # 下限公式中的0.975表示97.5%的置信水平,len(predictors) - 2表示自由度
upper_bound = predict_value + t * std_err_miu  # 上限公式同理
print('预测值的99%置信区间为:', lower_bound, '至', upper_bound)

(2)通过Excel计算:

t值计算:

置信度为99%的自由度为n-2=8的t值。

=G29*((1/10+(H37^2)/J47)^0.5)

得出付款时间为3分钟时,所购商品的置信度为99%的置信区间为:

\left [ 171.996,261.289 \right ]

:通过Python计算得出付款时间为3分钟时,所购商品的置信度为99%的预测区间为:

\left [ 69.740,363.546 \right ]

#计算一元线性回归的预测区间
std_err_y_hat = std_err * (1+1 / len(predictors) + (3 - predictors.mean()) ** 2 / (sum((predictors - predictors.mean()) ** 2))) ** 0.5
print('标准误差:', std_err_y_hat)
#计算t的99%分位数
t = stats.t.ppf(0.995, len(predictors) - 2)
print('t值:', t)
# 计算置信区间
lower_bound1 = predict_value - t * std_err_y_hat  # 下限公式中的0.975表示97.5%的置信水平,len(predictors) - 2表示自由度
upper_bound1 = predict_value + t * std_err_y_hat  # 上限公式同理
print('预测值的99%预测区间为:', lower_bound1, '至', upper_bound1)

 

=G29*((1+1/10+(H37^2)/J47)^0.5)

二、多元线性回归

P71-11.

下表是从10个地区调查得来的数据。因变量是喜欢某品牌牙膏的居民百分比,自变量则是该地区居民的人均年收入(x1,以千元计量)和关于居民受教育水平的某种量度(x2)

地区

喜欢某品牌牙膏的百分比(Y)

人均年收入(x1)

教育指数(x2)

1

61.6

6.0

6.3

2

53.2

4.4

5.5

3

65.5

9.1

3.6

4

64.9

8.1

5.8

5

72.7

9.7

6.8

6

52.2

4.8

7.9

7

50.2

7.6

4.2

8

44.0

4.4

6.0

9

53.8

9.1

2.8

10

53.5

6.7

6.7

1、计算回归模型参数估计值。

选项卡:数据——分析——数据分析——回归

在选项框中调整相应选项。 

对于本文第7题调整置信度为99%,第11题调整置信度为95%。 

注: 关于没有这个选项的,需要在加载项种打开(勾选)。

文件——选项——加载项——分析工具库。

在分析工具库中点击转到(G):

         通过分析得出结果:

表 4回归系数表

项目

Coefficients

标准误差

t Stat

P-value

Lower 95%

Upper 95%

Intercept

13.449

13.232

1.016

0.343

-17.838

44.737

X Variable 1

4.017

1.071

3.749

0.007

1.483

6.550

X Variable 2

2.812

1.379

2.040

0.081

-0.448

6.072

由表 4 得出,回归模型为:

Y=4.017x_{1}+2.812x_{2}+13.449+u_{i}

其中u_{i}为随机误差项。

2、计算可决系数。

表 5回归统计表

回归统计

Multiple R

0.817

R Square

0.668

Adjusted R Square

0.573

标准误差

5.666

观测值

10

由表 5 知可决系数R{^{2}}=0.668,在多元线性回归分析中,使用调整后的R^{2}=0.573

3、计算D-W统计量。

(1)通过Python求解得出D-W统计量。

import pandas as pd
import numpy as np
data = pd.DataFrame(pd.read_excel('P70-7&71-11.xlsx', sheet_name='11'))
x1 = np.array(data['人均年收入(x1)'])
x2 = np.array(data['教育指数(x2)'])
y = np.array(data['喜欢某品牌牙膏的百分比(Y)'])
#%%
#多元线性回归方程求解
from sklearn.linear_model import LinearRegression
model = LinearRegression()
X = np.vstack((x1, x2)).T
model.fit(X, y)
print(model.intercept_, model.coef_)#%%
#输出检验统计量summary
import statsmodels.api as sm
X = sm.add_constant(X)
model = sm.OLS(y, X).fit()print(model.summary())

 (2)通过excel计算:

=(SUM(E39:E47))/(SUM(F38:F47))

  如上图,D-W统计量为0.178。

4、x1=5,x2=6,构造Y的置信度为95%的预测区间。

置信区间:估计因变量的平均水平\mu _{y}

大样本:\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{\mu}}\right )

小样本:\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{\mu}}\right )

预测区间:估计某个特定的因变量y值

大样本:\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{y}}\right )

小样本:\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{y}}\right )

其中:

SE=\sqrt{\frac{\sum e_{i}^{2}}{n-k-1}}k=2

$\begin{gathered}S E_{\hat{\mu}}=S E \sqrt{C_0} \quad S E_{\hat{y}}=S E \sqrt{1+C_0} \\ C_0=\frac{1}{n}+\frac{\left(x_{10}-\bar{x}_1\right)^2 \sum\left(x_2-\bar{x}_2\right)^2+\left(x_{20}-\bar{x}_2\right)^2 \sum\left(x_1-\bar{x}_1\right)^2}{\sum\left(x_1-\bar{x}_1\right)^2 \sum\left(x_2-\bar{x}_2\right)^2-\left[\sum\left(x_1-\bar{x}_1\right)\left(x_2-\bar{x}_2\right)\right]^2}-2 \\ \times \frac{\left(x_{10}-\bar{x}_1\right)\left(x_{20}-\bar{x}_2\right) \sum\left(x_1-\bar{x}_1\right)\left(x_2-\bar{x}_2\right)}{\sum\left(x_1-\bar{x}_1\right)^2 \sum\left(x_2-\bar{x}_2\right)^2-\left[\sum\left(x_1-\bar{x}_1\right)\left(x_2-\bar{x}_2\right)\right]^2}\end{gathered}$

(1)使用Python计算得出预测区间。

from scipy import stats
# 计算预测值
# 计算斜率和截距
slope1 = model.params[1]
slope2 = model.params[2]
intercept = model.params[0]
print('斜率:', slope1, slope2)
print('截距:', intercept)
#%%
# 计算预测值的置信区间
predict_value = slope1 * 5 +slope2 * 6+ intercept  # 预测值
print('预测值:', predict_value)
# 计算标准误差
std_err= np.sqrt(model.mse_resid)
print('标准误差:', std_err)
# 计算斜率的标准误差
std_err_y_hat = std_err * (1+1 / len(x1) + ((5 - x1.mean())**2*sum(x2-x2.mean())**2+(6-x2.mean())**2*sum(x1-x1.mean()) ** 2) / (sum((x1 - x1.mean())**2) * sum((x2 - x2.mean())**2)-(sum((x1 - x1.mean()) * (x2 - x2.mean())))**2)-2*(5-x1.mean())*(6-x2.mean())*sum((x1-x1.mean())*(x2-x2.mean()))/(sum((x1-x1.mean())**2)*sum((x2-x2.mean())**2-(sum((x1-x1.mean())*(x2-x2.mean())))**2)))
print('标准误差:', std_err_y_hat)
p = 2  # 自变量个数
#计算t的95%分位数
t = stats.t.ppf(0.975, len(x1)- p - 1)
print('t值:', t)
# 计算置信区间
lower_bound = predict_value - t * std_err_y_hat  # 下限公式中的0.975表示97.5%的置信水平,len(predictors) - 2表示自由度
upper_bound = predict_value + t * std_err_y_hat  # 上限公式同理
print('预测值的99%预测区间为:', lower_bound, '至', upper_bound)

(2)通过excel计算得出预测区间:

t值计算:

置信度为95%的自由度为n-2=8的t值。

=G29*((1+1/10+((H38^2*J48+N38^2*(L48))/(J48*L48-(SUM(M38:M47))^2))-(2*H38*N38*SUM(M38:M47))/(J48*L48-(SUM(M38:M47))^2))^0.5)

 

通过计算得出Y的置信度为95%的预测区间为:

\left [ 35.662,65.145 \right ]

附件

1、可视化

import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
#显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
#
# Create a 3D plot
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')# Scatter plot of the data points
ax.scatter(x1, x2, y, c='#91ad9e')# Create a meshgrid for the regression plane
X1, X2 = np.meshgrid(np.linspace(x1.min(), x1.max(), 10), np.linspace(x2.min(), x2.max(), 10))
Y = intercept + slope1 * X1 + slope2 * X2# Plot the regression plane
ax.plot_surface(X1, X2, Y, alpha=0.5)# Set labels
ax.set_xlabel('人均年收入(x1)')
ax.set_ylabel('教育指数(x2)')
ax.set_zlabel('喜欢某品牌牙膏的百分比(Y)')
plt.savefig('P71-11.png')
plt.show()

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com