设计网站怎么做_软件开发方式_整合营销传播的明显特征是_网络营销软件下载

一、一元线性回归

P70-7.

某超市顾客的付款时间与所购商品之间的关系数据如下表所示：

付款时间(分钟)	3.6	4.1	0.8	5.7	3.4	1.8	4.3	0.2	2.6	1.3
商品价值(元)	306	305	24	422	218	62	401	20	155	65

1、付款时间与所购商品价值之间是否存在显著的相关关系。

选项卡：数据——分析——数据分析——回归

在选项框中调整相应选项。

对于本文第7题调整置信度为99%，第11题调整置信度为95%。

注：关于没有这个选项的，需要在加载项种打开（勾选）。

文件——选项——加载项——分析工具库。

在分析工具库中点击转到(G)：

通过分析得出结果：

表 1 回归统计表

回归统计
Multiple R	0.967
R Square	0.935
Adjusted R Square	0.927
标准误差	41.710
观测值	10.000

图 1 付款时间与所购商品之间的关系图

如表 1 得出，相关系数r=0.967，接近于1，说明付款时间与所购商品价值之间存在显著的相关关系，由图 1 看出付款时间与所购商品价值之间呈现明显的线性关系，即付款时间与所购商品价值之间为正相关。

2、计算回归模型，并做相关统计检验。

通过excel求解得出如下表格。

表 2 方差分析表

项目	df	SS	MS	F	Significance F
回归分析	1	200973.665	200973.665	115.519	0.000
残差	8	13917.935	1739.742
总计	9	214891.600

表 3 回归系数表

选项	Coefficients	标准误差	t Stat	P-value	下限 99.0%	上限 99.0%
Intercept	-40.306	25.783	-1.563	0.157	-126.818	46.205
X Variable 1	85.650	7.969	10.748	0.000	58.911	112.389

由表 3 得出回归模型为：

$Y=85.650x_{1}-40.306+u_{i}$

其中 $u_{i}$ 为随机误差项。

（1）回归系数的显著性检验（t检验）

截距的t检验P值为0.157，在显著性水平为0.99情况下，不拒绝原假设，说明β显著性不强。斜率的t检验P值为0.000<0.01，说明β1的显著性较强。

（2）回归模型的显著性检验（F检验）

如表 2 所示，F检验的P值为0.000<0.01，说明方程通过F检验，模型拟合较优。

3、构造付款时间为3分钟时，所购商品的置信度为99%的置信区间。

置信区间：估计因变量的平均水平 $\mu _{y}$

大样本： $\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{\mu}}\right )$

小样本： $\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{\mu}}\right )$

预测区间：估计某个特定的因变量y值

大样本： $\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{y}}\right )$

小样本： $\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{y}}\right )$

其中：

$SE=\sqrt{\frac{\sum e_{i}^{2}}{n-k-1}}$ ， $k=1$

$SE_{\hat{\mu}}=S E \sqrt{\frac{1}{n}+\frac{\left(x_0-\bar{x}\right)^2}{\sum\left(x_i-\bar{x}\right)^2}}, S E_{\hat{y}}=S E \sqrt{1+\frac{1}{n}+\frac{\left(x_0-\bar{x}\right)^2}{\sum\left(x_i-\bar{x}\right)^2}}$

(1)通过Python计算

#%%
import pandas as pd
data = pd.read_excel(r'P70-7&71-11.xlsx', sheet_name='7')
data.head()
#%%
#计算一元线性回归的置信区间
from scipy import stats
predictors = data['付款时间(分钟)']  # 自变量数据
response = data['商品价值(元)']  # 因变量数据
# 计算斜率和截距
slope, intercept, r_value, p_value, std_err = stats.linregress(predictors, response)
print('斜率:', slope)
print('截距:', intercept)
# 计算预测值的置信区间
predict_value = slope * 3 + intercept  # 预测值
print('预测值:', predict_value)
# 计算标准误差
std_err= (sum((response - slope * predictors - intercept) ** 2) / (len(predictors) - 2))**0.5
print('标准误差:', std_err)
# 计算斜率的标准误差
std_err_miu = std_err * (1 / len(predictors) + (3 - predictors.mean()) ** 2 / (sum((predictors - predictors.mean()) ** 2))) ** 0.5
print('标准误差:', std_err_miu)
#计算t的99%分位数
t = stats.t.ppf(0.995, len(predictors) - 2)
print('t值:', t)
# 计算置信区间
lower_bound = predict_value - t * std_err_miu  # 下限公式中的0.975表示97.5%的置信水平，len(predictors) - 2表示自由度
upper_bound = predict_value + t * std_err_miu  # 上限公式同理
print('预测值的99%置信区间为:', lower_bound, '至', upper_bound)

(2)通过Excel计算：

t值计算：

置信度为99%的自由度为n-2=8的t值。

=G29*((1/10+(H37^2)/J47)^0.5)

得出付款时间为3分钟时，所购商品的置信度为99%的置信区间为：

$\left [ 171.996,261.289 \right ]$

注：通过Python计算得出付款时间为3分钟时，所购商品的置信度为99%的预测区间为：

$\left [ 69.740,363.546 \right ]$

#计算一元线性回归的预测区间
std_err_y_hat = std_err * (1+1 / len(predictors) + (3 - predictors.mean()) ** 2 / (sum((predictors - predictors.mean()) ** 2))) ** 0.5
print('标准误差:', std_err_y_hat)
#计算t的99%分位数
t = stats.t.ppf(0.995, len(predictors) - 2)
print('t值:', t)
# 计算置信区间
lower_bound1 = predict_value - t * std_err_y_hat  # 下限公式中的0.975表示97.5%的置信水平，len(predictors) - 2表示自由度
upper_bound1 = predict_value + t * std_err_y_hat  # 上限公式同理
print('预测值的99%预测区间为:', lower_bound1, '至', upper_bound1)

=G29*((1+1/10+(H37^2)/J47)^0.5)

二、多元线性回归

P71-11.

下表是从10个地区调查得来的数据。因变量是喜欢某品牌牙膏的居民百分比,自变量则是该地区居民的人均年收入(x1,以千元计量)和关于居民受教育水平的某种量度(x2)。

地区	喜欢某品牌牙膏的百分比(Y)	人均年收入(x1)	教育指数(x2)
1	61.6	6.0	6.3
2	53.2	4.4	5.5
3	65.5	9.1	3.6
4	64.9	8.1	5.8
5	72.7	9.7	6.8
6	52.2	4.8	7.9
7	50.2	7.6	4.2
8	44.0	4.4	6.0
9	53.8	9.1	2.8
10	53.5	6.7	6.7

1、计算回归模型参数估计值。

选项卡：数据——分析——数据分析——回归

在选项框中调整相应选项。

对于本文第7题调整置信度为99%，第11题调整置信度为95%。

注：关于没有这个选项的，需要在加载项种打开（勾选）。

文件——选项——加载项——分析工具库。

在分析工具库中点击转到(G)：

通过分析得出结果：

表 4回归系数表

项目	Coefficients	标准误差	t Stat	P-value	Lower 95%	Upper 95%
Intercept	13.449	13.232	1.016	0.343	-17.838	44.737
X Variable 1	4.017	1.071	3.749	0.007	1.483	6.550
X Variable 2	2.812	1.379	2.040	0.081	-0.448	6.072

由表 4 得出，回归模型为：

$Y=4.017x_{1}+2.812x_{2}+13.449+u_{i}$

其中 $u_{i}$ 为随机误差项。

2、计算可决系数。

表 5回归统计表

回归统计
Multiple R	0.817
R Square	0.668
Adjusted R Square	0.573
标准误差	5.666
观测值	10

由表 5 知可决系数 $R{^{2}}=0.668$ ，在多元线性回归分析中，使用调整后的 $R^{2}=0.573$ 。

3、计算D-W统计量。

（1）通过Python求解得出D-W统计量。

import pandas as pd
import numpy as np
data = pd.DataFrame(pd.read_excel('P70-7&71-11.xlsx', sheet_name='11'))
x1 = np.array(data['人均年收入(x1)'])
x2 = np.array(data['教育指数(x2)'])
y = np.array(data['喜欢某品牌牙膏的百分比(Y)'])
#%%
#多元线性回归方程求解
from sklearn.linear_model import LinearRegression
model = LinearRegression()
X = np.vstack((x1, x2)).T
model.fit(X, y)
print(model.intercept_, model.coef_)#%%
#输出检验统计量summary
import statsmodels.api as sm
X = sm.add_constant(X)
model = sm.OLS(y, X).fit()print(model.summary())

（2）通过excel计算：

=(SUM(E39:E47))/(SUM(F38:F47))

如上图，D-W统计量为0.178。

4、设x1=5,x2=6，构造Y的置信度为95%的预测区间。

置信区间：估计因变量的平均水平 $\mu _{y}$

大样本： $\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{\mu}}\right )$

小样本： $\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{\mu}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{\mu}}\right )$

预测区间：估计某个特定的因变量y值

大样本： $\left ( \hat{y}-z_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+z_\frac{\alpha}{2}SE_{\hat{y}}\right )$

小样本： $\left ( \hat{y}-t_\frac{\alpha}{2}SE_{\hat{y}} ,\hat{y}+t_\frac{\alpha}{2}SE_{\hat{y}}\right )$

其中：

$SE=\sqrt{\frac{\sum e_{i}^{2}}{n-k-1}}$ ， $k=2$

$\begin{gathered}S E_{\hat{\mu}}=S E \sqrt{C_0} \quad S E_{\hat{y}}=S E \sqrt{1+C_0} \\ C_0=\frac{1}{n}+\frac{\left(x_{10}-\bar{x}_1\right)^2 \sum\left(x_2-\bar{x}_2\right)^2+\left(x_{20}-\bar{x}_2\right)^2 \sum\left(x_1-\bar{x}_1\right)^2}{\sum\left(x_1-\bar{x}_1\right)^2 \sum\left(x_2-\bar{x}_2\right)^2-\left[\sum\left(x_1-\bar{x}_1\right)\left(x_2-\bar{x}_2\right)\right]^2}-2 \\ \times \frac{\left(x_{10}-\bar{x}_1\right)\left(x_{20}-\bar{x}_2\right) \sum\left(x_1-\bar{x}_1\right)\left(x_2-\bar{x}_2\right)}{\sum\left(x_1-\bar{x}_1\right)^2 \sum\left(x_2-\bar{x}_2\right)^2-\left[\sum\left(x_1-\bar{x}_1\right)\left(x_2-\bar{x}_2\right)\right]^2}\end{gathered}$

（1）使用Python计算得出预测区间。

from scipy import stats
# 计算预测值
# 计算斜率和截距
slope1 = model.params[1]
slope2 = model.params[2]
intercept = model.params[0]
print('斜率:', slope1, slope2)
print('截距:', intercept)
#%%
# 计算预测值的置信区间
predict_value = slope1 * 5 +slope2 * 6+ intercept  # 预测值
print('预测值:', predict_value)
# 计算标准误差
std_err= np.sqrt(model.mse_resid)
print('标准误差:', std_err)
# 计算斜率的标准误差
std_err_y_hat = std_err * (1+1 / len(x1) + ((5 - x1.mean())**2*sum(x2-x2.mean())**2+(6-x2.mean())**2*sum(x1-x1.mean()) ** 2) / (sum((x1 - x1.mean())**2) * sum((x2 - x2.mean())**2)-(sum((x1 - x1.mean()) * (x2 - x2.mean())))**2)-2*(5-x1.mean())*(6-x2.mean())*sum((x1-x1.mean())*(x2-x2.mean()))/(sum((x1-x1.mean())**2)*sum((x2-x2.mean())**2-(sum((x1-x1.mean())*(x2-x2.mean())))**2)))
print('标准误差:', std_err_y_hat)
p = 2  # 自变量个数
#计算t的95%分位数
t = stats.t.ppf(0.975, len(x1)- p - 1)
print('t值:', t)
# 计算置信区间
lower_bound = predict_value - t * std_err_y_hat  # 下限公式中的0.975表示97.5%的置信水平，len(predictors) - 2表示自由度
upper_bound = predict_value + t * std_err_y_hat  # 上限公式同理
print('预测值的99%预测区间为:', lower_bound, '至', upper_bound)

（2）通过excel计算得出预测区间：

t值计算：

置信度为95%的自由度为n-2=8的t值。

=G29*((1+1/10+((H38^2*J48+N38^2*(L48))/(J48*L48-(SUM(M38:M47))^2))-(2*H38*N38*SUM(M38:M47))/(J48*L48-(SUM(M38:M47))^2))^0.5)

通过计算得出Y的置信度为95%的预测区间为：

$\left [ 35.662,65.145 \right ]$

附件

1、可视化

import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
#显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
#
# Create a 3D plot
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')# Scatter plot of the data points
ax.scatter(x1, x2, y, c='#91ad9e')# Create a meshgrid for the regression plane
X1, X2 = np.meshgrid(np.linspace(x1.min(), x1.max(), 10), np.linspace(x2.min(), x2.max(), 10))
Y = intercept + slope1 * X1 + slope2 * X2# Plot the regression plane
ax.plot_surface(X1, X2, Y, alpha=0.5)# Set labels
ax.set_xlabel('人均年收入(x1)')
ax.set_ylabel('教育指数(x2)')
ax.set_zlabel('喜欢某品牌牙膏的百分比(Y)')
plt.savefig('P71-11.png')
plt.show()

设计网站怎么做_软件开发方式_整合营销传播的明显特征是_网络营销软件下载

目录

一、一元线性回归

P70-7.

1、付款时间与所购商品价值之间是否存在显著的相关关系。

表 1 回归统计表

图 1 付款时间与所购商品之间的关系图

2、计算回归模型，并做相关统计检验。

表 2 方差分析表

表 3 回归系数表

（1）回归系数的显著性检验（t检验）

（2）回归模型的显著性检验（F检验）

3、构造付款时间为3分钟时，所购商品的置信度为99%的置信区间。

(1)通过Python计算

(2)通过Excel计算：

二、多元线性回归

P71-11.

1、计算回归模型参数估计值。

表 4回归系数表

2、计算可决系数。

表 5回归统计表

3、计算D-W统计量。

（1）通过Python求解得出D-W统计量。

（2）通过excel计算：

4、设x1=5,x2=6，构造Y的置信度为95%的预测区间。

（1）使用Python计算得出预测区间。

（2）通过excel计算得出预测区间：

附件

1、可视化

最新新闻

热搜词