基于MLR模型对城乡居民消费价格指数的Stepwise分析
摘要
关键词
正文
近年来,由于我国农村CPI长期高于城市,并在经历通货膨胀后涨幅依旧高于城市CPI,这一问题在学术界获得了广泛关注。针对这一问题,本文采用基于多元回归分析(MLR)的逐步回归法(Stepwise),以探究城乡居民消费价格指数的差异。
一、MLR模型基本原理
1. 基本概念
设因变量为y,且自变量有,假设有n组数据()()。
设它们有如下线性关系:
其中,是随机变量,相互独立且满足,。上述式,为多元线性回归模型,称为回归系数。
利用最小二乘法估计回归系数的估计值,从而得到如下回归方程:
2. 假设检验
假设不全为零。
(1)回归方程的显著性检验(F检验)
当成立时,。其中,称为回归平方和,称为残差平方和。如果,则拒绝,认为y与之间显著存在线性关系;否则就接受,认为y与之间线性关系不显著。
(2)回归系数的显著性检验(t检验)
当成立时,设,当时,拒绝,否则接受。
(3)回归方程的拟合优度检验(r检验)
定义为y与的多元相关系数。其中,则越接近1,拟合优度越好;反之,如果不大,说明拟合度不高,需再改进。
由于所用数据CPI为时间序列,因此在模型构建之前,首先要对农村与城镇CPI分别进行单位根平稳性检验。检验采用EVIEWS软件验证。
图1 农村CPI平稳性检验
图2 农村CPI自相关系数图
可以看到农村CPI时间序列的ADF的p值为0.0001<0.05,拒绝原假设,而AC均在0左右分布,可认为该序列为平稳时间序列。
同理,可由此方法给出城镇CPI平稳性检验:
图3 城镇CPI平稳性检验
图4 城镇CPI自相关系数图
同理可见,城市CPI的ACF的p值为0.0001<0.05,拒绝原假设,而AC分布均在0左右,故认为该序列平稳。
因CPI均为平稳序列,现对城市CPI及农村CPI分别采取逐步回归分析方法构建MLR模型,得出各自的回归指数求得回归式,并进行对回归模型的预测与分析。构建过程如下:
1. 农村CPI的MLR模型
利用SPSS软件对收集到的数据信息进行多元线性回归分析。
设“农村 CPI”为因变量 ,将食品、烟酒及用品、衣着、家庭设备用品及维修服务、医疗保健和个人用品、交通和通信、娱乐教育文化用品及服务和居住作为自变量,分别设为:
并由 t = []代替,取值见表1; : 农村 CPI。
建立与的多元线性回归模型。
应用Stepwise方法,结果如下:
表1 方差分析表
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 61.653 | 1 | 61.653 | 283.963 | |
残差 | 2.823 | 13 | 0.217 | |||
总计 | 64.476 | 14 | ||||
2 | 回归 | 62.851 | 2 | 31.426 | 232.12 | |
残差 | 1.625 | 12 | 0.135 | |||
总计 | 64.476 | 14 | ||||
3 | 回归 | 63.844 | 3 | 21.281 | 370.364 | |
残差 | 0.632 | 11 | 0.057 | |||
总计 | 64.476 | 14 | ||||
4 | 回归 | 64.092 | 4 | 16.023 | 417.069 | |
残差 | 0.384 | 10 | 0.038 | |||
总计 | 64.476 | 14 |
注:a 因变量: 农村CPI; b 预测变量: (常量), 食品; c 预测变量: (常量), 食品, 交通和通信; d 预测变量: (常量), 食品, 交通和通信, 娱乐教育文化用品及服务; e 预测变量: (常量), 食品, 交通和通信, 娱乐教育文化用品及服务, 家庭设备用品及维修服务。
注:均值=2.73E-14 标准偏差=0.845 N=13
图5 标准化残差直方图
图6 标准化残差标准P-P图
表2 系数表
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | 59.705 | 2.552 | 23.396 | 0 | |
食品 | 0.408 | 0.024 | 0.978 | 16.851 | 0 | |
2 | (常量) | 31.754 | 9.61 | 3.304 | 0.006 | |
食品 | 0.364 | 0.024 | 0.873 | 15.132 | 0 | |
交通和通信 | 0.326 | 0.11 | 0.172 | 2.975 | 0.012 | |
3 | (常量) | 6.943 | 8.651 | 0.803 | 0.439 | |
食品 | 0.38 | 0.016 | 0.912 | 23.545 | 0 | |
交通和通信 | 0.4 | 0.074 | 0.21 | 5.432 | 0 | |
娱乐教育文化用品及服务 | 0.155 | 0.037 | 0.142 | 4.156 | 0.002 | |
4 | (常量) | -2.746 | 8.036 | -0.342 | 0.74 | |
食品 | 0.373 | 0.014 | 0.894 | 27.535 | 0 | |
交通和通信 | 0.314 | 0.069 | 0.165 | 4.55 | 0.001 | |
娱乐教育文化用品及服务 | 0.191 | 0.034 | 0.174 | 5.678 | 0 | |
家庭设备用品及维修服务 | 0.154 | 0.061 | 0.1 | 2.54 | 0.029 |
注:a 因变量: 农村CPI;食品()交通和通信()娱乐教育文化用品及服务()家庭设备用品及维修服务()
应用Stepwise(逐步回归) 方法,建立多元线性回归模型。由表2系数表可得出回归模型,结果如下:
由所得模型分析可知在8个价格指数中: “食品”、“家庭设备用品及维修服务”、“交通和通信”、“娱乐教育文化用品及服务”这四个要素是影响“农村 CPI”的主要因素。
通过该多元回归模型可以对2016年前的CPI 进行预测分析,即将基本信息:
食品()、交通和通信()、娱乐教育文化用品及服务()、家庭设备用品及维修服务()
四项代入上述函数式中,得到函数值:农村CPI。
对2014年及2015年的数据进行预测并与真实值比较,可以得出:2014年农村CPI的预测值为101.95,真实值为101.8,相对误差为0.15%;2015年农村CPI的预测值为101.16,真实值为101.3,相对误差为-0.14%。两次误差绝对值都控制在1.2%以内,说明拟合效果较好。
2. 城市CPI的MLR模型
与农村CPI的模型构建过程相同,建立与的多元线性回归模型,应用Stepwise逐步回归方法,结果如下:
表3 方差分析表
模型 | 平方和 | df | 均方 | F | Sig. | |
1 | 回归 | 48.576 | 1 | 48.576 | 107.003 | |
残差 | 4.994 | 11 | 0.454 | |||
总计 | 53.569 | 12 | ||||
2 | 回归 | 52.537 | 2 | 26.268 | 254.372 | |
残差 | 1.033 | 10 | 0.103 | |||
总计 | 53.569 | 12 | ||||
3 | 回归 | 53.123 | 3 | 17.708 | 356.744 | |
残差 | 0.447 | 9 | 0.05 | |||
总计 | 53.569 | 12 | ||||
4 | 回归 | 53.303 | 4 | 13.326 | 400.723 | |
残差 | 0.266 | 8 | 0.033 | |||
总计 | 53.569 | 12 |
注:a 因变量: 城市CPI;b 预测变量: (常量), 食品;c 预测变量: (常量), 食品, 交通和通信;d 预测变量: (常量), 食品, 交通和通信, 居住;e 预测变量: (常量), 食品, 交通和通信, 居住, 娱乐教育文化用品及服务。
注:均值=-3.46E-14 标准残差=0.816 N=13
图7 标准化残差直方图
图8 标准化残差标准P-P图
表4 系数表
模型 | 非标准化系数 | 标准系数 | t | Sig. | ||
B | 标准 误差 | 试用版 | ||||
1 | (常量) | 58.108 | 4.277 | 13.586 | 0 | |
食品 | 0.418 | 0.04 | 0.952 | 10.344 | 0 | |
2 | (常量) | -2.885 | 10.057 | -0.287 | 0.78 | |
食品 | 0.391 | 0.02 | 0.89 | 19.762 | 0 | |
交通和通信 | 0.647 | 0.105 | 0.279 | 6.193 | 0 | |
3 | (常量) | 1.058 | 7.066 | 0.15 | 0.884 | |
食品 | 0.361 | 0.016 | 0.821 | 22.164 | 0 | |
交通和通信 | 0.527 | 0.08 | 0.227 | 6.56 | 0 | |
居住 | 0.107 | 0.031 | 0.141 | 3.436 | 0.007 | |
4 | (常量) | -2.826 | 6.019 | -0.47 | 0.651 | |
食品 | 0.381 | 0.016 | 0.866 | 24.112 | 0 | |
交通和通信 | 0.484 | 0.068 | 0.209 | 7.071 | 0 | |
居住 | 0.092 | 0.026 | 0.121 | 3.472 | 0.008 | |
娱乐教育文化用品及服务 | 0.077 | 0.033 | 0.071 | 2.331 | 0.048 |
注:a 因变量:城市CPI;食品();交通和通信();娱乐教育文化用品及服务();居住()。
同理逐步回归,由表4可得回归模型,结果如下:
由模型结果分析可知在调查中的8个基本信息(价格指数)中,“食品”、“交通和通信”、“娱乐教育文化用品及服务”、“居住”这四个因素是“城市 CPI”的主要影响因素。
现以2014及2015年统计数据作为观测数据分析得出:2014年观测值为102.07,真实值为102.1,相对误差为-0.03%;2015年观测值为100.88,真实值为101.5,相对误差为-0.62%。两次误差绝对值都控制在0.7%以内,说明拟合效果也较好。
3. 观测与对比
由模型1与模型2的最终结果可知表5:
表5模型预测分析对比结果
年份 | 农村真值 | 城市真值 | 农村CPI的MLR模型 | 城市CPI的MLR模型 | ||
观测值 | 相对误差 | 观测值 | 相对误差 | |||
2014年 | 101.8 | 102.1 | 101.95 | 0.15% | 102.07 | -0.03% |
2015年 | 101.3 | 101.5 | 101.16 | -0.14% | 100.88 | -0.62% |
由1中农村MLR模型可知“食品”、“交通和通信”、“娱乐教育文化用品及服务”、“家庭设备用品及维修服务”这四个因素为“农村 CPI”的主要影响因素,由2中城市MLR模型可知“食品”、“交通和通信”、“娱乐教育文化用品及服务”、“居住”这四个因素为“城市CPI”的主要影响因素。并且可以看出“家庭设备用品及维修服务”与“农村CPI”相关性较强,与“城市 CPI”相关性较弱,“居住”与“城市 CPI”相关性较强,与农村相关性较弱。
四、总结
通过两个模型可知,四个相关性变量中“食品”的贡献系数最大,“家庭设备用品及维修服务”的贡献系数相比于其他系数都小。由此可见,农村居民消费的主要倾向集中在作为生活必需品的食品上,同时对家庭设备用品及维修服务等方面的投资较低,说明我国农村居民主要将收入用于食品的供给而对于享受温饱之上的高品质生活的需求不高。
其次,四个相关性变量中“交通和通信”贡献系数最大,“娱乐教育文化用品及服务”的贡献系数最小,说明城市居民在信息通讯方面投入的资金更大,对高端生活的追求欲望很强,而在娱乐教育文化方面虽然重视但是投入较其他项目少,说明重视程度还需提升。
...