摘要
随着经济水平的不断发展,人们的消费水平也在不断提高,从社会生产的角度看,消费是其最终环节,消费能否顺利实现是决定企业能否顺利完成生产的重要原因,也是决定经济增长的主要因素,因此消费对于经济增长有着重要的作用。研究影响消费的因素对于我国的经济发展有很重要的经济意义。
本文运用SPSS 软件分析方法对影响全国城镇居民家庭人均消费支出的因素进行分析研究,首先分析了食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等的线性相关性,建立回归模型,再利用逐步回归的方法进行回归分析,最终得到了能反映财政收入与各因素之间关系的“最优”回归方程。
最后我们用2006年的数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。
关键词:城镇居民,消费水平,逐步回归分析,城镇居民家庭人均消费,
SPSS
1. 引言
改革开放以来,我国一直以较高的经济增长速度快速发展。但居民消费对经济增长的贡献比重与发达国家差距明显。消费、投资和储蓄并称为现代经济发展的“三驾马车”,而根据各国的国民收入统计显示,其中消费占总需求的60%左右。因此,消费的决定及其变动对宏观经济的影响很大。
消费是人类生产的目的,而生产是社会的核心活动,在社会在生产中,生产必须围绕消费需求来进行,消费需求同时对生产有重要的导向作用。生产的消费是相辅相成的,生产者生产的产品的规模,质量,档次直接决定了消费的规模,质量和档次,消费能否顺利实现,决定了生产能否顺利完成。
消费行为是指消费者受需求动机的影响而做出购买决定、修改购买方案、完成购买过程的行为。消费者行为过程既是消费者的思维、心理过程,也是不断采取行动、产生方案、解决问题的过程。影响消费者行为的因素是多方面的,由社会的、历史的、经济的等多方面极其复杂的因素。从扩大需求的角度来看,消费是刺激经济增长的主要方式。所以研究消费的影响因素对经济增长有重要的经济意义。
我国城镇居民收入高,消费量大,商品化程度高,其消费对农村居民有一定的示范作用,在消费结构的研究中占有重要的地位,因而研究分析城镇居民消费结构及特征,对拓宽消费品市场渠道,确定经济发展战略,适时调整和正确引导居民消费方向,促进经济增长具有重大意义。
消费市场的疲软制约了我国经济持续、快速、健康发展。要刺激消费、扩大内需,必须找出影响消费的关键因素,才能对症下药。扩大城镇居民的消费成为推动我国经济增长的一项重要手段。
本文从国家统计信息网(http://data.stats.gov.cn)上选取了1992-2011年这20年间的全国城镇居民家庭人均消费及其主要影响因素的数据,包括了食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等,运用逐步回归的统计方法,对数据进行分析处理,最终得出了反映各个因素对全国城镇居民家庭人均消费水平的影响的最“优”模型。
2. 解决问题的方法和计算结果
2.1 样本数据的选取与整理
本文在进行统计时,查阅了http://data.stats.gov.cn中收录的1992年至2011年连续20年的城镇居民消费水平为因变量,考虑一些与全国城镇居民消费水平关系密切并且直观上有线性关系的因素,初步选取这20年间的食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等因素为自变量,分析它们之间的联系。
根据选择的指标,查选数据,整理如表2-1所示。
表2-1 1992-2011年全国城镇居民消费水平及其影响因素统计表 城镇居城镇居民家庭民消费人均衣水平着消费(元) 支出(元) 21861 19912 17104 15127 14061 12480 10739 9832 8880 8104 7745 7324 6999 6351 5909 1823.4 1674.7 1444.3 1284.2 1165.9 1042 901.8 800.5 686.8 637.7 590.9 533.7 500.5 482.4 480.9 城镇城镇居民家民家庭人均人均居庭设住消费及用支出(元) 消费(元) 1484.3 1405 1332.1 1228.9 1145.4 982.3 904.2 808.7 733.5 699.4 624.4 548 565.3 454 408.4 居庭家备品支城镇居民家庭人均医疗保健消费支出(元) 1063.7 969 871.8 856.4 786.2 699.1 620.5 600.9 528.2 476 430.1 343.3 318.1 245.6 205.2 城镇居民家庭人均交通和通信消费支出(元) 2455.5 2149.7 1983.7 1682.6 1417.1 1357.4 1147.1 996.7 843.6 721.1 626 457 427 310.6 257.2 城镇民家人均教娱服务费支(元) 居庭文乐消出城镇居民家庭人均其他消费支出(元) 657.1 581.3 499.2 474.2 418.3 357.7 309.5 277.8 240.2 215.1 195.8 284.1 171.8 228.8 197 时间 2012年 2011年 2010年 2009年 2008年 2007年 2006年 2005年 2004年 2003年 2002年 2001年 2000年 1999年 1998年 1116.1 1023.2 908 786.9 691.8 601.8 498.5 446.5 407.4 410.3 388.7 438.9 374.5 395.5 356.8 2033.5 1851.7 1627.6 1472.8 1358.3 1329.2 1203 1097.5 1032.8 934.4 902.3 690 669.6 567.1 499.4 1997年 1996年 1995年 55 5382 4769 520.9 528 479.2 358.6 300.9 283.8 316.9 298.2 263.4 179.7 143.3 110.1 232.9 199.1 183.2 448.4 375 331 185.7 170.5 114.9 2.2 线性回归模型的建立与分析
为了研究全国城镇居民消费水平与各种影响因素的关系,必须要建立他们之间的数学模型。数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。而实际生活中,影响城镇居民消费水平的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立数学模型往往是很难的。
为了便于研究,我们先假定一些前提条件,然后在这些条件下得到简化后的近似模型。
我们假定的前提条件是:城镇居民家庭人均食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等因素对全国城镇居民消费水平的影响显著,并且成正的线性关系。
由此假设,我们可以建立全国城镇居民消费水平与各种影响因素的线性回归模型,模型如下:
Y1X12X23X34X45X56X67X78X8 (2-1)
其中,Y是因变量, Xi是自变量,i是各个自变量的系数。各变量符号的定义见表2-2。
表2-2 线性回归模型中各变量的含义
Y X1 X2 X3 X4 X5 X6 X7 X8 城镇居全国城民家庭镇居民人均食消费水品消费平 支出 城镇居民家庭人均衣着消费支出 城镇居民家庭人均居住消费支出 城镇居民家庭人均家庭设备及用品消费支出 城镇居民家庭人均医疗保健消费支出 城镇居民家庭人均交通和通信消费支出 城镇居民家庭人均文教娱乐服务消费支出 城镇居民家庭人均其他消费支出 将数据录入统计软件EXCEL,建立统计数据库,首先建立全国城镇居民消费水平与各影响因素的散点图,如图2-1至图2-8所示。
图2-1 城镇居民消费水平与城镇居民人均食品消费支出的散点图
图2-2 城镇居民消费水平与城镇居民人均衣着消费支出的散点图
图2-3 城镇居民消费水平与城镇居民人均居住消费支出的散点图
图2-4 城镇居民消费水平与城镇居民人均家庭设备及用品消费支出的散点图
图2-5 城镇居民消费水平与城镇居民人均医保消费支出的散点图
图2-6 城镇居民消费水平与城镇居民人均交通与通信消费支出的散点图
图2-7 城镇居民消费水平与城镇居民人均文娱消费支出的散点图
图2-8 城镇居民消费水平与城镇居民人均其他消费支出的散点图
从以上的图中不难发现,城镇居民消费水平与城镇居民人均食品消费支出,人均居住消费支出,人均医疗保健消费支出,以及人均交通和通信消费支出等基本具有线性关系。而城镇居民消费水平与人均衣着消费支出,人均家庭设备及用品消费支出,人均家庭其他消费支出的关系出现了波动,而且从图中也可以看出,
这三者对城镇居民消费水平的贡献比较小,它们的变化不足以引起城镇居民消费水平的变化。
除了EXCEL自带的插入图表的功能,同样也可以使用SPSS软件制作散点图,其操作步骤是:
(1) 选择菜单 GRAPHS/ SCATTER/DOT。
图2-9 SPSS绘制散点图步骤一
(2) 选择SIMPLE SCATTER, 单击DEFINE 。
图2-10 SPSS绘制散点图步骤二
(3) Y轴为因变量,选择“城镇居民消费水平”,X轴为自变量,依次选择为“城镇居民家庭人均食品消费支出”,“衣着消费支出”,“居住消费支出”,“家庭设备
及用品消费支出”,“医疗保健消费支出”,“交通和通信消费支出”等。
每选择一次点击一次OK,SPSS自动绘制相应的散点图。
图2-11 SPSS绘制散点图步骤三
(4) SPSS 绘制的散点图仅做一例,如下图所示,相比于EXCEL自带的图表功能,SPSS的图表功能更加简单快捷。
图2-12 SPSS绘制散点图步骤四
经过对所有散点图的分析,我们发现人均衣着消费支出,人均家庭设备及用品消费支出,人均家庭其他消费支出与城镇居民消费水平的线性关系不显著,其原因主要有:
衣服和家庭设备用品都属于耐用品,居民购买的频率不大;而且它们的价格范围很大,对城镇居民消费水平的反映缺乏真实性。
其他消费支出都在千元以下,对城镇居民消费水平的影响不显著。
综上,人均衣着消费支出,人均家庭设备及用品消费支出和人均家庭其他消费支出这三者都与我们之前的显著性假设相悖,为使得到的模型有显著的线性关系,我们首先从回归模型中排除了这三者。
然后我们用逐步回归的方法对剩下的五个因素进行筛选: 将城镇居民人均食品消费支出,人均居住消费支出,人均医疗保健消费支出,人均交通和通信消费支出,以及人均文教娱乐服务消费支出纳入自变量,使用逐步回归法,选择的判据是变量进入回归方程的F的概率不大于0.05,剔除的判据是变量进入回归方程的F的概率不小于0.10。 输出结果如表2-3和表2-4所示:
表2-3 引入或剔除的变量
Model 1 Variables Entered Variables Removed 城镇居民人均食品消费. 支出 2 城镇居民人均文娱消费. 支出 Method Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100). Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100). a Dependent Variable: 城镇居民消费水平
表2-4 拟合过程小结
Model 1 2 R .996(a) .998(b) R Square .992 .995 Adjusted R Square .992 .995 Std. Error of the Estimate 409.57439 322.54440 a Predictors: (Constant), 城镇居民人均食品消费支出 b Predictors: (Constant), 城镇居民人均食品消费支出, 城镇居民人均文娱消费支出
由上面的两个表可以看出:
①.选择的过程是,最先引入了变量X1,建立了模型1;接着引入变量没有变量被剔除,建立了模型2(含有X1、
X7,
X7);最终的模型中含有变量X1、
X7。
②.各模型的拟合情况,模型1的复相关系数R=0.996,可决系数R2=0.992,调整可决系数为0.992;模型2的复相关系数R=0.998,可决系数R2=0.995,调整可决系数为0.995。可见模型2的拟合度较高,变量X1、X7的作用显著。
表2-5 方差分析
Model 1 Regression Sum of Mean Squares df Square F Sig. 3539042353904221.1 .000(a) 21.137 137 2109.69Residual 28517707 17 167751.178 .021 Total 3567559 18 91.158 2 Regression 3550914177545716.2 .000(b) 32.917 459 1706.59Residual 165588 16 104034.0 .241 Total 3567559 18 91.158 a Predictors: (Constant), 城镇居民人均食品消费支出 b Predictors: (Constant), 城镇居民人均食品消费支出, 城镇居民人均文娱消费支出
c Dependent Variable: 城镇居民消费水平
表2-5 的方差分析结果表明,当回归方程为模型1、2时,其显著性概率值P(Sig)均小于0.001,即拒绝总体回归系数均为0的原假设。
因此,最终的回归方程应当包含城镇居民人均食品消费支出, 城镇居民人均文娱消费支出这2个自变量,且方程拟和效果很好。
表2-6 逐步回归过程中排除出模型的变量
Model Beta In t Partial Sig. Correlation Collinearity Statistics Tolerance 城镇居民人均 .271(a .00 .638 居住消) 3.318 4 费支出 城镇居民人均 .166(a .03 .496 医保消) 2.285 6 费支出 城镇居民人均 .274(a .02 .518 交通消) 2.421 8 费支出 城镇居民人均 .217(a .00 .5 文娱消) 3.378 4 费支出 城镇居民人均 .131(b .48 .715 .181 居住消) 6 费支出 城镇居 民人均 .08-.323(b-1.83 -.429 医保消6 ) 8 费支出 城镇居民人均 .051(b .74 .333 .086 交通消) 4 费支出 .044 .072 1 .029 .071 .009 2 .008 .013 a Predictors in the Model: (Constant), 城镇居民人均食品消费支出 b Predictors in the Model: (Constant), 城镇居民人均食品消费支出, 城镇居民人均文娱消费支出 c Dependent Variable: 城镇居民消费水平 表2-6 显示了方程外各模型变量的有关统计量,即标准化偏回归系数Beta、回归系数显著性检验的t值、P(Sig)值、偏相关系数Partial Correlation、共
线性统计的容差Collinearity statistic Tolerance。
可见,模型2以外的各变量偏回归系数经检验,P值均较大,考虑到简化方程的需要,排除了这些变量。
表2-7 回归计算过程中的方程系数表
Coefficients(a) Mode l Unstandardized Coefficients Standardized Coefficients Beta t Sig. B Std. Error (Constan-795.5 232.624 t) 39 1 城镇居民人均食 3.568 .078 品消费支出 (Constan-474.7 206.347 t) 25 城镇居民人均食 2.819 .230 品消费支出 城镇居民人均文 1.956 .579 娱消费支出 a Dependent Variable: 消费水平 -3.42 .003 0 45.93 .000 1 -2.30 .035 1 12.24 .000 3 .996 2 .787 .217 .004 3.378 表2-7显示各模型的偏回归系数B、标准差Std. Error、常数Constant、标
准化偏回归系数Beta、回归系数显著性检验的t值和P(Sig)值。按照模型2建立的多元线性回归方程为:
Y=-474.725+2.819X1 +1.956X7 (2-2)
1,偏方程中的常数项回归系数
1 ,
2.819、71.956,经t检验αα的P值分别为0.35、0.、0.4,按α=0.1水平,均有显著性意义。 0,
1 ,7
α7的P值分别为0.035、0.000、0.004,按α=0.10水平,均有显著性意义。
3. 讨论
3.1 离群点的筛选
计算残差统计量如下表所示:
表3-1 残差统计量
Predicted Value Std. Predicted Value
Standard Error of Predicted Value Adjusted Predicted Value Residual
Std. Residual Stud. Residual Deleted Residual
Minimum Maximum Mean 2887.2318666.278.7800 090 95 -1.371 2.181
.000
Std.
Deviation N 4441.5427
19
3 1.000
19 19 19
.132 192.773 126.057 23.7 2880.1426 -534.99329 -1.659 -1.826 -8.66656
18420.7031 609.81207 1.1 1.985 687.29626
76.6009 .00000 .000 .002
4414.88661
304.09778 19 .943 1.033
19 19
2.18857 367.29319 19
Stud. Deleted
-1.988 2.214 .020 1.087 19
Residual
Mahal. Distance .427 5.482 1.5 1.130 19 Cook's Distance .001 .541 .073 .127 19 Centered Leverage
.024 .305 .105 .063 19
Value
a Dependent Variable: 城镇居民消费水平
表3-1 显示残差统计的结果,标准化残差的绝对值最大为1.1,小于设定值3。如超过3,则显示具体观察单位Case number 的标准化残差,以帮助发现离群点。
使用SPSS绘制出城镇居民人均消费水平的预测值与其标准化残差的散点图如下所示:
图3-1 城镇居民人均消费水平的预测值与其标准化残差的散点图
从图3-1的城镇居民人均消费水平的预测值与其标准化残差的散点图中,可以看出所有观测量随机地落在垂直围绕±2的范围内,预测值与标准化残差值之间没有明显的关系。
所以回归方程满足了线性与方差齐性的假设,且拟和效果较好。
3.2 对回归模型的检验
由上面的计算,得到的最优的多元线性回归模型为:
Y=-474.725+2.819X1 +1.956X7 (3-1) 对2006年的全国城镇居民消费水平做预测,置信度取为95%。 2006年的X1城镇居民人均食品消费支出为3111.90(元),X7城镇居民人均文娱消费支出为1203.00(元),Y全国城镇居民消费水平为10618.00(元),将自变量带入回归方程:
Y=-474.725+2.819×3111.90 +1.956×1203.00=10650.7(元) (3-2)
ˆo(xo),yˆ(xo)), 预测区间为(y其中
σ(x0)=t0.975(19-2-1)Q/(1921)=t0.975(16)×104034.0=2.120×
104034.0=683.8 (3-3)
代入数值,得到置信度为95%的预测区间为(9966.9,11334.5)。
查得2006年全国城镇居民消费水平为10618元,包括在最优模型预测的区间中,可见回归模型的预测还是比较准确的。
4.总结
本文查阅了中国统计年鉴,从中搜集了与全国城镇居民消费水平关系密切并且直观上有线性关系的因素,包括了食品消费支出,衣着消费支出,居住消费支出,家庭设备及用品消费支出,医疗保健消费支出,交通和通信消费支出等,分析它们与全国城镇居民消费水平之间的联系。
首先分析了建立了全国城镇居民消费水平与各因素的线性回归模型,再利用逐步回归法进行回归分析,经综合比较,选取了拟合性最好的最“优”回归模型。以SPSS 13.0为分析工具,给出了实验结果,并使用2006年的全国城镇居民消费水平验证了结论的正确性。
从最终的线性回归模型中我们可以看到,全国城镇居民消费水平可以用城镇居民人均食品消费支出, 城镇居民人均文娱消费支出很好地解释。其原因主要有两个方面:
首先,城镇居民人均食品消费支出属于居民每日必须的支出,消费量很大,对符合了前文的显著性假设;
然后,随着城镇居民生活水平的提高,居民的人均文娱消费支出上升范围较大,很大程度上影响了城镇居民的消费水平。
由于调研时间有限,该回归模型必然存在很多的不足:拟合曲线和实际值还是有一定的偏差;自变量个数也不够多;一些其他的能显著影响全国城镇居民消费水平的因素没有考虑到,还需要不断查阅资料加以改进。
该模型在一定程度上体现了与选取的各个因素之间的线性关系,并能对因变量做出近似的预测。综合来看,数据模型基本达到了预期的目的。
参考文献
[1] 孙海燕, 周梦, 李卫国, 冯伟, 应用数理统计, 北京航空航天大学, 2013.9 [2] 国家统计信息网,2012 国家统计年鉴 [2] SPSS 13.0 软件帮助手册
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- baijiahaobaidu.com 版权所有 湘ICP备2023023988号-9
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务