华拓科技网
您的当前位置:首页应用统计学大作业-房价统计分析

应用统计学大作业-房价统计分析

来源:华拓科技网
2003年至2012年间重庆市主城区房价波动

及其影响因素浅谈

——应用统计学大作业

学 院:机械工程学院

专业班级:工业工程2班

学 号:20102666

应用统计学大作业 工业工程02班20102666梁佩馨

姓 名:梁佩馨

辅导教师:邓蕾

时 间:2012年12月6日

摘要

本文通过在互联网搜索数据,查得2003年至2012年的重庆市主城区平均房价(元/平方米)的数据及其可能的影响因素。主要考察的影响因素包括国民人均收入(城镇居民人均可支配收入,农村居民人均纯收入)及银行个人住房贷款利率(个人住房商业贷款利率,个人住房公积金贷款利率)。利用Excel等工具对数据进行描述统计、相关分析、回归分析等处理,并利用处理结果预测、验证2012年上半年的重庆主城区平均房价,最后进行误差分析和纠错。

关键词:平均房价,回归分析,国民人均收入

1、背景介绍

自1999年以来,人们每天从报纸上看到的几乎都是房价上涨的消息。房子是一个家庭相当重要的民生问题,是一个人经济上和心理上都需要的保证。随着房价一天天势头凶猛地上涨,“买房”变成了横亘在众多人民群众心头的硬伤,高房价已经成为困扰我国民生发展的大问题。抛开居高不下的房价为何发生和是否具有其合理性、是否违背市场规律不谈,作为普通民众,我们应该如何掌控纷杂的信息、做出正确的判断和如何分配财产、在正确的时间投资房产以获得最大利益是非常值得人深思的。

2

应用统计学大作业 工业工程02班20102666梁佩馨

本文收集整理了2003年至2012年关于重庆主城房价及其波动的相关数据(其中包括:2003年至2011年的重庆市主城区平均房价、国民人均收入,2003年至2012年的银行个人住房贷款利率,2012年上半年城镇居民人均可支配收入,及2012年上半年各月的平均房价),以期能够利用课堂所学提供房价波动趋势、相关影响因素及粗略预测的方法,并服务于普通有相关需求的人群。

2、数据收集及整理

2.1 数据收集

2003年至2011年间重庆市主城区的房价数据和2012年上半年重庆主城区房价数据均采取网上获取第一手资料的方法查找,主要来源为新浪网和百度;2003年至2011年间的国民人均收入为第二手资料,来源于国家统计局数据库;2003年至2012年银行个人住房贷款利率为第二手资料,来源于百度、豆瓣网及新浪新闻。

数据整理如下表所示:

(表一.2003年至2011年重庆市主城区房价波动数据表)

3

应用统计学大作业 工业工程02班20102666梁佩馨

(表二. 2012年上半年重庆市主城区房价波动数据表)

2.2 数据整理

将以上数据整理,绘制成折线图,如下图所示:

(图一)

(图二)

4

应用统计学大作业 工业工程02班20102666梁佩馨

(图三)

3、数据分析及处理

3.1 初步分析

将折线图相互对比发现房价整体呈上升趋势,同时国民人均均收入也呈上升趋势;而个人住房贷款利率的波动幅度较大且趋势不明显,无法之间观察出其与房价之间的联系。

进一步对所得的可能影响因素进行相关分析。经处理知,城镇居民人均可支配收入和农村居民人均纯收入与房价的相关系数R的值分别为0.9480和0.9655;个人住房商业贷款利率和个人住房公积金贷款利率与房价的相关系数分别为0.0608和0.0040。由此可以初步判断:城镇居民人均可支配收入和农村居民人均纯收入与房价有密切的相关关系;相反的,个人住房商业贷款利率和个人住房公积金贷款利率则与房价波动之间虽存在着微弱的影响关系,但并无过多紧密联系。

基于以上分析,排除个人住房贷款利率对房价的内在影响,转而分析国民人均收入与房价之间的联系。

5

应用统计学大作业 工业工程02班20102666梁佩馨

3.2 详细分析

3.2.1 构建回归函数

将城镇居民人均可支配收入作为自变量X,房价为因变量Y,构建一元线性回归函数:Y=0.2880X -500.2088(1),其中R为0.9480;

将农村居民人均纯收入作为自变量X,房价为因变量Y,构建一元线性回归函数:Y=1.0123X -767.5172(2),其中R为0.9655;

将城镇居民人均可支配收入和农村居民人均纯收入作为自变量X1和X2,房价为因变量Y,构建二元线性回归函数:Y= -0.5546X1+2.9405X2 -1188.5791(3),其中R为0.97。

3.2.2 简单预测与现实印证

由互联网查得2012年上半年的城镇居民可支配收入的数据,为12509元;同时上半年重庆主城区平均房价值约为6517元(见表二)。将(12509*2=25018)带入(1)式中得到Y=6704.9752=6705(元),与现实统计数据相差6705-6517=188(元),初步印证了线性回归方程的准确性和可靠性。

4、误差分析及纠错

虽然现实印证的最后结果与统计调查的结果相差无几,但是分析整理过程中采用的有些方法过于简单(如2012年上半年的房价处理仅仅取了六个月的平均值,并以此数据作为2012年全年的房价平均值,未考虑房价有可能在下半年的增长中超过上半年均值;将

6

应用统计学大作业 工业工程02班20102666梁佩馨

2012年上半年的城镇居民人均可支配收入乘以二即作为2012年全年的城镇居民人均可支配收入数据,未加入时间因素,预计真实数据会比处理数据有所增长;由于无法获取2012年上半年的农村居民人均纯收入数据,无法使用R值最大的(3)式预测房价,进一步增大了误差。),致使最后的结果误差偏大,该方法的实用性相应减小。

如果能够通过准确的数据来源获得相对精确的数据,根据线性回归方程所得的数据误差将会得到一定程度的有效控制。因此该方法在某些数据缺失、不详的情况下,推算损失数据的可靠度还是可以保证的。

5、参考文献

[1] . 陈嗣成等. 新编统计学原理 [M] 北京:首都经济贸易大学出版社.1999.

[2] . 国家统计局数据库 [EB/OL]. http://www.stats.gov.cn/tjsj/ndsj/

[3] . 百度数据搜索结果 [EB/OL].

http://www.baidu.com/s?tn=myie2dg&ch=1&ie=

utf-8&bs=%E5%8F%82%E8%80%83%E6%96%87%E7%8C%AE%E6%A0%BC%E5%BC%8F&f=8&rsv_bp=1&wd=2003%E5%B9%B4%E9%87%8D%E5%BA%86%E4%B8%BB%E5%9F%8E%E6%88%BF%E4%BB%B7&rsv_sug3=26&rsv_sug=0&rsv_sug1=16&rsv_sug4=1636&inputT=16841

7

因篇幅问题不能全部显示,请点此查看更多更全内容