欢迎来到学术参考网
当前位置:教育论文>文教资料

基于聚类分析的杭州房价问题的研究

发布时间:2023-12-10 23:09

  摘要:随着G20的成功举办和亚运会的即将到来,杭州的房价问题受到社会各界的广泛关注。该文以杭州13个行政区的相关数据作为研究对象,通过选取三个有代表性的指标,利用SPSS软件对其进行聚类,最后对聚类分析结果进行分析并提出了有意义的对策和建议。


  关键词:数据挖掘;SPSS;聚类分析;房价问题


  中图分类号:TP391文献标识码:A文章编号:1009-3044(2017)22-0010-02


  1概述


  2016年,杭州举办了举世瞩目的G20峰会,2022年杭州又将迎来第19届亚洲运动会,G20峰会不仅会大大提高了杭州的知名度和美誉度,同时将其国际化进程大大推向前进,2016年杭州正式跻身一线城市行列。得益于杭州持续推进城市建设的力度,尤其是规划中的10条地铁轨道交通和城际铁路的建设,杭州的房价在G20之后迎来了一波快速上涨。房价问题一直是全国人民都热切关注的问题,众多的学者对房价的走势都做了相关的研究。许光建在对全国35个城市的房价的研究中,就指出城市基础设施、教育、医疗卫生等公共服务的投入在一定程度上影响着房价的变动。徐美茹在《房价与地价因果关系研究》一文中也表明,过于宽松的金融环境是造成近年来房价过快的重要原因。王海滋在研究中构建了房价与人均可支配收入、与人均GDP的回归分析,结果表明北京房价增速远高于人均可支配收入与人均GDP的增长幅度。彭聪应用OLS对我国房地产销售价格与国内生产总值(GDP)、居民消费价格指数(CPI)、居民可支配收入等加以回归分析,结果表明经济总理、物价等都是影响未来房价走势的重要因素。本文主要基于2016年杭州市13个行政区的相关数据,分别从每个行政区的总GDP、人均GDP、人均可支配收入三个维度进行聚类,对杭州13个行政区区的房价问题进行分析,得到了一些有意义的结论并针对这些结论提出一些合理的建议。


  2数据的收集处理


  2.1数据指标选择


  杭州各行政區当前的房价到底是否合理,这是一个值得研究的问题。因此,本文选用2016年杭州13个行政区的相关数据,利用国内生产总值(GDPI、居民家庭人均可支配收入、人均GDP三个指标对杭州13个行政区的房价问题进行聚类分析。GDP即国内生产总值,是指在一定时期内一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,将其作为考察的变量主要是力求反映各地区的经济状况对房价的拉动作用。人均GDP是一个考虑了人口因素的相对指标,弥补了GDP仅考虑总量的不足,选用该指标可以同时兼顾经济发展和社会人口发展。居民人均可支配收入是指居民家庭全部收入中可用于支付生活费用的收入,该指标被认为是消费开支的最重要的决定性因素。


  2.2数据收集处理


  本文搜集了2016年杭州13个行政区的数据如表1所示。论文研究过程中所涉及的分析数据,主要来自杭州统计信息网(网址:http://)和千数堂(网址:http://)。


  由于不同的指标数据之间取值范围相差较大,为了使具有不同数量级的数据能放在一起比较,需要进行数据的标准化操作,本文采用的Z-score进行数据的标准化处理。Z-score标准化可以根据公式(1)执行,经过处理的数据符合标准正态分布,即均值为0,标准差为1。


  其他数据如上述操作所得,最终结果如表2所示。其中z1表示GDP总量的标准化值;Z2表示人均GDP的标准化值;Z3表示居民人均可支配收入的标准化值;Z4表示每平方米商品房房价的标准化值。


  3房价的聚类分析


  聚类分析就是根据某种相似性度量标准,将一个没有类别标号的数据集s直接拆分成若干个子集Ci(i=1,2,…..k;k≤n),使得每个子集内部数据对象之间相似度很高,而不同子集的对象之间不相似或相似度很低。本文主要采用SPSS中的系统聚类方法,以最短距离为计算依据实现聚类分析。最短距离法就是一组对象两两之间的距离矩阵m×m的非对角元素中找出dpq=min{dij}1≤i≤m,1≤j≤m,从而把把分类对象G,和G。并未以新类Gr,然后再按结算公式l计算原来各类与新类之间的距离,这样就得到一个新的(m-1)阶的距离矩阵;再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。


  Grk=min(dpk,dqk)k≠p,q(5)


  使用SPSS软件的系统聚类进行聚类分析之后,得到如图1所示的树状图。


  图1清楚地反映了聚类分析的全过程,通过树状图对所选的13个行政区进行分类,得到表3。


  通过比较表1与表3,我们可以得出以下结论:


  ①房价水平较合理地的是上城区和滨江区,虽然两者的房价很高,但无论从GDP总量还是人均GDP方面看,两者都名列前茅。上城区是南宋皇城所在地,山水江湖聚一身,吴山广场、河坊街等都在此。滨江区是浙江省最有影响的科技创新基地、高新技术产业基地和最具活力的经济增长区域,汇聚了浙江乃至全国各地的脑力IT精英,房地产市场相对成熟。


  ②萧山区和余杭区,是杭州最晚设区的,这两者无论在GDP总量、人均GDP、还是家庭可支配收入的指标上,都处于中间位置,两者的房价基本上也是如此反映。


  ③江干区、拱墅区、下城区、西湖区在GDP总量、人均GDP、家庭人均可支配收入指标上的排名都是比较靠前的,但是经济高速发展的同时其房地产市场也存在着一些问题,致使这些行政区的房价有些不合理。这些行政区都是杭州的主城区,相对来说经济比较发达,外来人口流入较多,可能这也是导致房价过高的一个因素。


  ④建德市、桐庐县、临安市、淳安县、富阳区,这些行政区总体上来说经济发展并不是很好,但从房价问题考察,可发现这些行政区的房价还是比较合理的,究其原因可能是这些行政区的人口相对较少,房价比其他行政区低。


  4结束语


  本文通过使用聚类分析分析方法对杭州13个行政区的房价问题进行分析,可以更科学、合理的对这些行政区进行分类,从而找出它们的相似性并发现其中规律。通过对聚类结果的研究分析,可以发现杭州当前房价确实存在这一些问题。杭州部分行政区还是存在房价过高的现象。当然,房地产价格的形成具有众多的影响因素,建议行政主管部门针对房价上涨过快的行政区,要增加居住用地的供应总量,抑制不合理住房需求,加强市场监督管理,保证杭州房地产市场的健康发展。


  作者:周冬斌等

上一篇:基于课程教学成效的Moodle课程聚类分析

下一篇:基于聚类分析的广西区域经济发展状况研究