2023年Tampa房价预测模型(一)
2022年美联储不断加息后,很多小伙伴一直都问市场会不会崩,2023年房价走势会是如何。很多视频博主也都来各种神预测。无论是什么样的预测,其实都用到一种东西,即预测模型。预测模型可以是经验模型,也可以是量化的统计分析模型,无论是什么样的模型,都会离不开预测因子或者叫影响因子。比如,有些人会说:“你看,库存一下子增加了这么多,根据以往的经验,价格肯定要跌”,这就是一种经验模型,预测因子就是库存量;也有人说:“现在失业率低,加息会让房价调整,但不会崩”,预测因子就是失业率和利率;还有人说:“现在加息都让市场冷却那么厉害了,缩表还没来呢,来了更可怕”,预测因子就是美联储基准利率和美联储资产负债表信息。但是,不管用什么模型,我们要知道著名统计学家George Box说的这一句话:All models are wrong, but some are useful。即所有模型都是错的,但是有些会有用。历史上有很多因素影响美国房地产市场的变动,一些重要的因素如:人口增长,收入,就业,房贷利率,销售库存,美联储的货币政策等等,Albert作为资深数据科学家就以坦帕湾为例,看看近30年的历史里,这些重要的影响因子是如何影响房价的,以及通过数据科学及统计分析模型的方法大致估测一下在不久的将来市场有可能出现的状况。
首先来深度理解每个影响因子和房价在不同市场状况下的关系。这些因子有人口增长,家庭收入中位数,失业率,抵押贷款利率,销售库存以及美联储资产负债表等方面来分析这些因素对房价的影响。这里要注意一点,这些不同的影响因子的原始数据颗粒度并不一样,比如人口增长和家庭收入中位数为年度数据,失业率是每月数据,抵押贷款利率是按天来的。所以在分析之前我做了很多数据预处理的工作,整合成按月来的数据颗粒度,以便能有足够多的数据点和能捕捉到重要的关系。首先来看看我们的目标变量数据:房价指数,房价指数的计算基准时间点为2000年1月。数值为100%,如果房价高于2000年1月的数值,则房价指数大于100%,反之亦然。我们能看出,坦帕房价指数从80年代后期到现在整体成上升趋势,但是中途经历了一些经济衰退以及2008年次贷危机的震荡。疫情两年也是大涨,直到2022年下半年才有所下跌。接下来,我们把每一个影响因子单独和房价指数曲线做对比看看有什么发现。
首先人口增长和房价的关系。Hillsborough县的人口和房价指数长期看都是增长趋势,人口增长给房价带来正向的效应。这也符合经验,一般来说一个区域的房产市场如果要有长期好的涨势,就需要有长期稳定的人口增长或注入。但是这张图上我们还能看出,房价和人口的增长速度在不同的时间段并不完全一致,比如说08次贷危机前后房价增长要比人口增长速度要快的多。这说明,有其他的影响因子在背后作用。
其次看家庭收入中位数和房价的关系。同样,把其换算成指数,跟房价指数做对比。这里能得出相似的结论,家庭收入的增长给房价带来增长效应,但是,次贷危机之前和次贷危机之后房价的增长比家庭收入的增长要快。仍说明背后有其他因素促使房价在这些时间区间里涨的快。
再来看看失业率和房价指数的关系。2008次贷危机那几年失业率飙升,超过了10%,给房价带来超大的负面效应。在这过程中,很多房屋被抛售,房屋库存也是达到历史的最高点。这样的结果就使得供给远大于需求,价格骤降,房产市场崩塌。这种经济危机带来的负面效应在短期远超人口增长带来的正面效应,所以房价短期跌的很厉害。危机过后库存大大减少,并且逐年递减,加上贷款利率降的很低,这些额外的效应在人口和收入都增长基础之上让房价涨的更快。如果我们回看90年代的数据也会发现失业率攀升对房价的负面效应。不过那个时候没有发生08次贷危机那样的崩盘,也就是说,失业率对房价的影响从量化关系上来说和08危机是不一样的。但是,2020年疫情期间的大幅度失业,却没有造成08危机那样的崩盘,原因是政府有抵押贷款止赎的帮助。所以,失业率也不能完全决定房产市场是否会崩盘。
再者住房销售库存和房价指数的对比。08次贷危机的时候库存攀升房价急剧下降,到了2020年之后疫情的时候库存急剧下降房价急剧攀升,很明显的反向关系。但是,如果我们再仔细对比房价指数曲线的一些拐点和库存曲线的拐点,我们还能发现,房价拐点和库存拐点并不重合,房价拐点一般会相对于库存拐点滞后一些。这不难理解,一般房子到市场上要经过一些时间才能卖出去,售价才能反映出来。
最后来看影响住房销售的另外一个因素:贷款利率。这个因素和美联储的利率调控紧密相关。把30年期抵押贷款利率和房价指数曲线做对比。可以得出,长期大趋势看,抵押贷款利率变动和房价变动是相反的关系,这是符合常识的。但是,在不同的局部时间段,利率的变化造成的房价变化效应似乎又不一样。有些时间段甚至是房价和利率共同攀升或者共同下降。在这些不一样关系的时间段里,其他的影响因子给房价变动带来的量化效应就有可能超过了利率带来的效应。
最后来看看和美联储动作相关的另外一个因素,美联储的资产负债表的数据曲线,及其和房价指数曲线的对比。扩表和缩表的信息都反映在数据里。从这些数据里我们能看出,08危机之后,大体关系上来说美联储资产负债表的趋势和房价指数趋势有相似之处,但也有不一致的地方。在这很长的时间段里,我们也看到了,有其他的重要影响因子直接影响房价的变动。
从每个影响因子的单独分析来看,我们能得出这样的大致结论:(1) 人口增长和家庭收入是主导房价长期趋势的因素,也是最重要的长期因素,和房价是正向关系;(2) 失业率,住房销售库存,利率以及美联储的动作都有可能有短期的影响;(3)其中,失业率和住房销售库存对房价的短期影响视觉上来说最直接明了,失业率及住房销售库存和房价指数有着很显著的反响关系;(4)并且库存及失业率的影响都有可能会有一定的滞后效应;(5)利率和房价的大体关系是反向的,但是在不同的时间段和其他影响因子重叠的情况下也有可能存在同向关系。