预测那点儿事儿:如何靠谱地预测CPI?

文章正文
发布时间:2017-09-10 10:03

  前言: 

  统计局真准时。周六一大早就公布了8月PPI和CPI(多希望金融数据发布的确定性也这么高嘿嘿!)。本月通胀数据的结果大超市场预期。CPI 1.8,PPI 6.3。 

  小肯比较欣慰的是,自己的模型预测还是比较靠谱。小肯1天前的观点见下图。其实之前由于看到模型输出结果太高,和市场主流预测差距比较大,都有点没信心了。再加上最近确实很忙,也没多少时间改模型做研究,就更忐忑了。好在,结果还是给予了大力支持:) 

  本期,我们谈谈如何尽量准确的预测CPI 

  其实,通胀预期的研判对于债券投资的重要性不言而喻。由于CPI和PPI都能够找到高频(周频)数据进行拟合,因此这两个数据是的预测方法是相对成熟的:很多很多卖方报告都发表过预测方法的介绍,买方研究员们也会对CPI和PPI进行自己的预测。 

  但是,预测CPI和PPI是个略显复杂的事儿,方法远不是唯一的。尽管所有方法的预测思路都是跟踪高频和均值回归,但还是有很多细节需要斟酌考虑、优化提高的:比如一下几个问题: 

  1)选取什么跟踪指标最合适? 

  2)预测时各细分项目类别是分得更细好还是更粗好? 

  3)权重如何确定最优? 

  4)回归系数为负值(即权重为负数)怎么处理? 

  5)计算历史增速均值时,选用该月历史环比增速的均值好,还是选用该月环比增速差值(即当月环比减上月环比的差值)的均值更好? 

  …… 

  以上问题不一而足。本期,小肯写篇文章介绍自己的预测方法。 

  在小肯看来,做宏观模型的目的不仅仅是预测数据。因为市场里预测的人太多,市场预期早已是公开信息,而且早就被反映在资产价格里了。研究似乎已经没有意义。但其实做这些模型的最大意义在于:从中对宏观走势和价格驱动因素有更好把握,从而更好地把握经济基本面。这个问题,似乎过程比结果更有意义一些。不过,若预测精度确实好,能够在真实数据超预期时提前通过模型监测到,那也是极好的。 

  本期,我们来看CPI预测。下期,讲PPI预测。 

  最后,很多人可能关心今年后面CPI和PPI会是什么趋势。小肯觉得现在的远期预测都是基于历史均值增速或者在其基础上调整个别因子。的确,依据翘尾可以大致判断个方向,但真正靠谱的预测,还是只能是在近月,手握回归系数高的高频宏观数据之后。 

  好了,我们开始吧~ 

  小肯的模型中采用了两种方法预测CPI:姑且自称为“高频数据法”和“历史均值法”。  

  其中,高频数据法的原理是能够找到与CPI子项目相关性强的高频跟踪指标,根据该指标的环比增速预测CPI子项目的环比增速,再通过对各子项目进行加权平均。计算出CPI总环比增速,进而推算出同比增速。该方法的优点在于能够较为准确地预测CPI近月值,但局限性在于无法预测CPI远月值。 

  而历史均值法的原理则是利用CPI子项目环比具有较稳定季节性的特点,用CPI子项目某一月份的历史环比数据均值来推测未来该月份的环比增速,进而计算同比增速。该方法的最大缺点在于无法探测出未来月份超越历史因素的价格驱动,但优势在于能够预测出较远月份的CPI同比增速。 

  下面分别予以介绍: 

  高频数据法方法介绍 

  由于CPI公布的时间为次月的9号或10号,所以如果可以找到与CPI子项目拟合程度较好的周度或旬度公布的高频数据,则可先预测CPI子项目值,然后再汇总形成CPI预测值。所以预测过程可分为四个步骤:第一步计算CPI子项目权重(即CPI子项目占CPI比重),第二步预测CPI子项目环比增速,第三步加权计算CPI环比增速,第四步将CPI环比转化为CPI同比增速。以下分别介绍。 

  第一步 计算CPI子项目权重

  CPI可以根据公布子项目数据的结构,将其权重分为三个层次 

  (1)食品类、非食品类在CPI中的权重。 

  (2)CPI一级分类在CPI中的权重。统计局对CPI的一级分类共有8个:食品烟酒、衣着、居住、生活用品及服务、交通和通信、教育文化和娱乐、医疗保健、其他用品和服务[1]。  

  (3)CPI二级分类在CPI中的权重。二级分类是指在一级分类项下的更细分类。由于统计局没有公布各这些二级分类项目的权重,所以需要我们自行去估计。  

  [1] 2016年1月CPI大类划分出现了调整,“食品”与“烟酒”合并构成“食品烟酒”项,同时新增“其他用品和服务”项构成新8大类。 

  首先,食品类-非食品类的权重比较好求得,可以通过回归(以CPI环比为因变量、以CPI食品类环比和CPI非食品类环比为自变量)的办法来确定。小肯自行回归后得到食品类权重约21%,非食品类权重约79%,通常食品类和非食品类在CPI中的权重较为稳定。  

  接下来,一级分类(八大分类)在CPI中的权重计算稍显复杂。根据统计局统计制度要求,其要每5年对CPI权重做一次较大调整。近期的调整是在2016年1月,即2016年1月开始使用2015年作为新的基期。  

  与此同时,CPI大类划分也出现了较大的调整。2016年1月以来,CPI分为8大类,分别为“食品烟酒”、“衣着”、“居住”、“生活用品及服务”、“交通和通信”、“教育文化和娱乐”、“医疗保健”、“其他用品和服务”,其中“食品烟酒”类包括食品类以及非食品类中的“烟酒”,其余7个一级分类均为非食品类。由于2016年1月至今CPI公布的数据还较少,无法通过回归的方式较为准确求得八大分类在CPI中的权重值。目前,对于CPI的8大分类权重,我们选取Wind公布的2016年CPI各项权重值。  

  最后,确定CPI二级分类在CPI中的权重有两种方法。第一种方法是根据统计局每月公布的解读CPI公告,其中隐含了“食品烟酒”项下部分二级分类(“粮食”、“鲜菜”、“畜肉类(猪肉)”、“水产品”、“蛋类”、“鲜果”)的权重信息,即公告同时公布二级分类项目的环比增速和影响CPI环比变化程度,可推算出权重值。第二种方法是我们定义二级分类在CPI中的权重等于二级分类在一级分类中的权重乘以一级分类在CPI中的权重(一级权重_Wind),如下式:  

  因此,只需要计算二级分类在一级分类中的权重,而这可以通过CPI历史数据回归获得:以CPI各一级分类的环比增速为因变量,以CPI一级分类下的二级分类的环比增速为自变量。 

  至此,我们便可获得出CPI各一级、二级分类子项目的权重。 

  第二步:预测CPI子项目环比增速

  虽然该方法名称为“高频数据法”,但事实上只有部分CPI子项目(主要是除“奶类”外的食品子项目和非食品类中的“交通和通信:交通工具燃料”)可以找到相关性强的高频跟踪指标,所以对于这些子项目,我们借助高频指标进行预测,详见如下: 

  (1)利用高频跟踪指标预测CPI子项目环比增速 

  对于除“奶类”外的食品子项目和非食品类中的“交通和通信:交通工具燃料”,跟踪指标我们按照以下顺序进行数据处理: 

  a) 选取相关性强的高频跟踪指标 

  通过回测选取效果最好的指标,我们发现食品类中,“粮食”、“食用油”、“畜肉类”、“水产品”、“蛋类”采用跟踪指标为统计局公布的50个城市平均价,“鲜菜”采用跟踪指标为农业部公布的28种重点监测蔬菜平均批发价,“鲜果”采用跟踪指标为商务部公布的食用农产品价格指数中的水果类效果最好,以上数据皆为周频数据。非食品类中的“交通和通信:交通工具燃料”类采用跟踪指标为新华(大庆)国际石油资讯中心发布的全国成品油价格指数,也为周频数据。 

  b) 计算高频跟踪指标环比增速 

  对于非食品类中的“交通和通信:交通工具燃料”,原本是先计算全国成品油价格指数的月平均价格,然后计算环比增速。但成品油价格在Wind上于2017年7月5日就停止更新了,于是就用国家统计局公布的LNG、柴油等高频数据替代。 

  对于食品类,跟踪指标计算过程略显复杂:先计算每一项食品细分类别的月平均价格,接着计算各类食品月相对价格变化(本月平均价格/上月平均价格),再使用几何平均法将属于同类食品月相对价格变化合并为高频跟踪指标月相对价格变化,最后计算高频跟踪指标每月环比。 

  c) 以CPI二级分类项环比增速为因变量,以高频跟踪指标环比增速为自变量,进行线性回归,取得回归系数 

  d) 将高频跟踪指标环比增速的具体值带入回归方程,以预测CPI二级分类项的环比增速。 

  (2)利用历史均值预测CPI子项目环比增速 

  以上是对能获取高频跟踪指标的子项目预测方法描述,对于“奶类”和除“交通和通信:交通工具燃料”外的非食品类子项目,因为无法找到拟合度好的相关跟踪指标,采用历史均值法的思路进行处理,但具体方法又与后面介绍预测CPI的第二种方法“历史均值法”有所区分,具体可分为“采用环比增速差值”和“直接采用环比增速”两种方法。具体如下: 

  a) 采用环比增速差值:对于某些CPI子项目,其历史环比增速的差值表现出周期性特征,所以可先计算每月环比增速和上月的差值,再计算历史上该月该差值的平均值。本月该子项目的环比增速预测值为上月环比增速加上对应月份环比差值的平均值。适用于该方法的CPI子项目有:“居住”、“交通和通信:通信工具”、“医疗保健:中药”、“医疗保健:西药”。  

  b) 直接采用环比增速:对于某些CPI子项目,其历史环比增速本身表现出周期性特征,所以可直接计算对应月份环比增速的平均值,将该平均值作为某月预测值。适用于该方法的CPI子项目有:食品类中的“CPI食品烟酒:奶类”以及除了“交通和通信:交通工具燃料”“居住”、“交通和通信:通信工具”、“医疗保健:中药”、“医疗保健:西药”以外的非食品类子项目(“衣着:服装”、“衣着:衣着加工服务费”、“衣着:鞋类”、“生活用品及服务:家用器具”、“生活用品及服务:家庭服务”、“交通和通信:交通工具”、“交通和通信:通信服务”、“交通和通信:邮递服务”、“教育文化和娱乐:教育服务”、“教育文化和娱乐:旅游”、“医疗保健:医疗服务”、“其他用品和服务”)。  

  需说明的是,部分CPI子项目具有明显的春节错位效应,所以在预测1-3月环比增速时,需要对样本有所调整,计算历史环比时仅选取春节月在相同月份的年份作为样本。具体来说,具有春节效应而需要进行样本调整的子项目有“CPI:生活用品及服务:家用器具”、“CPI:生活用品及服务:家庭服务”、“CPI:交通和通信:邮递服务”、“CPI:教育文化和娱乐:旅游”。  

  至此,我们已借助高频跟踪指标,或利用历史均值法的思路(针对无法获取高频数据的子项目)预测了近月CPI全部子项目的环比增速。简单总结如下表: 

  第三步:加权计算CPI环比增速 

  通过已经确定的CPI子项目权重和预测的CPI子项目环比增速,通过加权平均法计算CPI环比。 

  第四步:将CPI环比增速转化为CPI同比增速 

  通过以下公式,将CPI环比增速转化为CPI同比增速: 

  其中X为CPI环比增速;Y为CPI同比增速。 

  历史均值法方法介绍 

  由于高频数据法只能预测近月的CPI增速,对于远月增速,我们只能假设CPI子项目的环比增速具有季节性,从而采用历史均值法对CPI进行预测。 

  在高频数据法的第二步的“利用历史均值法的思路预测无法获取高频数据的子项目”中,我们介绍过采用环比增速做差和直接采用环比增速两种方法。但此时若对全部CPI子项目都采用历史均值法进行预测,经回测,精度最高的方法是仅采用“食品”、“非食品”这两个最基本分类。计算其新涨价因素的历史均值来预测未来该月份的新涨价因素,再结合该月份的翘尾因素分别计算食品类和非食品类的预测同比增速,进而计算CPI同比增速。具体步骤如下: 

  第一步:分别计算食品类和非食品类翘尾因素和新涨价因素。

  本年第i月翘尾因素计算公式为: 

  新涨价因素计算公式为: 

  第二步:计算对应月份新涨价因素的平均值,将其作为预测月份的新涨价因素预测值,通过翘尾因素和新涨价因素预测值计算食品类和非食品类CPI同比值。  

  预测食品类CPI同比值公式为: 

  第三步:根据食品类(21%)和非食品类(79%)的权重计算CPI同比预测值。 

  这里需要补充说明的是,由于CPI的预测值较真实值还存在一定的差距,可以利用预测月前十二个月偏离值的平均值作为模型的修正值,即预测值减去预测月前十二个月偏离值的平均值。 

  高频数据法和历史均值法的预测结果汇总 

  我们利用每个月前能获得的数据进行逐月预测,结果如下表: 

  结语 

  至此,本文已经分别为大家介绍了预测CPI的两种方法。当然,诚如导言中所述,模型预测只是一部分,重点还是要看待CPI与PPI与市场预期的预期差,以及在预测过程中对宏观经济趋势的把握。 

  (完) 返回搜狐,查看更多

  责任编辑:

文章评论
—— 标签 ——
首页
评论
分享
Top