基于ARIMA模型中国黄金价格预测研究
摘要
关键词
ARIMA模型;GM灰色预测模型;时间序列;回归分析
正文
黄金价格的变动是市场多种力量相互作用的结果,反映了市场对未来经济走势和风险的预期。新冠疫情的爆发导致全球各大经济体开始出现通货膨胀的趋势,对黄金的投资需求增加导致金价飙升。货币宽松与避险情绪推动黄金价格上涨,作为传统避险资产的黄金配置价值进一步提升。因此,研究黄金价格的波动及其影响因素有助于更好地了解黄金市场的发展行情并提出有效建议。
一、实证研究
(一)基于ARIMA模型分析并预测黄金价格的发展趋势
1.数据采集
数据来源是世界黄金协会网上的2008-2024年每月的黄金价格数据,结合Python和SAS对时间序列进行处理。由于实际研究中金融时间序列是一个随机变量序列,极大程度上受到不可控因素影响,难以形成一个平稳时间序列,根据时间序列分析基本理论明确处理非平稳时间序列的方法,对其进行差分或者对数化处理后形成一个平稳时间序列,判断最优模型的阶数,检验预测结果,最终确定ARIMA模型的最终形式并预测。
2.时间序列平稳化处理
在python中导入库绘制2008-2024年黄金价格的时序图,图像可知黄金价格起初保持稳步上升的趋势,但在新冠疫情(2019年)突然出现了一段急速上升,显然该时间序列不是平稳时间序列。本文在SAS命令dif一阶差分后,差分后序列通过了ADF平稳性检验,结果如下所示,说明一阶差分后序列是平稳序列。
确定ARIMA模型的d=1,下面通过SAS对时间序列进行纯随机性检验可以得到,该序列为非白噪声序列,说明序列值之间存在密切相关关系,下面开始建立模型。
3.模型建立
对于ARIMA(p,d,q)模型中阶数的确定,初步采用观察定阶法来判定,再用代码自动比对生成最优模型。利用python的数据库中画出一阶差分后时序的自相关图与偏自相关图。在一阶处超过了95%置信区间上界,即差分后序列自相关在1阶截尾,初步判定q=1,根据偏自相关图可知:差分后序列偏自相关在1阶截尾,初步判定p=1。还需借助BIC和AIC信息准则判断p、q为何值时模型最优,结果如下所示。
使AIC和BIC最小的模型阶数是p=1,q=1,此时模型拟合一阶差分后数据最优,确定最优模型为ARIMA(1,1,1),具体方程为:
4.模型检验及评价
利用 ARIMA(1,1,1)模型对未来的黄金价格预测之前,先要对模型进行评价,进行残差白噪声检验和参数显著性检验,检验该模型的优劣和参数是否显著非0,如果通过检验,那么可进行预测;如果未通过检验,则依条件优化完善。
模型拟合优度检验:拟合优度R²=0.961>0.95,那么模型拟合效果优秀。
残差白噪声检验:LB统计量的P值都大于显著性水平0.05,不能拒绝原假设,认为拟合模型的残差序列为白噪声序列,说明拟合的模型对序列信息提取充分。
系数显著性检验:结果显示系数的P值小于0.01,认为各变量的系数显著不为0,通过了显著性检验,说明模型ARIMA(1,1,1)对该序列的拟合显著成立。
残差值检验:结果显示残差分布非常接近于均值为0的正态分布,模型拟合效果较好,即随机误差是白噪声序列。
真实值与拟合值曲线十分接近,为了评估预测准确率,计算MAPE=0.029727<0.1,说明了该ARIMA(1,1,1)模型表现非常优秀,拟合效果较好,可用该时间序列模型对未来的黄金月平均平均价格作预测估计。
5.模型预测
基于上文建立的ARIMA模型先对历史值对进行预测发现,2021年10月金价拟合值1773与真实值1776相差小,说明预测效果好,那么预测2024年5-12月的黄金价格依次为:2337.907243、2348.846523、2353.545656、2362.814053、2368.736668、2377.109186、2383.687796、2391.579971。
(二)基于灰色预测模型预测黄金价格未来趋势
上文建立ARIMA(1,1,1)模型并预测未来8个月黄金价格。为了完善预测方法,下面依据2023年4月至次年4月的黄金价格利用灰色预测模型进行短期预测。
1.级比检验
在建立灰色预测模型GM(1,1)之前,需要对序列进行级比检验。如果所有的级比值都在区间(e^(-2/(n+1)),e^(2/n+1))内就通过级比检验,说明该序列适合构建灰色模型;若未通过级比检验则作平移转换。计算得区间为(e^[-2/(n+1)],e^[2/(n+1)])=(0.867,1.154),发现所有级比值都落入该区间,即序列通过了级比检验,可以建立GM(1,1)模型。
2.模型的建立与求解
依据黄金价格建立GM(1,1)模型过程如下。
第一步,建立原始序列,并构造其一次累加生成列
为:
第二步,构造数据矩阵B和数据向量。
第三步,计算待估参数,根据公式
,计算得到:
第四步,预测模型:
3.模型的检验与评价
残差检验:对模型预测还原值与实际值的残差进行了逐点检验,计算得到平均相对误差ψ(n)=2.81%小于5%,那么该模型是残差合格模型。
关联度检验:通过考察模型值曲线与建模序列曲线的相似程度进行检验,根据关联系数公式计算得到γ=0.82334>0.6,说明两序列具有较大相似性,说明两曲线关联系数达到0.823,模型拟合效果较好,故通过关联度检验。
后验差检验:对残差分布的统计特性进行检验,首先计算原始序列的标准差S1和绝对误差的标准差S2,求得方差比C≈0.018055<0.35,说明模型精度优,通过后验差检验。
综上所述:建立的灰色预测GM(1,1)模型通过三种检验,计算GM(1,1)模型的MAPE=0.02817<0.1,说明模型拟合效果优秀,故模型预测性能好,可以用该模型短期预测。
4.模型的预测
本节建立的灰色预测模型拟合效果比较好,在新生成的一组预测变量可知2023年3月29日黄金价格的预测值为2134.939美元/盎司与实际值2138很接近,预测效果明显。故用GM(1,1)预测未来3个月黄金价格为:2190.862,2219.37,2248.249。
(三)基于线性回归模型对黄金价格的影响因素分析
基于上文建立了ARIMA模型和GM(1 , 1)模型,预测了未来长期和短期的黄金价格走势。为了进一步探究影响黄金价格变动的主要因素,考虑建立线性回归模型,结合定量分析与定性分析考察因素对黄金价格的影响并提出建议。
1.数据来源与划分
深入分析国内外同类研究,结合中国的黄金经济市场实际情况,本节将影响黄金价格因素细分为5个变量,分别是美元每月M2供应量、原油价格、居民消费价格指数、进出口总值、中国不稳定政策发展指数,将这些变量作为可能影响金价的自变量,黄金价格y作为因变量进行线性回归。建立方程如下:
y=β0+β1x1+β2x2+β3x3+β4x4+β5x5+ζ
假定ζ~N(0,δ2)且互不相关。方程中代表影响黄金价格的关键因素。结合黄金市场的发展情况以及疫情带来的影响,将数据集分为2008-2018年(疫情前)和2019-2024年(疫情后)。
2.疫情前模型的建立与分析
利用Python中的statsmodels.api库的线性回归方程,结果显示常数项和EPU指数的系数不能通过显著性检验,故去除常数项和EPU指数,模型结果如下所示。
表1疫情前模型结果
Dep.Variable: | Gold_Price | R-squared(uncentered): | 0.978 | ||
Model: | OLS | Adj.R-squared(uncentered): | 0.977 | ||
No.Observations: | 132 | F-statistic: | 1118 | ||
DfResiduals: | 127 | Prob(F-statistic): | 3.91E-103 | ||
DfModel: | 4 | ||||
coef | t | P>|t| | [0.025 | 0.975] | |
M2_Supply | -0.0158 | -0.823 | 0.092 | -0.054 | 0.022 |
Crude_Oil_Price | 1.8603 | 1.556 | 0.101 | -0.505 | 4.225 |
CPI | 6.4338 | 3.732 | 0 | 3.023 | 9.845 |
Import_Export_Value | 2.0893 | 4.206 | 0 | 1.107 | 3.072 |
观察可知:调整后的R2=0.977非常接近于1,回归方程显著,在90%置信水平下,大多数通过了系数的显著性检验,经DW经验可知序列之间无自相关关系,建立方程如下所示。
由表可知:疫情前的原油价格、居民消费价格指数CPI、与进出口总值与黄金价格均存在积极的联系,美元每月M2供应量与黄金呈负相关。此外居民消费价格指数CPI和进出口总值对黄金价格影响最为显著。
原油价格与黄金价格同步变动的关系,在一定程度上代表着当前经济形势;如果CPI持续上涨,说明当前经济过热,货币供应量过多导致通货膨胀,人民币的购买力下降,那么金价上调;进出口总值的上升可能伴随着贸易盈余增加,意味着国家有更多的外汇收入可用于购买黄金,从而推动金价上升;当美元M2供应量增加时,美联储为了控制通胀而提高利率,利率越高则利息收入越高,增加美元资产的吸引,而黄金吸引力下降,投资者抛售黄金,金价下跌。
3.疫情后模型的建立与分析
与疫情前模型建立方法相同建立疫情后的回归方程,结果如下所示。
表2疫情后模型结果
Dep.Variable: | Gold_Price | R-squared(uncentered): | 0.995 | ||
Model: | OLS | Adj.R-squared(uncentered): | 0.995 | ||
No.Observations: | 52 | F-statistic: | 3267. | ||
DfResiduals: | 49 | Prob(F-statistic): | 2.10E-56 | ||
DfModel: | 3 | ||||
coef | t | P>|t| | [0.025 | 0.975] | |
M2_Supply | 0.0956 | 15.172 | 0 | 0.083 | 0.108 |
Crude_Oil_Price | -3.6611 | -3.204 | 0.002 | -5.957 | -1.365 |
EPU | 0.2675 | 2.249 | 0.029 | 0.028 | 0.507 |
由表可得:调整后的R2=0.995非常接近于1,回归方程显著,在95%置信水平下,每一个系数均通过了显著性检验,疫情后建立的回归方程如下所示。
由方程可知:疫情后美元每月M2供应量与进出口总值与黄金价格均存在积极的联系,原油价格与黄金呈负相关。三个变量对黄金价格影响均显著。
疫情期间美元供应增加引发通货膨胀,投资者可能会减少美元持有,转而寻求黄金其他避险资产来缓解避难情绪,推高了黄金价格;然而原油价格与黄金价格呈现负向变动,在经济学中两者之间存在替代效应,此消彼长;EPU指数越高,说明经济政策由于疫情的反复而出现不确定性,投资者为对冲风险更愿意将价值不稳定货币换成相对稳定的黄金,金价出现上升趋势。
二、结语
本文首先建立ARIMA(1,1,1)模型对未来8个月的黄金价格进行长期预测,后又建立灰色预测模型GM(1,1)对未来3个月的黄金价格进行短期预测,模型均通过检验,且拟合结果优秀。为了分析影响黄金价格的主要因素,通过对国内外同类研究的深入分析,本文结合中国的黄金经济市场实际情况,因此考虑了美元M2供应量、原油价格、EPU指数等五个关键因素对黄金价格的影响。
疫情前,原油价格、CPI和进出口总量对金价的上升有促进的作用,美元M2供应量与金价之间存在负向变动,EPU指数对黄金价格影响不显著。疫情爆发后,各变量对黄金的影响发生了显著的变化,具体表现在部分变量对黄金价格的作用方向以及程度都出现了差异,美元每月M2供应量与进出口总值与黄金价格均存在积极的联系,原油价格与黄金呈负相关。
对于金价的未来走势,基于拟合的模型的结果表明黄金在短期内仍然会保持上涨趋势。考虑到其受到海外降息预期上升以及地缘政治风险再起的影响,避险情绪不断走高,海内外黄金价格走势良好,预测黄金价格将维持震荡向上走势。
投资者在选择这些产品时可以结合本文研究结果分析,短期内金价总体呈现上涨的趋势,可以考虑对黄金进行适当购置。当美元每月M2供应量和中国不稳定政策发展指数降低时,金价可能会下跌,应当考虑购入黄金;而原油价格对黄金价格起到抑制作用。如果原油价格出现增长时,可以适当购入黄金。显然这些变量不能完全决定黄金的变化,应该更全面分析投资目标以及评估投资风险,谨慎做出决策,尤其注意黄金价格波动的风险。投资者需要谨慎评估自己的风险承受能力,选择适合自己的投资策略和产品。在投资过程中,投资者需要保持理性投资的心态,避免盲目跟风和过度交易。
参考文献:
[1] 杨柳勇.黄金价格的长期决定因素分析[J].统计研究,2004(06):21-24.
[2] 李陈思.运用时间序列预测中国黄金价格变动[J].产业创新研究,2022(23):81-83.
...