数学模型

Wang Haihua

🍈 🍉🍊 🍋 🍌


ARMA模型的构建及预报

在实际问题建模中, 首先要进行模型的识别与定阶, 即要判断是 $\operatorname{AR}(p)$ $\operatorname{MA}(q), \operatorname{ARMA}(p, q)$ 模型的类别, 并估计阶数 $p, q$ 。其实, 这都归结到模型 的定阶问题。当模型定阶后, 就要对模型参数 $\phi=\left[\phi_{1}, \phi_{2}, \cdots, \phi_{p}\right]^{T}$ 及 $\boldsymbol{\theta}=\left[\theta_{1}, \theta_{2}, \cdots, \theta_{q}\right]^{T}$ 进行估计。

定阶与参数估计完成后, 还要对模型进行检验, 即要检验 $\varepsilon_{t}$ 是否为平稳白噪声。若检验获得通过, 则 ARMA 时间序列的建模完成。作为时间序列建模之后的一个重要应用, 我们还要讨论 ARMA 时 间序列的预报。

ARMA 模型定阶的 AIC 准则

AIC 准则又称 Akaike 信息准则, 是由日本统计学家 Akaike 于 1974 年提出 的。AIC 准则是信息论与统计学的重要研究成果, 具有重要的意义。

$\operatorname{ARMA}(p, q)$ 序列 AIC 定阶准则为: 选 $p, q$, 使得 $$ \min \mathrm{AIC}=n \ln \hat{\sigma}_{\varepsilon}^{2}+2(p+q+1) \text {, } $$ 其中, $n$ 是样本容量, $\hat{\sigma}_{\varepsilon}^{2}$ 是 $\sigma_{\varepsilon}^{2}$ 的估计与 $p$ 和 $q$ 有关。若当 $p=\hat{p}, \boldsymbol{q}=\hat{\boldsymbol{q}}$ 时, 式 (18.21) 达到最小值, 则认为序列是 $\operatorname{ARMA}(\hat{p}, \hat{\boldsymbol{q}})$ 。

当 $\operatorname{ARMA}(p, q)$ 序列含有末知均值参数 $\mu$ 时, 模型为 $$ \phi(B)\left(X_{t}-\mu\right)=\theta(B) \varepsilon_{t}, $$ 这时, 末知参数个数为 $k=p+q+1$, AIC 准则为: 选取 $p, q$, 使得 $$ \min \mathrm{AIC}=n \ln \hat{\sigma}_{\varepsilon}^{2}+2(p+q+2) . \text { (18.22) } $$ 实际上, 式 (18.21) 与式 (18.22) 有相同的最小值点 $\hat{p}, \hat{q}$ 。

ARMA 模型的参数估计

ARMA 模型的参数估计有矩估计, 逆函数估计法, 最小二乘估计, 条件最小二乘估计, 最大似然估计等方法, 这里我们就不给出各种估计的数学原理和参数估计表达式, 直接使用 Python 库给出相关的参数估计。

ARMA 模型检验的 $\chi^{2}$ 检验

若拟合模型的残差记为 $\hat{\varepsilon}_{t}$, 它是 $\varepsilon_{t}$ 的估计。例如, 对 $\operatorname{AR}(p)$ 序列, 设末 知参数的估计是 $\hat{\phi}_{1}, \hat{\phi}_{2}, \cdots, \hat{\phi}_{p}$, 则残差 $\hat{\varepsilon}_{t}=X_{t}-\hat{\phi}_{1} X_{t-1}-\cdots-\hat{\phi}_{p} X_{t-p}, t=1,2, \cdots, n$, (设 $X_{0}=X_{-1}=\cdots=X_{1-p}=0$ ). 记 $$ \eta_{k}=\frac{\sum_{t=1}^{n-k} \hat{\varepsilon}_{t} \hat{\varepsilon}_{t+k}}{\sum_{t=1}^{n} \hat{\varepsilon}_{t}^{2}}, k=1,2 \cdots, L $$

其中 $L$ 为 $\hat{\varepsilon}_{t}$ 自相关函数的拖尾数, Ljung-Box 的 $\chi^{2}$ 检验统计量是 $$ \chi^{2}=\boldsymbol{n}(\boldsymbol{n}+2) \sum_{k=1}^{L} \frac{\eta_{k}^{2}}{\boldsymbol{n}-\boldsymbol{k}} . $$ 检验的假设是 $$ H_{0}: \rho_{k}=0 \text {, 当 } k \leq L ; H_{1}: \rho_{k} \neq 0 \text {, 对某些 } k \leq L \text {. } $$ 在 $H_{0}$ 成立时, 若样本容量 $n$ 充分大, $\chi^{2}$ 近似于 $\chi^{2}(L-r)$ 分布, 其中 $r$ 是 估计的模型参数个数。 $\chi^{2}$ 检验法:给定显著性水平 $\alpha$, 查表得上 $\alpha$ 分位数 $\chi_{\alpha}^{2}(L-r)$, 则当 $\chi^{2}>\chi_{\alpha}^{2}(L)$ 时拒绝 $H_{0}$, 即认为 $\varepsilon_{t}$ 非白噪声, 模型检验末通过; 而当 $\chi^{2} \leq \chi_{\alpha}^{2}(L-r)$ 时, 接受 $H_{0}$, 认为 $\varepsilon_{t}$ 是白噪声, 模型通过检验。