ADF检验中滞后长度的选择——基于ARIMA(0,1,Q)过程的模拟证据(1)

2021-09-05 来源：欧得旅游网

关键词 adf检验滞后长度信息准则修正的信息准则从一般到特殊法

一、引言

类似地，hall(1994)还从一个纯自相关过程入手，给出了当真实数据生成过程是一个arima(p,1,0)过程时，adf统计量服从df分布应满足的假设条件。并讨论了不同滞后长度选择准则对adf统计量极限分布的影响。他认为当运用aic、sic、hqic以及gsc确定滞后长度时，满足上述条件，因此adf统计量仍服从标准df分布，而运用sgc时不能满足上述条件，从而adf统计量的极限分布发生变化，不再服从标准df分布。最后对于不同的arima(p,1,0)过程，模拟了基于各种准则的adf检验功效与实际检验水平。

此外，随着研究的不断深入，学者们又从一些新的角度对滞后长度选择的问题进行了探讨。比如ng和perron(2001)将elliott、rothenberg、和stock(1996)[3]以及dufour和king(1991)[4]提出的局部gls退势法与perron和ng(1996)[5]提出的修正的单位根检验统计量相结合，提出了一系列mgls统计量来检验单位根。在这种检验中，他们首度运用了一系列修正的信息准则(modified information criteria，以下简写为mic)来确定滞后长度，并给出了其局部渐近性质。mic与一般信息准则的本质区别就在于它考虑到检验式中一阶滞后项参数估计量的偏差与滞后长度是高度相关的，进而通过加入一个包含一阶滞后项参数估计量的修正项对信息准则拟和不足的问题进行了一定的校正。ng和perron(2005)又重点探讨了在运用各种信息准则时，可用观测值个数(即调整的样本容量)、计算均方误差时的自由度、以及计算惩罚因子(penalty factor)时使用的观测值个数对滞后长度选择的影响。结果表明在有限样本下aic与sic选择的滞后长度对上述三个因素非常敏感。

综上所述，已有的研究主要集中在对arima(p,1,0)和arima(0,1,1) 过程进行单位根检验时，各方法确定的滞后长度以及相应的单位根检验的功效与实际水平上。而对arima(0,1,q)

即含有单位根的高阶移动平均过程的研究则比较少。另外，也鲜见mic与其他方法比较的相关研究。针对这些问题，本文对hall(1994)，ng和perron(1995, 2001)的方法和结论进行扩展，在接下来的部分中用蒙特卡罗模拟的方法在有限样本下研究一个更一般的arima(0,1,q)过程，对模拟结果中不同滞后期选择方法尤其是mic的优劣进行比较，以期找到一种能应用在更一般的数据生成过程中，并使adf检验推断更真实可靠的滞后长度选择方法。最后一部分是对全文的总结，并提出了一些滞后项选择及adf检验中需要注意的问题。

二、模拟结果

根据hall(1994)，ng和perron(1995, 2001)文章中的结论，运用信息准则和gsc确定滞后长度时，adf统计量仍服从标准df分布。其中运用gsc时滞后差分项以的速度收敛于真值，从而使adf检验有一个更优的有限样本性质。mic是对通常信息准则的修正。因此本文选取aic、sic、maic、msic以及gsc五种方法来确定adf检验式中的滞后长度。重点考察小样本下当误差项为高阶移动平均过程时基于各准则的adf检验功效和实际检验水平的特征，以及mic与其他方法相比对adf检验统计推断的影响和滞后长度选择的异同。各方法确定滞后长度的原理如下：

首先，aic与sic具有相似的形式，选择的滞后长度k满足使(1)式的值最小。其中aic准则中ct=2，sic准则中ct=logt，表示估计方程的误差均方，它往往随着滞后长度的增加而下降。是adf检验式中的解释变量个数，它等于滞后差分项个数k加上常数项以及时间趋势项，会随滞后长度的增加而变大，代表了对过度拟和的惩罚。因此选择k使(1)最小意味着在较少参数和较小的残差平方和之间做出选择。

(1)

另外，ng和perron(2001)提出了一系列的修正的信息准则即mic。其选择的滞后长度是使得目标方程(2)的值最小的k，依据ct的表达式不同mic又分别称为maic与msic。

(2)

它与一般的信息准则的不同就是增加了一个修正因子，其表达式为：

(3)

其中是adf检验式中一阶滞后项的参数估计量。ng和perron(2001)证明会随着adf检验式中滞后差分项个数k的增加而减小，尤其当数据生成过程的移动平均部分含有负根时，这种减小更加明显，因此可以有效地校正一般信息准则拟和不足的问题。

(4)

其中 (5)

(6)

它代表所有解释变量的方差协方差矩阵，是中右下方m×m阶的块矩阵。

代表该检验式回归函数的误差均方，其中代表回归式的残差。

检验规则为：j从最大的取值jmax开始，依次降低其取值直到(4)式表示的统计量显著。该统计量服从自由度为m的χ2分布。基于显著性水平α，滞后长度k的取值为① k = j +1，当是统计量所有值中第一个大于临界值的值时。② k = 0，当统计量所有值均小于临界值时。

为了考察误差项为高阶移动平均过程时adf检验中滞后长度的选择问题，我们对形如(7)式的数据生成过程共10种情况运用上述五种方法选择滞后长度继而进行adf检验。

(7)

其中l是滞后因子，ut是白噪声，y0=0。

10种数据生成过程如下：①θ1=0.8, θ2=0.0, θ3=0.0, θ4=0.0; ②θ1=0.5, θ2=0.0, θ3=0.0, θ4=0.0; ③θ1=-0.5, θ2=0.0, θ3=0.0, θ4=0.0; ④θ1=-0.8, θ2=0.0, θ3=0.0, θ4=0.0; ⑤θ1=0.8, θ2=0.5, θ3=0.0, θ4=0.0; ⑥θ1=0.5, θ2=0.3, θ3=0.0, θ4=0.0; ⑦θ1=-0.5, θ2=0.3, θ3=0.0, θ4=0.0; ⑧θ1=-0.8, θ2=0.5, θ3=0.0, θ4=0.0; ⑨θ1=-0.8, θ2=-0.5, θ3=0.0, θ4=0.0; ⑩θ1=0.5, θ2=0.3, θ3=0.2, θ4=0.1。这10种情况描述了误差项移动平均部分的根在个数、大小、正负等方面的不同情形。

adf检验的原假设h0: ρ = 1；备择假设h1: ρ < 1。adf检验式如下：

(a)

(b)

为考察不同情形下adf检验的功效和实际检验水平，我们对每种数据生成过程分别取β=1、0.95、0.85，用rats6.2模拟样本容量t=100时基于两种检验式(a)和(b)的上述检验过程以及t=250时基于检验式(a)的上述检验过程。对每种情况重复10000次，计算adf统计量小于临界值的概率，同时记录每次选择的滞后长度，最后计算滞后长度的均值和标准差。当真实数据生成过程是单位根过程即β = 1时，adf统计量小于临界值的概率就是犯弃真错

误的概率，即实际检验水平。而当真实数据生成过程为平稳过程即β < 1时，adf统计量小于临界值的概率则是1-犯取伪错误的概率，即检验功效。这里运用gsc确定滞后长度时取m=1，即计算单个参数的t统计量，显著性水平取5%，各准则的最大滞后长度取kmax = 20[6]。

根据模拟结果，我们重点比较了各方法在滞后长度选择及其相应的adf检验功效和实际检验水平方面的异同，并考察了误差项为高阶移动平均时的各种数据生成过程、不同检验式以及样本容量对滞后长度选择及adf检验统计推断的影响，从而对hall(1994)，ng和perron(1995)的结论做了一定的补充。

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

ADF检验中滞后长度的选择——基于ARIMA(0,1,Q)过程的模拟证据(1)