基于高频数据的金融波动率模型
李胜歌,张世英
(天津大学管理学院,天津300072)
摘
要:金融高频数据和金融波动率是目前金融领域研究的热点问题。本文对基于金融高频数据的
—“已实现”双幂次变差进行了建模和预测。“已实现”双幂次变差无模型、计算简便,金融波动率估计量——
在一定条件下是金融波动率的无偏估计量,并且具有稳健性和有效性。通过用上证综指对“已实现”双幂已实现”双幂次变差时间序列具有长记忆性。次变差进行ARFIMA建模,发现中国股票市场的上证综指“
已实现”双幂次变差;ARFIMA模型关键词:金融高频数据;“中图分类号:F830
文献标识码:A
文章编号:1002-6487(2008)01-0007-02
“已实现”波动。同时Bandorff-Nielsen和NeilShephard指出
在不存在跳跃和存在有限次跳跃的条件下,当r+s=2并且r∈(0,2)时,有下式成立:
M→∞
0引言
金融高频数据是指以小时、分钟或秒为抽样频率的日内数据。一般而言,金融市场的信息是连续影响资产价格运动过程的,数据频率越低,则损失的信息越多;反之,数据频率越高,获得的市场信息就越多。因此,随着计算机及通信技术的发展,当获取金融高频数据成为可能后,金融高频数据的研究就成为了金融研究领域中的焦点。
金融波动率的研究一直以来就是人们研究的热点问题。准确的金融波动率估计、建模等问题具有重要的意义,它是进行资产定价、风险管理、投资组合等研究的基础。在金融高频数据中,Andersen和Bollerslev提出了一种全新的波动率度量方法———“已实现”波动(RealizedVolatility,RV)来估计金融波动率,随后Bandorff-Nielsen和NeilShephard提出了又一类似“已实现”波动的波动率估计量———“已实现”双幂次变差(RealizedBipowerVariation,RBV),该估计量不但具
计算简便、具有无偏有“已实现”波动的所有优点,如无模型、
性等,而且具有稳健性,同时比“已实现”波动更有效。因此本文选取“已实现”双幂次变差来进行金融波动率建模。双幂次变差1“已实现”
设yj,t=y(t-1)h+hjM-y(t-1)h+h(j-1)M,yt=yth-y(t-1)h,t=1,2,…,T,j=1,2,
-1
-1
limμrμ2-rRBVt
r/2
-1-1[r,2-r]
→
’
ht
h(t-1)
σ(s)ds
2
Γ(1(r+1))
其中,μ,Γ(p)表示伽玛函数。可以看出r=2
Γ()当r+s=2并且r∈(0,2)时,“已实现”双幂次变差在M→∞条件下的概率极限为积分波动(IntegratedVolatility,IV),并且
对偶尔出现的跳跃具有稳健性。在一定条件下,“已实现”双幂次变差是比“已实现”波动更有效的波动率估计量,并且当
已实现”双幂次变差的有效性比r、r=s=1时的“s取其它值时
的“已实现”双幂次变差以及“已实现”波动都更有效[8]。因此,“已实现”双幂次变差是比较理想的金融波动估计量。双幂次变差建模2“已实现”
2.1ARFIMA模型
J J P P
…,M。其中h>0,为固定的时间区间(如一天、一周等,本文中
指一天,即h=1);T为样本空间;M为在[(t-1)h,th]时间段内等时间间隔的采样次数(h=1,则M为日抽样频率);y(t-1)h+hjM表
-1
P
“已实现”波动估计量具有显著的长记忆性,即分整(FractionallyIntegrated)的性质,通常长记忆性可以用分整自回归移动平均模型(AutoregressiveFractionallyIntegrated
已实现”双MovingAverageModel,ARFIMA)来进行刻画[9]。“
幂次变差类似于“已实现”波动估计量,因此也可以考虑对其进行ARFIMA建模,通过分维数d的估计值就可以得知“已实现”双幂次变差时间序列是否具有长记忆性。
若平稳时间序列^Xt‘满足差分方程:
示金融资产在第((t-1)h)天的第j个日内对数价格;yth表示第
P
th天的对数价格;yj,t为金融资产在第t天的第j个时间间隔的日内对数价格收益;yt为金融资产第t天的日间对数价格
已实现”双幂收益。Bandorff-Nielsen和NeilShephard定义“
次变差为:
rsM-1h
RBVt=∑j=1yj,tyj+1,t,r,s≥0,t=1,2,…,T
当r=2,s=0或者r=0,s=2时,“已实现”双幂次变差即为
[r,s]
"
1-(r+s)/2
Φ(L)(1-L)d(Xt-μ)=Θ(L)ηt
其中,L为滞后算子,|d|<0.5,^ηt‘为白噪声序列,μ为^Xt‘的均值,Φ(L)与Θ(L)分别为p阶和q阶平稳的自回归算子和可逆的移动平均算子,则称^Xt‘为分整自回归移动平均模型,简记为ARFIMA(p,d,q)。
分整自回归移动平均模型ARFIMA(p,d,q)用p+q个参数描述过程的短记忆特征,以参数d反映过程的长记忆特征。因此ARFIMA(p,d,q)模型综合考虑了过程的长记忆和短
记忆过程,既优于单纯描述短记忆过程的自回归移动平均
基金项目:国家自然科学基金资助项目(70471050)
统计与决策2008年第1期(总第253期)
7
(AutoregressiveMovingAverage)ARMA(p,q)模型,又优于单独描述长记忆过程的分整差分噪声(FractionalDifferencedNoise,FDN)模型。当ARFIMA(p,d,q)模型中的参数p=q=0时,即为FDN模型,而当参数d=0时,则为ARMA模型。2.2分维数d的估计
ARFIMA模型中分维数d可以用聚合方差法来进行估计[10]。将时间序列G XtI ,t=1,2,…,T分成样本容量为m的[T/m]个子样本,在每个子样本内求均值,对于固定的m值,可以得到一个聚合序列:
km1xk=∑xt,k=1,2,…,[T/m]t=(k-1)m+1
其中[T/m]为取整运算。此序列的样本方差估计量为:
(m)
了很好的刻画,进而可以对“已实现”双幂次变差进行预测。t-1时刻对t时刻“已实现”双幂次变差的预测值为:μ1RBVt|t-1=μ1
2
-2
-2
^t+1σ^。图1RBVt-η
η
图1
^r(x(m))=1va
(xk)-(1! k=1
(m)2
[T/m]
k=1
! x
[T/m]
给出了“已实现”双幂次变差和“已实现”双幂次变差的预测
值,其中均方根误差为8.16×10-5,平均绝对值误差为4.89×10-5
。准确的金融波动率预测为资本资产定价、投资组合、风险管理等金融应用领域的研究提供了基础。
(m)2k
)
^r(x),当子样本容对于不同的m值,可以得到不同的va
量m充分大时,有
22H-2
^r(x(m))~vaσm0
2
(m)
4结束语
金融高频数据比低频数据包含了更多的市场信息,因此
基于金融高频时间序列的波动率估计也就比基于低频时间序列的波动率估计要准确,而且金融高频领域采用“已实现”波动作为金融波动率的度量方法,避免了低频领域中复杂的参数估计。本文选用“已实现”双幂次变差这一具有无偏性、稳健性和有效性等良好统计性质的波动率估计量进行建模,通过ARFIMA模型对“已实现”双幂次变差时间序列的长记忆性进行了很好的刻画。通过“已实现”双幂次变差的
已实现”双幂次变差的ARFIMA建模,发现中国上证综指的“
金融波动时间序列具有长记忆性,扰动项对波动率的冲击会维持若干个时期才会逐渐消退。对“已实现”双幂次变差进行ARFIMA建模后,还可以实现对金融波动率的准确预测,这对金融应用领域的研究具有重要意义。
参考文献:
其中σ为常数。于是0
^r(x(m))=C0+(2H-2)lnmlnva
其中C0=lnσ。利用最小二乘法可以得到H的估计值。H0
为Hurst值数,它是描述分数布朗运动的重要参数,它与ARFIMA模型中的分维数d有如下的确定关系:H=d+0.5。因此,借助于估计H的方法即可以估计出分维数d。
2
3实证研究
本文实证研究采用的高频数据为2002.1.4—2005.12.30上证综指的1分钟间隔时段的收盘价,这期间共有963个交易日,共有241×已实现”963=232083个数据。对r=s=1时的“双幂次变差建立ARFIMA(p,d,q)模型:
Φ(L)(1-L)d(μ)=Θ(L)ηi.i.d(0,σt,ηt~1RBVt-μη)
其中,L为滞后算子,0≤d≤1,μ为“已实现”双幂次变差的均值,Φ(L)与Θ(L)分别为p阶和q阶平稳的滞后算子多项式。若分G ηtI 序列反映了市场的信息,是市场波动产生的原因。维数d=0,则G η已实现”双幂次变差时间序列的影响tI 序列对“
是短期的,G RBVtI 为短记忆过程;若0<d<1,则G η已实tI 序列对“现”双幂次变差时间序列的影响是长期的,G RBVtI 具有波动持续性;若d=1,则G η已实现”双幂次变差时间序列的tI 序列对“
影响将是长期和永久持续的,G RBVtI 具有波动持续性。
选取10分钟的金融高频数据进行ARFIMA(p,d,q)建模。通过聚合方差法对分维数d进行估计,得到d的估计值为:
经过反复试验,最终选用ARFIMA(1,d,1)0.38556,显著大于0。
模型来对“已实现”双幂次变差时间序列进行建模,利用极大似然估计方法对ARFIMA模型中的参数进行估计,结果如下:
-22
(1+0.11304L)(1-L)0.38556(μ10-4)=(1-0.42476L)ηt1RBVt-1.02×
从以上结果可以获知中国上证综指的“已实现”双幂次变差时间序列为长记忆时间序列,并且具有分维数特性,扰动项对波动序列的影响将会持续若干个时期才会消退。这一特性由分整自回归移动平均模型ARFIMA(p,d,q)得到了很好的刻画。
“已实现”双幂次变差是具有稳健性和有效性的波动率估计量,能够较准确地对金融波动率进行估计,通过ARFI-
已实现”双幂次变差时间序列的长记忆性进行MA建模,对“
-2
[1]AndersenT.G.,TimBollerslev,F.X.Diebold,et.al.ExchangeRate
ReturnsStandardizedbyRealizedVolatilityare(nearly)Gaussian[J].MultinationalFinanceJournal,2000,4.
[2]AndersenT.G.,TimBollerslev,F.X.Diebold,et.al.TheDistributionofRealizedExchangeRateVolatility[J].JournaloftheAmericanStatisticalAssociation,2001,96.
[3]AndersenT.G.,TimBollerslev,F.X.Diebod,et.al.TheDistribu-tionofRealizedStockReturnVolatility[J].JournalofFinancialEconomics,2001,61(1).
[4]AndersenT.G.,TimBollerslev,F.X.Diebod,et.al.ModellingandForecastingRealizedVolatility[J].Econometrica,2003,71(2).
[5]Barndorff-NielsenOE,ShephardN.PowerandBipowerVariationwithStochasticVolatilityandJumps[J].JournalofFinancialE-conometrics,2004,2(1).
[6]ShephardN,Barndorff-NielsenOE,GraversenSE,etal.LimitTheoremsforBipowerVariationinFinancialEconometrics[J].Econo-metricTheory,2006,22(4).
[7]ShephardN,Barndorff-NielsenOE.EconometricsofTestingforJumpsinFinancialEconomicsusingBipowerVariation[J].JournalofFinancialEconometrics,2006,4.
[8]李胜歌,张世英.已实现双幂次变差与多幂次变差的有效性分析[J].系统工程学报,2007,22(81).
[9]张世英,樊智.协整理论与波动模型:金融时间序列分析及应用[M].北京:清华大学出版社,2004.
[10]Taqqu,M.S.,V.Teverovsky,W.Willinger.Estimationsfor
Long-rangeDependence:anEmpiricalStudy[J].Fractals,1995,3(4).
(责任编辑/亦民)
8
统计与决策2008年第1期(总第253期)
基于高频数据的金融波动率模型
李胜歌,张世英
(天津大学管理学院,天津300072)
摘
要:金融高频数据和金融波动率是目前金融领域研究的热点问题。本文对基于金融高频数据的
—“已实现”双幂次变差进行了建模和预测。“已实现”双幂次变差无模型、计算简便,金融波动率估计量——
在一定条件下是金融波动率的无偏估计量,并且具有稳健性和有效性。通过用上证综指对“已实现”双幂已实现”双幂次变差时间序列具有长记忆性。次变差进行ARFIMA建模,发现中国股票市场的上证综指“
已实现”双幂次变差;ARFIMA模型关键词:金融高频数据;“中图分类号:F830
文献标识码:A
文章编号:1002-6487(2008)01-0007-02
“已实现”波动。同时Bandorff-Nielsen和NeilShephard指出
在不存在跳跃和存在有限次跳跃的条件下,当r+s=2并且r∈(0,2)时,有下式成立:
M→∞
0引言
金融高频数据是指以小时、分钟或秒为抽样频率的日内数据。一般而言,金融市场的信息是连续影响资产价格运动过程的,数据频率越低,则损失的信息越多;反之,数据频率越高,获得的市场信息就越多。因此,随着计算机及通信技术的发展,当获取金融高频数据成为可能后,金融高频数据的研究就成为了金融研究领域中的焦点。
金融波动率的研究一直以来就是人们研究的热点问题。准确的金融波动率估计、建模等问题具有重要的意义,它是进行资产定价、风险管理、投资组合等研究的基础。在金融高频数据中,Andersen和Bollerslev提出了一种全新的波动率度量方法———“已实现”波动(RealizedVolatility,RV)来估计金融波动率,随后Bandorff-Nielsen和NeilShephard提出了又一类似“已实现”波动的波动率估计量———“已实现”双幂次变差(RealizedBipowerVariation,RBV),该估计量不但具
计算简便、具有无偏有“已实现”波动的所有优点,如无模型、
性等,而且具有稳健性,同时比“已实现”波动更有效。因此本文选取“已实现”双幂次变差来进行金融波动率建模。双幂次变差1“已实现”
设yj,t=y(t-1)h+hjM-y(t-1)h+h(j-1)M,yt=yth-y(t-1)h,t=1,2,…,T,j=1,2,
-1
-1
limμrμ2-rRBVt
r/2
-1-1[r,2-r]
→
’
ht
h(t-1)
σ(s)ds
2
Γ(1(r+1))
其中,μ,Γ(p)表示伽玛函数。可以看出r=2
Γ()当r+s=2并且r∈(0,2)时,“已实现”双幂次变差在M→∞条件下的概率极限为积分波动(IntegratedVolatility,IV),并且
对偶尔出现的跳跃具有稳健性。在一定条件下,“已实现”双幂次变差是比“已实现”波动更有效的波动率估计量,并且当
已实现”双幂次变差的有效性比r、r=s=1时的“s取其它值时
的“已实现”双幂次变差以及“已实现”波动都更有效[8]。因此,“已实现”双幂次变差是比较理想的金融波动估计量。双幂次变差建模2“已实现”
2.1ARFIMA模型
J J P P
…,M。其中h>0,为固定的时间区间(如一天、一周等,本文中
指一天,即h=1);T为样本空间;M为在[(t-1)h,th]时间段内等时间间隔的采样次数(h=1,则M为日抽样频率);y(t-1)h+hjM表
-1
P
“已实现”波动估计量具有显著的长记忆性,即分整(FractionallyIntegrated)的性质,通常长记忆性可以用分整自回归移动平均模型(AutoregressiveFractionallyIntegrated
已实现”双MovingAverageModel,ARFIMA)来进行刻画[9]。“
幂次变差类似于“已实现”波动估计量,因此也可以考虑对其进行ARFIMA建模,通过分维数d的估计值就可以得知“已实现”双幂次变差时间序列是否具有长记忆性。
若平稳时间序列^Xt‘满足差分方程:
示金融资产在第((t-1)h)天的第j个日内对数价格;yth表示第
P
th天的对数价格;yj,t为金融资产在第t天的第j个时间间隔的日内对数价格收益;yt为金融资产第t天的日间对数价格
已实现”双幂收益。Bandorff-Nielsen和NeilShephard定义“
次变差为:
rsM-1h
RBVt=∑j=1yj,tyj+1,t,r,s≥0,t=1,2,…,T
当r=2,s=0或者r=0,s=2时,“已实现”双幂次变差即为
[r,s]
"
1-(r+s)/2
Φ(L)(1-L)d(Xt-μ)=Θ(L)ηt
其中,L为滞后算子,|d|<0.5,^ηt‘为白噪声序列,μ为^Xt‘的均值,Φ(L)与Θ(L)分别为p阶和q阶平稳的自回归算子和可逆的移动平均算子,则称^Xt‘为分整自回归移动平均模型,简记为ARFIMA(p,d,q)。
分整自回归移动平均模型ARFIMA(p,d,q)用p+q个参数描述过程的短记忆特征,以参数d反映过程的长记忆特征。因此ARFIMA(p,d,q)模型综合考虑了过程的长记忆和短
记忆过程,既优于单纯描述短记忆过程的自回归移动平均
基金项目:国家自然科学基金资助项目(70471050)
统计与决策2008年第1期(总第253期)
7
(AutoregressiveMovingAverage)ARMA(p,q)模型,又优于单独描述长记忆过程的分整差分噪声(FractionalDifferencedNoise,FDN)模型。当ARFIMA(p,d,q)模型中的参数p=q=0时,即为FDN模型,而当参数d=0时,则为ARMA模型。2.2分维数d的估计
ARFIMA模型中分维数d可以用聚合方差法来进行估计[10]。将时间序列G XtI ,t=1,2,…,T分成样本容量为m的[T/m]个子样本,在每个子样本内求均值,对于固定的m值,可以得到一个聚合序列:
km1xk=∑xt,k=1,2,…,[T/m]t=(k-1)m+1
其中[T/m]为取整运算。此序列的样本方差估计量为:
(m)
了很好的刻画,进而可以对“已实现”双幂次变差进行预测。t-1时刻对t时刻“已实现”双幂次变差的预测值为:μ1RBVt|t-1=μ1
2
-2
-2
^t+1σ^。图1RBVt-η
η
图1
^r(x(m))=1va
(xk)-(1! k=1
(m)2
[T/m]
k=1
! x
[T/m]
给出了“已实现”双幂次变差和“已实现”双幂次变差的预测
值,其中均方根误差为8.16×10-5,平均绝对值误差为4.89×10-5
。准确的金融波动率预测为资本资产定价、投资组合、风险管理等金融应用领域的研究提供了基础。
(m)2k
)
^r(x),当子样本容对于不同的m值,可以得到不同的va
量m充分大时,有
22H-2
^r(x(m))~vaσm0
2
(m)
4结束语
金融高频数据比低频数据包含了更多的市场信息,因此
基于金融高频时间序列的波动率估计也就比基于低频时间序列的波动率估计要准确,而且金融高频领域采用“已实现”波动作为金融波动率的度量方法,避免了低频领域中复杂的参数估计。本文选用“已实现”双幂次变差这一具有无偏性、稳健性和有效性等良好统计性质的波动率估计量进行建模,通过ARFIMA模型对“已实现”双幂次变差时间序列的长记忆性进行了很好的刻画。通过“已实现”双幂次变差的
已实现”双幂次变差的ARFIMA建模,发现中国上证综指的“
金融波动时间序列具有长记忆性,扰动项对波动率的冲击会维持若干个时期才会逐渐消退。对“已实现”双幂次变差进行ARFIMA建模后,还可以实现对金融波动率的准确预测,这对金融应用领域的研究具有重要意义。
参考文献:
其中σ为常数。于是0
^r(x(m))=C0+(2H-2)lnmlnva
其中C0=lnσ。利用最小二乘法可以得到H的估计值。H0
为Hurst值数,它是描述分数布朗运动的重要参数,它与ARFIMA模型中的分维数d有如下的确定关系:H=d+0.5。因此,借助于估计H的方法即可以估计出分维数d。
2
3实证研究
本文实证研究采用的高频数据为2002.1.4—2005.12.30上证综指的1分钟间隔时段的收盘价,这期间共有963个交易日,共有241×已实现”963=232083个数据。对r=s=1时的“双幂次变差建立ARFIMA(p,d,q)模型:
Φ(L)(1-L)d(μ)=Θ(L)ηi.i.d(0,σt,ηt~1RBVt-μη)
其中,L为滞后算子,0≤d≤1,μ为“已实现”双幂次变差的均值,Φ(L)与Θ(L)分别为p阶和q阶平稳的滞后算子多项式。若分G ηtI 序列反映了市场的信息,是市场波动产生的原因。维数d=0,则G η已实现”双幂次变差时间序列的影响tI 序列对“
是短期的,G RBVtI 为短记忆过程;若0<d<1,则G η已实tI 序列对“现”双幂次变差时间序列的影响是长期的,G RBVtI 具有波动持续性;若d=1,则G η已实现”双幂次变差时间序列的tI 序列对“
影响将是长期和永久持续的,G RBVtI 具有波动持续性。
选取10分钟的金融高频数据进行ARFIMA(p,d,q)建模。通过聚合方差法对分维数d进行估计,得到d的估计值为:
经过反复试验,最终选用ARFIMA(1,d,1)0.38556,显著大于0。
模型来对“已实现”双幂次变差时间序列进行建模,利用极大似然估计方法对ARFIMA模型中的参数进行估计,结果如下:
-22
(1+0.11304L)(1-L)0.38556(μ10-4)=(1-0.42476L)ηt1RBVt-1.02×
从以上结果可以获知中国上证综指的“已实现”双幂次变差时间序列为长记忆时间序列,并且具有分维数特性,扰动项对波动序列的影响将会持续若干个时期才会消退。这一特性由分整自回归移动平均模型ARFIMA(p,d,q)得到了很好的刻画。
“已实现”双幂次变差是具有稳健性和有效性的波动率估计量,能够较准确地对金融波动率进行估计,通过ARFI-
已实现”双幂次变差时间序列的长记忆性进行MA建模,对“
-2
[1]AndersenT.G.,TimBollerslev,F.X.Diebold,et.al.ExchangeRate
ReturnsStandardizedbyRealizedVolatilityare(nearly)Gaussian[J].MultinationalFinanceJournal,2000,4.
[2]AndersenT.G.,TimBollerslev,F.X.Diebold,et.al.TheDistributionofRealizedExchangeRateVolatility[J].JournaloftheAmericanStatisticalAssociation,2001,96.
[3]AndersenT.G.,TimBollerslev,F.X.Diebod,et.al.TheDistribu-tionofRealizedStockReturnVolatility[J].JournalofFinancialEconomics,2001,61(1).
[4]AndersenT.G.,TimBollerslev,F.X.Diebod,et.al.ModellingandForecastingRealizedVolatility[J].Econometrica,2003,71(2).
[5]Barndorff-NielsenOE,ShephardN.PowerandBipowerVariationwithStochasticVolatilityandJumps[J].JournalofFinancialE-conometrics,2004,2(1).
[6]ShephardN,Barndorff-NielsenOE,GraversenSE,etal.LimitTheoremsforBipowerVariationinFinancialEconometrics[J].Econo-metricTheory,2006,22(4).
[7]ShephardN,Barndorff-NielsenOE.EconometricsofTestingforJumpsinFinancialEconomicsusingBipowerVariation[J].JournalofFinancialEconometrics,2006,4.
[8]李胜歌,张世英.已实现双幂次变差与多幂次变差的有效性分析[J].系统工程学报,2007,22(81).
[9]张世英,樊智.协整理论与波动模型:金融时间序列分析及应用[M].北京:清华大学出版社,2004.
[10]Taqqu,M.S.,V.Teverovsky,W.Willinger.Estimationsfor
Long-rangeDependence:anEmpiricalStudy[J].Fractals,1995,3(4).
(责任编辑/亦民)
8
统计与决策2008年第1期(总第253期)