第16卷第9期 管理科学学报 Vol.16 No.9 2013年9月 JOURNAL OF MANAGEMENT SCIENCES IN CHINA Sep.2013 基于极差的区制转移随机波动率模型及其应用” 郑挺国,左浩苗2 (1.厦门大学王亚南经济研究院,厦门361005;2.中国人寿资产管理有限公司,北京100033) 摘要:关于金融波动率的建模,大量文献都是基于将收益率作为波动率代理变量,而基于极差 这一更有效的代理变量研究波动率的则相对较少.考虑到随机波动率模型的优势,将区制转移 引入到基于极差的随机波动率模型中,从而刻画金融市场中波动率水平可能存在的结构变化, 随后给出此波动率模型的MCMC估计,并利用模拟证明了该方法的有效性.基于以上模型,对 上证综指、深圳成指和沪深300指数的极差波动率进行了实证研究,并利用已实现波动率作为 基准、以稳健的损失函数作为判断准则的比较方法,与文献中常用的GARCH类模型和SV类 模型进行比较,进一步论证了提出模型的优势 关键词:极差;随机波动;区制转移;MCMC 中图分类号:F830.9文献标识码:A文章编号:1007-9807(2013)09-0082-13 0 引言 的已实现方差是真实波动率的一致估计量.非参 数方法中的另一类是无模型隐含波动率方法9), 波动率建模是金融计量经济学的核心问题之 可以在不依赖于特定的期权定价模型的前提下预 一.它的建模可以分为参数方法和非参数方法两 期风险中性条件下的波动率. 大类,在参数方法中,比较常用的是Engle和 在上述方法中,除了无模型隐含波动率方法 Bollerslev2]提出的GARCH类模型,以及Taylor3) 是利用期权数据得到风险中性测度下波动率的估 提出的随机波动率模型(stochastic volatility mod- 计外,其他方法均利用资产价格历史数据得到现 l,简称SV模型)等.GARCH类模型一般可将条 实测度下波动率的估计.传统的GARCH类模型 件方差表达为残差的自回归形式,通过对滞后的 和SV模型均是基于收益率数据的,即利用收益 历史信息赋予不同的权重得到对波动率的估计, 率的绝对值或者平方作为波动率的代理变量,进 能够刻画波动聚类的特征.与之不同,SV模型将 而得到真实波动率的估计.但是,收益率数据仅仅 波动率视为不可观测的过程,在对条件方差的刻 是利用了某一交易时段的最后的收盘价的信息, 画中也引入随机误差项.由于随机波动率模型可 而忽视了时段内价格变动的信息.例如,在市场剧 视为连续时间的布朗运动或跳跃扩散过程的离散 烈波动和比较平稳的情况下,价格过程均可能具 对应,在资产定价和衍生品定价中得到了广泛的 有相同的收盘价进而得到相同的收益率,但是在 应用4-6].在非参数方法中,随着高频数据的出 这两种情况下市场的波动状况是完全不同的.作 现,已实现波动率(realized volatility,简称RV)方 为更为理想的替代方案,极差(定义为某一时间 法得到了广泛的应用.Andersen等,8]证明在一 段内最高价与最低价之差)也可以作为波动率的 定条件下,通过对日内高频收益率平方求和得到 代理变量.Parkinsono最早对极差作为波动率代 ①收稿日期:2011-11-30;修订日期:2012-05-03. 基金项目:国家自然科学基金资助项目(71001087);国家留学基金委公派资助项目(201208350111);教育部人文社会科学研究规划基金 资助项目(11YJA790095):福建省自然科学基金资助项目(2010J01361):厦门大学优秀博士培养计划资助项目. 作者简介:郑挺国(1979一),男,浙江温岭人,博士,副教授.Email:zhengtg(@gmail.com 万方数据
第16卷第9期 2013年9月 管理科学学报 JOURNAL OF MANAGEMENT SCIENCES IN CHINA V01.16 No.9 Sep.2013 基于极差的区制转移随机波动率模型及其应用① 郑挺国1,左浩苗2 (1.厦门大学王亚南经济研究院,厦门361005;2.中国人寿资产管理有限公司,北京100033) 摘要:关于金融波动率的建模,大量文献都是基于将收益率作为波动率代理变量,而基于极差 这一更有效的代理变量研究波动率的则相对较少.考虑到随机波动率模型的优势,将区制转移 引入到基于极差的随机波动率模型中,从而刻画金融市场中波动率水平可能存在的结构变化. 随后给出此波动率模型的MCMC估计,并利用模拟证明了该方法的有效性.基于以上模型,对 上证综指、深圳成指和沪深300指数的极差波动率进行了实证研究,并利用已实现波动率作为 基准、以稳健的损失函数作为判断准则的比较方法,与文献中常用的GARCH类模型和SV类 模型进行比较,进一步论证了提出模型的优势. 关键词:极差;随机波动;区制转移;MCMC 中图分类号:F830.9 文献标识码:A 文章编号:1007—9807(2013)09—0082—13 0 引 言 波动率建模是金融计量经济学的核心问题之 一.它的建模可以分为参数方法和非参数方法两 大类.在参数方法中,比较常用的是Engle¨o和 Bollerslev【2 o提出的GARCH类模型,以及Taylor一1 提出的随机波动率模型(stochastic volatility mode1,简称sV模型)等.GARCH类模型一般可将条 件方差表达为残差的自回归形式,通过对滞后的 历史信息赋予不同的权重得到对波动率的估计, 能够刻画波动聚类的特征.与之不同,SV模型将 波动率视为不可观测的过程,在对条件方差的刻 画中也引入随机误差项.由于随机波动率模型可 视为连续时间的布朗运动或跳跃扩散过程的离散 对应,在资产定价和衍生品定价中得到了广泛的 应用M“J.在非参数方法中,随着高频数据的出 现,已实现波动率(realized volatility,简称RV)方 法得到了广泛的应用.Andersen等¨一。证明在一 定条件下,通过对日内高频收益率平方求和得到 的已实现方差是真实波动率的一致估计量.非参 数方法中的另一类是无模型隐含波动率方法一j, 可以在不依赖于特定的期权定价模型的前提下预 期风险中性条件下的波动率. 在上述方法中,除了无模型隐含波动率方法 是利用期权数据得到风险中性测度下波动率的估 计外,其他方法均利用资产价格历史数据得到现 实测度下波动率的估计.传统的GARCH类模型 和SV模型均是基于收益率数据的,即利用收益 率的绝对值或者平方作为波动率的代理变量,进 而得到真实波动率的估计.但是,收益率数据仅仅 是利用了某一交易时段的最后的收盘价的信息, 而忽视了时段内价格变动的信息.例如,在市场剧 烈波动和比较平稳的情况下,价格过程均可能具 有相同的收盘价进而得到相同的收益率,但是在 这两种情况下市场的波动状况是完全不同的.作 为更为理想的替代方案,极差(定义为某一时间 段内最高价与最低价之差)也可以作为波动率的 代理变量.Parkinsonl lol最早对极差作为波动率代 ①收稿13期:2011—11—30;修订13期:2012—05—03. 基金项目:国家自然科学基金资助项目(71001087);国家留学基金委公派资助项目(201208350111);教育部人文社会科学研究规划基金 资助项目(11YJA790095);福建省自然科学基金资助项目(2010J01361);厦门大学优秀博士培养计划资助项目. 作者简介:郑挺国(1979一),男,浙江温岭人,博士,副教授.Email:zhengtg@gmail.com 万方数据
第9期 郑挺国等:基于极差的区制转移随机波动率模型及其应用 -83- 理变量的性质进行了研究,认为极差利用了时间 和Susmel]及郑挺国35]等将马尔科夫区制转移 段内价格的变动区间信息而不仅仅是收盘时点的 引人到基于收益率的SV模型中.上述研究均表明在 信息,可以明显提高估计波动率的效率.随后Gar- 对金融时间序列研究过程中,波动率存在区制转移 man和Klass、Rogers和Satchell),以及Yang 是普遍现象,同时,上述文献[32-35]均证实,考虑 和Zhang1]等对极差估计量进行了修正和扩展. 波动均值的区制转移特征会得到更优的波动持续性 Parkinson]以及唐勇和张世英[4]证明基于极差 估计和动态拟合效果.鉴于此,本文在Alizadeh等] 的波动率估计量效率要高于基于收益率的波动率 的SV模型基础上提出了基于极差的马尔科夫区 估计量,前者的方差大概是后者的1/5,具有更窄 制转移随机波动率模型(range based Markov switc- 的置信区间.除了估计量精度的优势外,Alizadeh hing stochastic volatility model,简称RMSSV)模型,该 等)还指出,对数极差是近似正态的,避免了收 模型既具有极差波动率方法估计效率高的特点,也 益率尖峰厚尾分布造成的估计困难,也对微观市 同时刻画了金融市场周期性变化的特征 场结构噪音比较稳健.此外,由于金融市场报价信 本文的其他工作还包括:首先,结合RMSSV 息中长期以来通常都包含了日内交易的最高价和 模型设定的特征,给出了基于Gibs抽样的马尔 最低价,具有较长的样本区间,这使得基于极差的 科夫链蒙特卡罗模拟(Markov chain Monte Carlo, 波动率建模方法更具有广泛的适用性. 简称MCMC)估计方法,并通过模拟论证了估计 与基于收益率的波动率建模的诸多方法相 方法的有效性;其次,利用RMSSV模型对大陆市 比,基于极差的波动率建模方法相对较少.Aliza- 场3个代表性指数(上证综指、深圳成指和沪深 deh等[s1以及Brandt和Diebold[i6提出了基于极 300指数)的日度极差数据进行拟合,并进行了不 差的SV模型(range based stochastic volatility 同波动率估计方法的样本内拟合比较.Patton36) model,简称RSV模型),Chou),Li和Hong8、 在Hansen和Lunde)的基础上提出了以已实现 周杰和刘三阳)、李红权和汪寿阳20]等对基于 波动率作为基准和稳健的损失函数作为准则的比 极差的GARCH类模型进行了研究,蒋祥林等[2] 较方法,解决了传统的波动率估计方法依赖于存 探讨了基于日内价格幅度和收益率的随机波动率 在噪音的波动率代理指标和可能存在偏误的损失 模型,均证明了基于极差的波动率方法的有效性. 函数作为准则的问题,但在实证中仅比较了滚动估 由于随机波动率模型在连续时间金融以及资产定 计和RiskMetrics两种简单的波动率估计方法,而本 价中的广泛应用,本文对Alizadeh等1s1的方法进 文则进一步将其扩展应用到多种常见的波动率估计 行拓展.本文的主要工作是在Alizadeh等15]提出 模型中,更为充分地验证了RMSSV模型的优势 的RSV模型的基础上,引入具有波动均值区制转 移特征的马尔科夫动态过程,从而刻画波动率的 1 模型设定及估计方法 结构变化.大量文献证实了波动率可能具有结构 变化或区制转移的特征.在对波动率长记忆性的 研究中,Lamoureux和Lastrapes2就曾指出,可能 1.1基于收益率的SV模型 存在的结构突变会导致对波动持续性的高估, 根据Taylor]等的研究,基本SV模型设定为 Diebold和noue2s)也指出长记忆现象可能是因 r:06:exp(h/2) (1) 为波动率过程中存在结构突变,Granger和 h=u+p(h-1-u)+0nn (2) Hyung24进一步证实了上述观点,指出结构突变 hy-N( (3) 对长记忆性具有重要的解释效力.鉴于此,一些研 究将Hamilton2s]提出的马尔科夫区制转移方法 其中r:=log(S,/S,-1)表示股票价格S,的对数收益 引入到波动率过程中,从而可以捕捉波动率存在 率;h,≡logσ:表示对数方差,8,和7:是独立的正态 的内生变化过程,如Hamilton和Susmelt2、 分布的随机扰动项;σ是常量,在本文中标准化为1; Cai1、Gary2]、蒋祥林等91、孙金丽和张世 P是对数波动率持续性的度量,其绝对值小于1;参 英30]、赵华和蔡建文[31]等考虑了区制转移的 数u和σ,分别表示对数波动率的均值和波动率 GARCH类模型,而So等32]、Smith[)、Kalimipalli 对式(1)进行对数平方变换,可以得到 万方数据
第9期 郑挺国等:基于极差的区制转移随机波动率模型及其应用 理变量的性质进行了研究,认为极差利用了时间 段内价格的变动区间信息而不仅仅是收盘时点的 信息,可以明显提高估计波动率的效率.随后Gar. man和Klass¨“、Rogers和Satchell¨“,以及Yang 和Zhang¨纠等对极差估计量进行了修正和扩展. Parkinson¨钊以及唐勇和张世英¨41证明基于极差 的波动率估计量效率要高于基于收益率的波动率 估计量,前者的方差大概是后者的1/5,具有更窄 的置信区间.除了估计量精度的优势外,Alizadeh 等¨纠还指出,对数极差是近似正态的,避免了收 益率尖峰厚尾分布造成的估计困难,也对微观市 场结构噪音比较稳健.此外,由于金融市场报价信 息中长期以来通常都包含了日内交易的最高价和 最低价,具有较长的样本区间,这使得基于极差的 波动率建模方法更具有广泛的适用性. 与基于收益率的波动率建模的诸多方法相 比,基于极差的波动率建模方法相对较少.Aliza. deh等¨纠以及Brandt和Diebold-l钊提出了基于极 差的SV模型(range based stochastic volatility model,简称RSV模型),Choum J、Li和Hong¨8|、 周杰和刘三阳¨9|、李红权和汪寿阳Ⅲ1等对基于 极差的GARCH类模型进行了研究,蒋祥林等旧¨ 探讨了基于日内价格幅度和收益率的随机波动率 模型,均证明了基于极差的波动率方法的有效性. 由于随机波动率模型在连续时间金融以及资产定 价中的广泛应用,本文对Alizadeh等¨副的方法进 行拓展.本文的主要工作是在Alizadeh等¨纠提出 的RSV模型的基础上,引入具有波动均值区制转 移特征的马尔科夫动态过程,从而刻画波动率的 结构变化.大量文献证实了波动率可能具有结构 变化或区制转移的特征.在对波动率长记忆性的 研究中,Lamoureux和Lastrapes旧21就曾指出,可能 存在的结构突变会导致对波动持续性的高估, Diebold和Inoue嵋引也指出长记忆现象可能是因 为波动率过程中存在结构突变,Granger和 HyungⅢ1进一步证实了上述观点,指出结构突变 对长记忆性具有重要的解释效力.鉴于此,一些研 究将HamihonⅢ1提出的马尔科夫区制转移方法 引入到波动率过程中,从而可以捕捉波动率存在 的内生变化过程,如Hamilton和Susmelmo、 Cai[27『、Gary[28『、蒋祥林等‘29f、孙金丽和张世 英∞0|、赵华和蔡建文旧u等考虑了区制转移的 GARCH类模型,而so等∞引、Smith旧3。、Kalimipalli 和SusmelⅢ1及郑挺国∞纠等将马尔科夫区制转移 引入到基于收益率的SV模型中.上述研究均表明在 对金融时间序列研究过程中,波动率存在区制转移 是普遍现象,同时,上述文献[32—35]均证实,考虑 波动均值的区制转移特征会得到更优的波动持续性 估计和动态拟合效果.鉴于此,本文在Alizadeh等¨5J 的RSV模型基础上提出了基于极差的马尔科夫区 制转移随机波动率模型(range based Markov switching stochastic volatility model,简称RMSSV)模型,该 模型既具有极差波动率方法估计效率高的特点,也 同时刻画了金融市场周期性变化的特征. 本文的其他工作还包括:首先,结合RMSSV 模型设定的特征,给出了基于Gibbs抽样的马尔 科夫链蒙特卡罗模拟(Markov chain Monte Carlo, 简称MCMC)估计方法,并通过模拟论证了估计 方法的有效性;其次,利用RMSSV模型对大陆市 场3个代表性指数(上证综指、深圳成指和沪深 300指数)的日度极差数据进行拟合,并进行了不 同波动率估计方法的样本内拟合比较.Patton旧钊 在Hansen和Lunde日刊的基础上提出了以已实现 波动率作为基准和稳健的损失函数作为准则的比 较方法,解决了传统的波动率估计方法依赖于存 在噪音的波动率代理指标和可能存在偏误的损失 函数作为准则的问题,但在实证中仅比较了滚动估 计和RiskMetrics两种简单的波动率估计方法,而本 文则进一步将其扩展应用到多种常见的波动率估计 模型中,更为充分地验证了RMSSV模型的优势. 模型设定及估计方法 1.1基于收益率的SV模型 根据Taylor㈨等的研究,基本SV模型设定为 r。=盯s。exp(ht/2) (1) h。=p+妒(^,1一肛)+盯。叼。 (2) h,。Ⅳ(p,#、) (3) 1一(p 其中‘=log(S。/S川)表示股票价格Is。的对数收益 率;危。兰log吼2表示对数方差,B和%是独立的正态 分布的随机扰动项;盯是常量,在本文中标准化为1; p是对数波动率持续性的度量,其绝对值小于1;参 数p和%分别表示对数波动率的均值和波动率 对式(1)进行对数平方变换,可以得到 万方数据
-84 管理科学学报 2013年9月 logr子=h,+点 (4) 有考虑波动率过程本身可能存在结构突变.特别 其中:=1ge.式(2)和式(4)构成了状态空间 是对于股市的波动率而言,随着股市自身周期的 模型,式(4)为观测方程,式(2)为转移方程.在 变化,可能会呈现剧烈波动与相对平稳的市场状 假设6,服从标准正态分布的前提下,5:服从自由 况交替出现的情形.特别地,在市场处于剧烈波动 度为1的对数卡方分布,而这个分布的标准差、偏 的时候,波动率平均水平会处在高波动区制,而市 度、峰度分别为1.11、-1.53、6.93,与正态分布 场相对平稳时,波动率水平会在低波动区制,即波 的差别是比较大的.在正态假设下,Harvey等] 动率的水平可能存在结构变化.剧烈波动和相对 使用了拟极大似然估计的方法,但Kim等9]指出 平稳的市场状况的轮替次数以及持续时间是无法 该方法的有限样本性质较差,提出了采用7个正 实现预知的,这将不再适用以虚拟变量方式的结构 态分布组成的混合分布对:的分布进行逼近的 突变刻画方法.本文引人马尔科夫区制转移的方法 MCMC方法,随后Chib等[o]以及Omori等[41)提 对随机波动率模型进行扩展,式(6)可扩展为 出了其他的MCMC算法. h,=s,(1-p)+ph-l+0nn (7) 1.2基于极差的随机波动率模型 令".=3,(1-p),式(7)可以表示为 采用收益率的平方作为波动率代理变量时, h:=vs +phi-1 +onn (8) :的分布的非正态性给模型的估计造成困难.当 其中,状态变量S,有M个不同的取值,代表波动 采用极差作为波动率代理变量时,Feller'2】证明 率的长期水平处在不同的状态.假设S,服从一阶 给出在无漂移项标准几何布朗运动假设下,对数 马氏过程,转移概率矩阵如下 极差的标准差、偏度和峰度分别为0.29,0.17和 [P1 P12 PIM 2.80,与标准正态是较为接近的. P=[Py] p21p22 P2M (9 利用这一性质,Alizadeh等s]提出了基于极 差的随机波动率模型 PMM y,=h,+e, (5) 其中p:=Pr[S,=j引S1=]表示从状态S-1= h:=u+(h1-u)+om (6) 其中y,=log(1ogH-logL)表示对数极差;h,= :转移到3,=)的概率,并满足之,=L这祥, logo:表示对数波动率;H,和L,代表某一时段内 4s,=S:+…+uwSM,其中S.为哑变量,表示当 的最高价和最低价.此外,令v=(1-p)μ,式(6) 且仅当S,=j时S。=1.与Sun)等类似,本文中 可以等价地写为h=v+ph-1+on其中,由于 进一步假定M=2,则S.=1和,=2分别表示 &,是近似正态的,Alizadeh等1s)利用拟极大似然 市场处于高波动状态和低波动状态.此时,转移概 方法得到模型参数的估计值,并且通过蒙特卡罗 率矩阵简化为 模拟,通过日内高频数据得到极差,发现对参数的 P=P 1-P1 估计的效率高于利用收益率的绝对值作为波动率 (10) 1-g9 代理变量的随机波动率方法.同时,他们的模拟研 其中p和q分别表示波动率保持在高或低水平的 究也发现基于极差的波动率估计对微观市场结构 概率.这里的设定与RSV的区别在于将波动率的 噪音不敏感,比基于收益率的模型得到的对波动 水平设置为状态依赖的,在不同的波动率区制下 率的估计也更为准确.该模型充分利用了极差的 取不同的值,来反映波动水平本身的结构变化.在 近似对数正态、估计效率高和对微观市场结构噪 基于收益率的随机波动率模型中,这一做法是将 音稳健的特征,将通常采用的作为波动率的代理 SV模型扩展到MSSV模型时最常见的做法,例如 变量的对数收益率的绝对值替换为对数极差,改 So等[2]和Sun]的工作,而本文将这种做法延 进了对参数的估计和波动率的提取 伸到了基于极差的随机波动率模型中.这样,本文 1.3基于极差的马尔科夫区制转移随机波动率 提出的RMSSV模型既利用极差的信息优势,得到 模型 参数和波动率更为准确的估计,也能够将波动率 正如引言中所指出的,上述方法的不足是没 水平的结构变化考虑在内,不依赖于先验信息的 万方数据
.--——84.--—— 管理科学学报 2013年9月 log r;=h。+亭。 (4) 其中£=log B2.式(2)和式(4)构成了状态空间 模型,式(4)为观测方程,式(2)为转移方程.在 假设8。服从标准正态分布的前提下,£服从自由 度为1的对数卡方分布,而这个分布的标准差、偏 度、峰度分别为1.11、一1.53、6.93,与正态分布 的差别是比较大的.在正态假设下,Harvey等[38] 使用了拟极大似然估计的方法,但Kim等∞引指出 该方法的有限样本性质较差,提出了采用7个正 态分布组成的混合分布对孝。的分布进行逼近的 MCMC方法,随后Chib等㈤1以及Omori等H¨提 出了其他的MCMC算法. 1.2 基于极差的随机波动率模型 采用收益率的平方作为波动率代理变量时, £的分布的非正态性给模型的估计造成困难.当 采用极差作为波动率代理变量时,FellerM21证明 给出在无漂移项标准几何布朗运动假设下,对数 极差的标准差、偏度和峰度分别为0.29,0.17和 2.80,与标准正态是较为接近的. 利用这一性质,Alizadeh等¨纠提出了基于极 差的随机波动率模型 Y。=h;+占。 (5) h。=/.t+妒(h,l一肛)+or。叼。 (6) 其中Y。=log(109H,一logL。)表示对数极差;^。= log盯。表示对数波动率;皿和£。代表某一时段内 的最高价和最低价.此外,令秽=(1一妒)肛,式(6) 可以等价地写为h。=秽+础¨+盯。7/。.其中,由于 s。是近似正态的,Alizadeh等u副利用拟极大似然 方法得到模型参数的估计值,并且通过蒙特卡罗 模拟,通过日内高频数据得到极差,发现对参数的 估计的效率高于利用收益率的绝对值作为波动率 代理变量的随机波动率方法.同时,他们的模拟研 究也发现基于极差的波动率估计对微观市场结构 噪音不敏感,比基于收益率的模型得到的对波动 率的估计也更为准确.该模型充分利用了极差的 近似对数正态、估计效率高和对微观市场结构噪 音稳健的特征,将通常采用的作为波动率的代理 变量的对数收益率的绝对值替换为对数极差,改 进了对参数的估计和波动率的提取. 1.3 基于极差的马尔科夫区制转移随机波动率 模型 正如引言中所指出的,上述方法的不足是没 有考虑波动率过程本身可能存在结构突变.特别 是对于股市的波动率而言,随着股市自身周期的 变化,可能会呈现剧烈波动与相对平稳的市场状 况交替出现的情形.特别地,在市场处于剧烈波动 的时候,波动率平均水平会处在高波动区制,而市 场相对平稳时,波动率水平会在低波动区制,即波 动率的水平可能存在结构变化.剧烈波动和相对 平稳的市场状况的轮替次数以及持续时间是无法 实现预知的,这将不再适用以虚拟变量方式的结构 突变刻画方法本文引入马尔科夫区制转移的方法 对随机波动率模型进行扩展,式(6)可扩展为 h。=/xs。(1一妒)十妒^卜1+盯田叼。 (7) 令秽。.=p。.(1—9),式(7)可以表示为 h‘=秽s;+9^t一1+盯叼叼l (8) 其中,状态变量|s。有M个不同的取值,代表波动 率的长期水平处在不同的状态。假设s。服从一阶 马氏过程,转移概率矩阵如下 P=[P“]= P11 P12 p21 p22 pMt pm (9) 其中p。=Pr[S。=_『l S¨=i]表示从状态SH= 村 i转移到S。=歹的概率,并满足∑P#=1.这样, ps=肛1S1。+…+肛_】lf.s胁,其中JsA为哑变量,表示当 且仅当S。=J时.s。=1.与Sun【4纠等类似,本文中 进一步假定M=2,则S。=1和S,=2分别表示 市场处于高波动状态和低波动状态.此时,转移概 率矩阵简化为 P:『 p 1一p1 (10) o 1一q q 1 其中P和g分别表示波动率保持在高或低水平的 概率.这里的设定与RSV的区别在于将波动率的 水平设置为状态依赖的,在不同的波动率区制下 取不同的值,来反映波动水平本身的结构变化.在 基于收益率的随机波动率模型中,这一做法是将 sV模型扩展到MSSV模型时最常见的做法,例如 So等旧2 o和SunM列的工作,而本文将这种做法延 伸到了基于极差的随机波动率模型中.这样,本文 提出的RMSSV模型既利用极差的信息优势,得到 参数和波动率更为准确的估计,也能够将波动率 水平的结构变化考虑在内,不依赖于先验信息的 村 村 胁胁;‰咐 ● ● ● ● 万方数据
第9期 郑挺国等:基于极差的区制转移随机波动率模型及其应用 一 85- 前提下确定波动的不同区制和持续时间. 3)从f八P,9S+)中抽取p8+),gg+) 1.4估计方法 由式(5)和式(7)构成的系统可以表示为马 4)运用多步移动的方法,从f(,|y,S+), 尔科夫区制转移的状态空间模型,可以在Kim和 p,4,,o0,o)中抽取的w Nelson']提出的基于吉布斯抽样(Gibbs sampling)方法的基础上加以改进进行估计.吉布 5)从fo,4|$w,”,p,o)中抽 斯抽样是通过对条件分布序贯抽样来近似联合分 取+,+. 布的抽样方法,最早由文献[45]提出.吉布斯抽 6)从f代p|4+,2,39*),的+”,o) 样实际是对Metropolis抽样方法[6]的改进,并在 中抽取p+) 时间序列模型的估计中得到了广泛的应用,例如 Carlin等4)、Carter和Kohn],而Jacquier等9] 7)从fo,0,|+,41,3+),), 最早将其应用到了随机波动率模型的估计上. p+)中抽取σ+》,og+. 与传统极大似然估计方法不同,贝叶斯方法 上述抽样过程共进行M+W次,其中M次为 中将状态变量h,S,均视为待估的参数.记= 预烧(burn in sample),确保抽样过程收敛,而参 数的分布则利用随后的N次抽样计算得到. (y1,…y)',=(h,…,h)',S=(S1,…, S)',0=(p,9,P山1山,0。,0n)'为模型原有参数 2 模拟结果 这样,新的参数空间变为w=(,S,)'.根据贝叶 斯法则,参数向量的联合后验分布可以表示为 为了验证上述吉布斯抽样方法的估计性质, f(h,S,01y) 进行了如下的模拟.由于极差的计算需要利用日 内最高和最低的价格数据,采用离散化的几何布 f(yl h,S,0)f(hI s,0)f(SI 0)f(0) 朗运动来生成日内的价格序列 (11) 5,ia=5,(-1)a+06uV△ (14) 其中 logo,=(1-p),+plog(o-1)+Bee√历 (15) 0,l,3,0)=fGli,0)=Πxlh,) 其中T表示天数;N表示日内价格观测数,tW< i≤(t+1)W,t=1,…,T:H=1/257是年度化时间区 2a2 间;A=H/N是日内价格变动的时间区间;8和e (12) 是标准正态的扰动项.在模拟中,假设中=0.9, 山1=-12=-1.5,对应波动率的高状态和低状 fir|3r,0)=Πxlh,S,0) 态同时,p=0.99,9=0.97,N=1000,B=0.75, h-,-ph)2 T=1000.根据上述设定,可以计算得到o,= 22 0.0468,0。=0.29.根据对数极差的分布,其均值为 0.43+0.5logH+logg,因此为与log,对应,极差 (13) 应减去0.43+0.5logH得到调整后极差.本文均进 由此,模型的MCMC估计算法概述如下: 行这一调整,类似的做法也可在文献[50]中找到 1)给出初始值.?={h9}I1和0的初始值 设定完成后,采用MCMC估计方法每进行一 0P=(po,g,p,40,o0,0)',其中 次模拟,得到每个参数的分布.为了近似反映多次 S,的初始抽样是根据状态转移概率矩阵的初值 模拟的整体效果,采用一次模拟的后验均值作为 生成的马尔科夫过程得到的,令g=0 该次模拟的代表,并重复模拟500次,对500个后 2)运用多步移动的方法,从f(Sn|,p,, 验均值求均值,标准差及95%的区间.从表1的结 果可以看到,这样得到的均值与模拟时采用的真 q0,p,,,σ)中成块抽取S+). 实值非常接近,均值的标准差普遍较小.同时,真 万方数据
第9期 郑挺国等:基于极差的区制转移随机波动率模型及其应用 一85一 前提下确定波动的不同区制和持续时间. 1.4 估计方法 由式(5)和式(7)构成的系统可以表示为马 尔科夫区制转移的状态空间模型,可以在Kim和 Nelson惮1提出的基于吉布斯抽样(Gibbs sampling)方法的基础上加以改进进行估计.吉布 斯抽样是通过对条件分布序贯抽样来近似联合分 布的抽样方法,最早由文献[45]提出.吉布斯抽 样实际是对Metropolis抽样方法Ⅲ1的改进,并在 时间序列模型的估计中得到了广泛的应用,例如 Carlin等‘471、Carter和Kohn‘删,而Jacquier等‘491 最早将其应用到了随机波动率模型的估计上. 与传统极大似然估计方法不同,贝叶斯方法 中将状态变量h。,S。均视为待估的参数.记觅= (Y1’...,Y。)’,I。t,=(h,,…,h。)’,墨=(S1,.一, S。)7,秒II-(P,q,qo,it,牝,盯。,盯。)7为模型原有参数 这样,新的参数空间变为∞=(群,霹,口,’.根据贝叶 斯法则,参数向量的联合后验分布可以表示为 以薪,薪,p I薪)oc 以薪I薪,霹,p状薪I霹,p状薪I口狄p) (11) 其中 八薪I薪,薪,p)钒薪I薪,口)=I-If(y,I h。,口) =鱼瓦1t =l^/Zffi'O"唧(一譬) 、 坷. , (12) r 以薪I薪,口)=Hf(y。I h。,S。,口) I=1 =珥T去唧(_ 2盯: (13) 由此,模型的MCMC估计算法概述如下: 1)给出初始值.群={h?}乙。和口的初始值 oo=(P‘0’,q∞’,妒∞’,pf们,正∞,盯:们,盯?’)’,其中 薪的初始抽样是根据状态转移概率矩阵的初值 生成的马尔科夫过程得到的,令g=0. 2)运用多步移动的方法,从以薪I砰’,P咕’, q‘引,妒‘引,肛:引,p{引,盯,’)中成块抽取鼯“’. 3)从以p,q l鼢+1’)中抽取p‘纠’,q‘州’. 4)运用多步移动的方法,从火薪I薪,砰“’, 9‘引,肛}引,肛i引,盯≯’,盯≯’)中抽取砰“’. 5)从f(vo,tJ,I鼯“’,砰“’,9瞻’,盯≯’)中抽 取肛}g+l’,p{g+1’. 6)从以9 p:s“’,从s+2’,砰“’,砰+1’,盯≯’) 中抽取妒‘8“’. 7)从八盯。,or。l肛:s“’,肛i8“’,鼯“’,砰“’, 妒幢“’)中抽取盯≯+1’,盯≯“’. 上述抽样过程共进行M+Ⅳ次,其中肘次为 预烧(burn in sample),确保抽样过程收敛,而参 数的分布则利用随后的Ⅳ次抽样计算得到. 2 模拟结果 为了验证上述吉布斯抽样方法的估计性质, 进行了如下的模拟.由于极差的计算需要利用日 内最高和最低的价格数据,采用离散化的几何布 朗运动来生成日内的价格序列 s叫A=sI,(H)△+盯l占“仫 (14) log吼=(1-‘o)its.+自olog(tr。一1)恤。√日(15) 其中r表示天数;Ⅳ表示日内价格观测数,tN< i≤(t+1)Ⅳ,t=1,…,T;H=1/257是年度化时间区 间;△=H/N是日内价格变动的时间区间;8。和气 是标准正态的扰动项.在模拟中,假设9=0.9, p,=一1,心=一1.5,对应波动率的高状态和低状 态同时,P=0.99,q=0.97,N=1 000,卢=0.75, T=1 00.根据上述设定,可以计算得到%= 0.046 8,盯。=0.29.根据对数极差的分布,其均值为 0.43+0.5 log日+logO"t,因此为与log吼对应,极差 应减去o.43+0.5 log H得到调整后极差.本文均进 行这一调整,类似的做法也可在文献[50]中找到. 设定完成后,采用MCMC估计方法每进行一 次模拟,得到每个参数的分布.为了近似反映多次 模拟的整体效果,采用一次模拟的后验均值作为 该次模拟的代表,并重复模拟500次,对500个后 验均值求均值,标准差及95%的区间.从表1的结 果可以看到,这样得到的均值与模拟时采用的真 实值非常接近,均值的标准差普遍较小.同时,真 万方数据
—86 管理科学学报 2013年9月 实值也落在95%的均值分布区间中,同时与区间 拟研究表明,至少对于长度为1000的样本而言, 的端,点也比较接近,这表明500次模拟和估计得 上述估计方法能够得到参数的准确估计,而由于 到的后验均值均较为接近真实值.上述模拟表明, 极差估计量的效率优势,与同等长度的收益率数 采用的MCMC方法能够得到参数的有效估计.模 据而言对参数的估计精度更高. 表1500次模拟结果 Table 1 Result of 500 times of simulation 参数 真实值 均值 标准差 95%区间 p 0.9900 0.9833 0.0071 [0.9674,0.9933] 9 0.9700 0.9611 0.0101 [0.9457,0.9814] 0.9000 0.8821 0.0482 [0.7680,0.9487] On 0.0468 0.0471 0.0112 [0.0292,0.0715] O& 0.2900 0.2945 0.0073 [0.2795,0.3100] -1.0000 -1.0344 0.0607 [-1.1668,-0.9266] 2 -1.5000 -1.5389 0.0281 [-1.6021,-1.4885】 注:表中均值、标准差和95%区间表示对500次模拟得到的后验均值计算得到, Zhou's1]的做法,删除了隔夜收益率.先验分布的 3实证结果 设定中,借鉴Kim等9,S0等]的做法,设定p, g的先验分布为贝塔分布,fp)cp(1-p)-, 3.1模型估计结果 0<p<1,其中a。=10,a1=1;p,41,h2的先验 这里分别估计上证综合指数、深证成分指数 分布为正态分布N(0.95,1),W(-3,1), 和沪深300指数的波动状况.由于本文采用作为 N(1,1);o,o,的先验分布为逆伽马分布 比较基准的已实现波动率需要利用日内高频数 1G(0.5o,0.56),=2,6=0.02vo.在估计过 据,考虑到数据可得性,上证综指和深圳成指的样 程中,预烧抽样次数为50000,总抽样次数为 本区间为2003-01-02~2011-09-26,共 100000.经尝试更多的抽样次数,结果基本不变. 2121个观测,沪深300指数的样本区间从该指数 表2报告了参数的均值及其后验分布的90% 的发布日起,为2005-04-08~2011-09-26, 区间,从中可以注意到,主要参数的后验区间均比 共1576个观测.上述样本均超过了模拟的样本程 较窄,表明估计效率较高.对3个市场而言,其中 度,对于实证分析而言样本长度是充分的.数据来 高、低波动区制的概率均达到较高水平,这表明高 源为CSMAR数据库.已实现波动率计算方法与 波动或者低波动区制均具有很强的持续性.而且, Andersen等7,si和Patton36]的一致,为日内5min 高、低波动均值在90%置信区间都明显不相交, 收益率平方求和计算得到,并根据Tauchen和 这说明模型可以捕捉显著的高低波动水平变化 表2 RMSSV模型估计结果 Table 2 Estimation results of RMSSV models 上证综指 深证成指 沪深300 参数 均值 90%区间 均值 90%区间 均值 90%区间 0.9952 [0.9858,0.9993] 0.9955 [0.9870,0.9993] 0.9961 [0.9905,0.9994] 9 0.9976 「0.9937,0.9996 0.9976 [0.9943,0.9996] 0.9968 [0.9920,0.9995] 华 -4.0181 [-4.1332,-3.8911] -3.9151 [-4.0045,-3.8103] -3.9914 [-4.0915,-3.8883] % -4.6318 [-4.7212,-4.5566] -4.5266 [-4.5983,-4.46501 -4.5358 [-4.6153,-4.44781 p 0.9311 [0.9014,0.9537] 0.9195 [0.8872,0.9480] 0.9286 [0.8972.0.9576] 0看 0.0977 [0.0841,0.1163] 0.1089 [0.0935,0.1251] 0.1036 [0.0875,0.1229] 0.3646 [0.3530.0.3757] 0.3606 [0.3493,0.3718 0.3658 [0.3534,0.3783] 万方数据
一86~ 管理科学学报 2013年9月 实值也落在95%的均值分布区间中,同时与区间 的端点也比较接近,这表明500次模拟和估计得 到的后验均值均较为接近真实值.上述模拟表明, 拟研究表明,至少对于长度为1 000的样本而言, 上述估计方法能够得到参数的准确估计,而由于 极差估计量的效率优势,与同等长度的收益率数 采用的MCMC方法能够得到参数的有效估计.模 据而言对参数的估计精度更高. 表1 500次模拟结果 Table l Result of 500 times of simulation 参数 真实值 均值 标准差 95%区间 p 0.990 0 0.983 3 O.007 1 [0.967 4,0.993 3] g 0.970 0 0.961 1 0.010 1 [0.945 7,0.981 4] ∞ 0.900 O 0.882 l 0.048 2 [0.768 0,0.948 7] 盯" 0.046 8 0.047 1 0.011 2 [0.029 2,0.071 5] 盯s 0.290 O 0.294 5 O.007 3 [0.279 5,0.310 0] p1 一1.000 0 —1.034 4 0.060 7 [一1.166 8,一0.926 6] № 一1.500 O 一1.538 9 0.028 l [一1.602 1,一1.488 5] 注:表中均值、标准差和95%区间表示对500次模拟得到的后验均值计算得到 3 实证结果 3.1 模型估计结果 这里分别估计上证综合指数、深证成分指数 和沪深300指数的波动状况.由于本文采用作为 比较基准的已实现波动率需要利用日内高频数 据,考虑到数据可得性,上证综指和深圳成指的样 本区间为2003—01—02—2011—09—26,共 2 121个观测,沪深300指数的样本区间从该指数 的发布日起,为2005—04—08~2011—09—26, 共1 576个观测.上述样本均超过了模拟的样本程 度,对于实证分析而言样本长度是充分的.数据来 源为CSMAR数据库.已实现波动率计算方法与 Zhou∞川的做法,删除了隔夜收益率.先验分布的 设定中,借鉴Kim等口9|、so等口23的做法,设定P, q的先验分布为贝塔分布以P)OC P咖(1一P)1-aI, 0<P<1,其中ao=10,O/1=1;妒,肛l,肛2的先验 分布为正态分布N(0.95,1),N(一3,1), N(1,1);盯:,盯i的先验分布为逆伽马分布 IG(O.5v。,0.5氏),秽。=2,氏=0.02vo.在估计过 程中,预烧抽样次数为50 000,总抽样次数为 100 000.经尝试更多的抽样次数,结果基本不变. 表2报告了参数的均值及其后验分布的90% 区间.从中可以注意到,主要参数的后验区间均比 较窄,表明估计效率较高.对3个市场而言,其中 高、低波动区制的概率均达到较高水平,这表明高 波动或者低波动区制均具有很强的持续性.而且, Andersen等‘7’81 Patton‘36 3的一致,为Et内5 min 高、低波动均值在90%置信区间都明显不相交, 收益率平方求和计算得到,并根据Tauchen和 这说明模型可以捕捉显著的高低波动水平变化. 表2 RMSSV模型估计结果 Table 2 Estimation results of RMSSV models 上证综指 深证成指 沪深300 参数 均值 90%区间 均值 90%区间 均值 90%区间 p 0.995 2 [0.985 8,0.999 3] 0.995 5 [0.987 0,0.999 3] 0.996 1 [0.990 5,0.999 4] g 0.997 6 [0.993 7,0.999 6] 0.997 6 [0.994 3,0.999 6] 0.996 8 [0.992 0,0.999 5] “1 —4.018 1 [一4.133 2,一3.891 1] 一3.915 l [一4.004 5,一3.810 3] 一3.991 4 [一4.091 5,一3.888 3] P-2 —4.63l 8 [一4.721 2,一4.556 6] 一4.526 6 [一4.598 3,一4.465 0] 一4.535 8 [一4.615 3,一4.447 8] ∞ O.93l 1 [0.901 4,0.953 7] 0.919 5 [0.887 2,0.948 0] 0.928 6 [0.897 2,0.957 6] 盯" 0.097 7 [0.084 1,0.116 3] 0.108 9 [0.093 5,0.125 1] O.103 6 [0.087 5,0.122 9] 矿£ 0.364 6 [0.353 0,0.375 7] 0.360 6 [0.349 3,0.371 8] 0.365 8 [0.353 4,0.378 3] 万方数据