财经研究  2017, Vol. 43 Issue (12): 74-99     
文章浏览量:[]

0

文章信息

财经研究
2017年43卷第12期
杜在超, Juan Carlos Escanciano,
Du Zaichao, Juan Carlos Escanciano.
期望损失的后验分析
Backtesting expected shortfall:accounting for tail risk
财经研究, 2017, 43(12): 74-99
Journal of Finance and Economics, 2017, 43(12): 74-99.

文章历史

收稿日期:2017-06-28
《财经研究》
2017第43卷第12期

编者按

量化市场风险对于期权定价、投资、金融监管和风险管理具有重要意义。而风险量化的关键在于选择科学的评估指标和工具。本期《财经研究》“海外归来”栏目翻译了西南财经大学经济与管理研究院杜在超教授和美国印第安纳大学Juan Carlos Escanciano教授在Management Science 2017年第4期合作发表的论文“Backtesting Expected Shortfall:Accounting for tail risk”。该文首次提出了期望损失模型的后验分析方法,填补了金融风险管理领域的一个空白,也可为国内金融机构和学者提供借鉴和参考。

① 原文版权归属INFORMS(http://www.informs.org),译文已获得原文的中文翻译版权。中文译文中出现的错误INFORMS概不负责,中文译文文责作者自负。我们感谢张栋浩在中文译稿中的大力帮助。Management Science是管理类国际顶级期刊。杜在超教授于2010年获得印第安纳大学经济学博士学位,2010年8月回国任教,2015年被评为教育部首届青年长江学者,主要研究领域包括金融计量和应用计量。

期望损失的后验分析
杜在超1 , Juan Carlos Escanciano2     
1. 西南财经大学 经济与管理研究院,四川 成都 610074;
2. 美国印第安纳大学文理学院经济系,布鲁明顿 47405
摘要: 巴塞尔委员会已经批准用期望损失(Expected ShortfallES)作为市场风险指标对银行业进行监管,以替代现有的在险价值指标(Value-at-RiskVaR)。这主要是因为期望损失满足风险度量应该满足的性质,而在险价值则不满足。在这个转变过程中,金融机构面临的主要困难是没有工具可以用来评估期望损失模型,即后验分析,而本文则提出了一套简单的ES后验分析工具。具体而言,我们基于累积碰撞序列(Cumulative Violations)构造了一套ES模型的检验方法,该方法是对VaR后验分析的自然推广。我们推导出了该检验的渐进分布性质,并且通过蒙特卡洛模拟研究了它们的有限样本表现。通过将该方法应用于全球三大股票指数,我们发现,在2007年金融危机期间,VaR模型无法识别出金融危机时期与正常时期市场风险模型的差异,而ES模型则可以。
关键词: 风险管理    期望损失    后验分析    尾部风险    在险价值    
Backtesting Expected Shortfall:Accounting for Tail Risk
Du Zaichao1, Juan Carlos Escanciano2     
1. Research Institute of Economics and Management, Southwestern University of Finance and Economics, Chengdu 610074, China; Depar;
2. Department of Economics, Indiana University, Bloomington IN 47405, USA
Summary: The Basel Committee on Banking Supervision(BIS)has recently sanctioned Expected Shortfall(ES)as the market risk measure to be used for banking regulatory purposes, replacing the well-known Value-at-Risk(VaR). This change is motivated by the appealing theoretical properties of ES as a measure of risk and the poor properties of VaR. In particular, VaR fails to control for "tail risk". In this transition, the major challenge faced by financial institutions is the unavailability of simple tools for evaluation of ES forecasts(i.e. backtesting ES). The main purpose of this article is to propose such tools. Specifically, we propose backtests for ES based on cumulative violations, which are the natural analogue of the commonly used backtests for VaR. We establish the asymptotic properties of the tests, and investigate their finite sample performance through some Monte Carlo simulations. An empirical application to three major stock indexes shows that VaR is generally unresponsive to extreme events such as those experienced during the recent financial crisis, while ES provides a more accurate description of the risk involved.
Key words: risk management    expected shortfall    backtesting    tail risk    Value-at-Risk    

一、引言

市场风险的量化是学者和金融机构普遍感兴趣的问题,这对于期权定价、投资组合以及风险管理都非常重要。20世纪90年代以来,度量市场风险的主要指标是在险价值(VaRValue-at-Risk)(Jorion,2006;Christoffersen,2009)。VaR描述了在给定置信水平的情况下,一个投资组合可能遭受的最大损失。尽管VaR概念简单、计算方便,但是它却不是一个很好的风险度量指标。VaR没有考虑尾部风险,它仅仅告诉我们在没有发生尾部事件时的最大损失,但没有指出尾部事件发生时可能遭受的损失大小。VaR也存在其他的缺陷,包括不满足次可加性(Artzner等,1997,1999;Acerbi和Tasche,2002)和凸性(Basak和Shapiro,2001)。期望损失(ESExpected Shortfall)克服了上述VaR的缺陷,是一种满足“一致性”的风险度量指标,ES计算了超过给定置信水平的损失的平均值。在2012年5月3日的巴塞尔协议III中,巴塞尔委员会明确地提出要逐步淘汰VaR,并采用ES作为替代指标。但是,使用ES作为度量市场风险的主要指标面临的一大挑战是,没有工具对ES进行评估(Yamai和Yoshiba,2002,2005;Kerkhof和Melenberg,2004)。本文的主要目的就是提供这样的评估工具。

ES其他名称包括:条件VaR、平均VaR、尾部VaR或者平均尾部损失。

我们提出的方法主要是基于下面的观察。对每个置信水平而言,如果VaR模型是设定正确的,中心化的碰撞序列(投资组合损失超过VaR与否)应该是一个鞅差序列(Berkowitz, Christoffersen和Pelletier,2011)。如果在左侧尾部的置信区间内求取中心化碰撞序的积分,也可以形成一个鞅差序列,我们把它叫做“累积碰撞序列”。就像ES是左侧尾部VaR的积分一样,累积碰撞序列是对左侧尾部所有碰撞序列的积分。因此,我们可以通过检验累积碰撞序列是否为鞅差序列来检验ES模型(Escanciano和Lobato,2009a)。具体而言,我们提出了一种Box-Pierce形式的检验(Box和Pierce,1970)。我们的Box-Pierce检验是对以往文献关于VaR条件后验分析的自然推广(Christoffersen,1998;Berkowitz, Christoffersen和Pelletier,2011)。同样地,我们基于累积碰撞序列的t检验是对VaR无条件后验分析的自然推广(Kupiec,1995)。McNeil和Frey(2000)、Berkowitz(2001)、Kerkhof和Melenberg(2004)、Wong(2008,2010)以及Acerbi和Szekely(2014)曾提出了ES的无条件后验分析方法,而本文是第一个提出ES条件后验分析方法的文章。但是出于完整性考虑,我们也报告了无条件后验分析的结果。

② 众所周知,对常用的模型(比如说,滤波历史模拟法)而言,条件后验分析比无条件后验分析更有检验力(Escanciano和Pei,2012)。

我们对ES的后验分析考虑了有碍参数估计对检验的影响。已有文献对VaRES预测的估计误差进行了广泛研究,包括Christoffersen和Goncalves(2005)、Gourieroux和Zakoian(2013)以及Francq和Zakoian(2015)。Escanciano和Olmo(2010)研究了VaR后验分析存在的估计风险。针对ES后验分析的文献,只有Kerkhof和Melenberg(2004)在对无条件后验分析进行历史模拟时考虑了估计风险。与Escanciano和Olmo(2010)类似,我们从理论和模拟上证明了,当样本内观测没有比样本外观测大很多的时候,忽略估计风险将会给ES后验分析带来极大的Size扭曲(size distortions)。为了解决该局限性,我们提出了修正的后验分析,该方法充分考虑了估计风险,并通过蒙特卡洛模拟证明了稳健性。

本文想传达的主要信息是,与大多数学术和非学术文献相反,ES后验分析并没有比VaR后验分析困难很多。我们提出的后验分析很容易执行,是对VaR后验分析方法的自然推广,也可以作为巴塞尔委员会建议的内部模型方法的工具箱,因此可谓是一个可以更好捕捉尾部事件的市场风险度量与评估。

③ 我们的观点与Kerkhof and Melenberg(2005)、Acerbi和Szekely(2014)相同。并且,Acerbi和Szekely(2014)讨论了对ES做后验分析的可能性,以及阐述了“诱发性”(Elicitability)的概念。

本文余下内容安排如下。第二部分介绍本文常用的表达符号,以及后验分析所涉及的基本内容。第三部分我们提出新的无条件和条件后验分析,并求解它们的渐进性质。第四部分通过蒙特卡洛模拟研究后验分析的有限样本表现。第五部分采用金融危机后的日度数据,将本文提出的后验分析应用于三大主要股票指数,包括标普500、德国DAX指数以及恒生指数。实证结果显示,VaR对金融危机期间的极端事件的反应较为迟钝,而ES则提供了尾部风险的准确描述。第六部分总结全文。附录是本文的数学证明。

二、累积碰撞序列

Yt是银行在t时刻的收益,Ωt-1是风险管理者获得的t-1期的信息集,包括Yt的滞后值以及其他变量Xt的滞后值。也就是,Ωt-1={Xt-1, Xt-2, …; Yt-1, Yt-2, …}。我们假设,{ Yt, Xt} t=∞是严格平稳、遍历性过程,参考Escanciano(2007)的研究,我们的结果也可以扩展到一些非严格平稳和非遍历性序列中。G(., Ωt-1)是给定Ωt-1Yt的条件累积分布函数,即G(., Ωt-1)=Pr(Yt≤.|Ωt-1)。为了表达的简便,我们在所有包含随机变量的等式中删去了“almost surely”的说法。假设G(., Ωt-1)是连续的。将α∈[0, 1]记为置信水平。α置信水平的VaR定义如下:

$ \Pr \left( {{Y_t} \le - Va{R_t}\left( \alpha \right)\left| {{\mathit{\Omega }_{t - 1}}} \right.} \right) = \alpha $ (1)

也就是说,-VaRt(α)是累积分布函数Gα分位点的取值,VaRt(α)=-G-1(α, Ωt-1)=-inf{y:G(y, Ωt-1)≥α}。

定义时刻t,置信水平α时的碰撞序列是ht(α)=1(YtVaRt(α)),其中,1(.)是示性函数。当t时刻的损失大于等于VaRt(α)时,示性函数取值1,否则取值0。(1)式的含义是碰撞序列是一个均值为α的伯努利变量,并且对于每一个α∈[0, 1],中心化的碰撞序列(centered violations)都是鞅差序列,即对每一个α∈[0, 1],都有E[ht(α)-α|Ωt-1]=0。

这个约束条件已经成为对VaR进行后验分析的基础。它的两个主要推论包括碰撞序列{ ht(α)-α} t=1的零均值性质和不相关性质,分别是Kupiec(1995)的无条件后验分析以及Chirstoffersen(1998)的条件后验分析的基础。这也是最为广泛使用的后验分析方法。

VaR由于没有捕捉尾部风险而被广泛批评。这也可以从碰撞序列{ ht(α)-α} t=1中看出来,它仅仅包含了损失是否超过VaR的信息,但是并没有包含尾部事件所造成的损失额信息。VaR没有捕捉尾部风险的缺陷加上其他方面的不足,促使了ES概念的形成。ES在度量投资组合风险时,既考虑了损失超过一定置信水平的可能性,也考虑了损失的规模大小。ES的定义是超过VaRt(α)的条件期望损失,也就是:

$ E{S_t}\left( \alpha \right) = E\left[ { - {Y_t}\left| {{\mathit{\Omega }_{t - 1}}} \right., - Y > Va{R_t}\left( \alpha \right)} \right] $ (2)

通过条件概率以及变量转换,可以将ESt(α)表达为VaRt(α)的一个函数:

$ E{S_t}\left( \alpha \right) = \frac{1}{\alpha }\int_o^\alpha {Va{R_t}\left( u \right)du} $ (3)

不像VaRt(α)只包含了α分位点的信息,ESt(α)通过对VaRs从0到α积分,包含了整个左侧尾部的信息。为了检验ESt(α)是否设定正确,很自然想到要对ht(α)进行积分,也就是累积碰撞序列Ht(α)$\frac{1}{\alpha }\int_0^\alpha {{h_t}} $(u)du

因为ht(u)的均值是u,通过Fubini定理可得,Ht(α)的均值是1/α$\int_0^\alpha u $=α/2。并且,由Fubini定理可得,碰撞序列{ ht(α)-α:α∈[0, 1]} t=1的积分,即{ Ht(α)-α/2 t=1也是一个鞅差序列。

为了计算方便,定义ut=G(Yt, Ωt-1)。采用ht(u)=1(Yt≤-VaRt(u))=1(utu),我们可以得到:

$ {H_t}\left( \alpha \right) = \frac{1}{\alpha }\int_o^\alpha {1\left( {{u_t} \le u} \right)du} = \frac{1}{\alpha }\left( {\alpha - {u_t}} \right)1\left( {{u_t} \le a} \right) $ (4)

与碰撞序列相似,累积碰撞序列与Yt的分布无关,因为{ ut} t=1包括了服从独立同均匀分布的变量(Rosenblatt,1952;Berkowitz,2001;Hong和Li,2005)。Acerbi和Tasche(2002)以及Emmer等(2014)采用4个式子的黎曼和(Riemann sum)对(3)式的积分进行了近似估计。累积碰撞序列可以不采用近似求解方法,因为(4)式的积分可以直接计算出来。但是与碰撞序列不同,累积碰撞序列还包括了尾部风险:当碰撞序列等于零时,累积碰撞序列也是零;当碰撞序列不等于零时,累积碰撞序列通过α-ut计算了Yt的实际值与置信水平之间的差距。其中,α-ut=G(G-1(α, Ω-1), Ω-1)-G(Yt, Ω-1)。

① 同样可以参考在一个风险水平的子集上对VaR做后验分析的文献,包括Hurlin和Tokpavi(2006)、Perignon和Smith(2008)以及Colletaz等(2013)。

② 实际上,d(y, x)=|G(y, Ω-1)-G(x, Ω-1)|是一个距离函数。

由于分布函数G是未知的,所以构造{Ht(α)} t=1的变量{ut} t=1也是未知的。在实践中,学者和风险管理人员可以通过设定参数条件分布函数G(., Ωt-1, θ0)以及估计未知参数θ0的办法,来计算VaRES。一般来说,选择服从Student-t分布的位置尺度模型(Location-Scale Models)来刻画分布函数G(., Ωt-1, θ0)。在我们的模型设定中,当然也可以考虑其他的模型选择。在选定了参数模型之后,可以定义“广义误差”,ut(θ0)=G(Yt, Ωt-1, θ0),以及与之相关的累积碰撞序列Ht(α)=$\frac{1}{\alpha }$(αut(θ0))1(ut(θ0)≤a)。

③ 我们可以将该方法扩展到半参数设定中,其中θ0包括一个无穷维的元素。我们将在以后的研究中对此问题进行扩展。

上述论据为ES的后验分析提供了理论基础。我们可以通过检验{Ht(α, θ0)-α/2} t=1是否具有零均值,对ES做无条件后验分析;通过检验{Ht(α, θ0)-α/2} t=1是否序列相关,对ES做条件后验分析。在下一节,我们将提出这些假设的检验统计量。

三、ES后验分析

在本节,我们提出ES的后验分析方法。ES的无条件后验分析是一个简单的t检验,原假设是E[Ht(α, θ0)]=α/2,该检验是Kupiec(1995)提出的VaR无条件后验分析的推广。ES条件后验分析是一个Box-Pierce检验,这也是Christoffersen(1998)和Berkowitz等(2011)提出的VaR条件后验分析的自然推广。我们首先研究了一般后验分析方法(考虑了估计风险)的渐进分布,并且证明了不考虑估计风险可能会导致极大的size扭曲。继而,我们又提出了对估计风险稳健的修正后验分析方法。

(一) 一般无条件和条件后验分析

在实践中,模型的参数θ0是未知的,为了构造ES的预测而需要估计θ0。为了行文的简单,我们采用固定预测机制,但是本文理论可以一般化地推广到其他预测机制上(比如,移动窗口和递归机制);对此问题,可以参考Escanciano和Olmo(2010)及其他相关文献。具体而言,样本内共T期{Y-T+1, Ω-T, …, Y0, Ω-1}用来估计参数θ0,即${{\hat \theta }_T}$。其中,${{\hat \theta }_T}$θ0的一致估计量,比如是条件极大似然估计量(CMLE);${{\mathit{\hat \Omega }}_{t - 1}}$是可观测信息集,用来近似不可完全观测的信息集Ωt-1(例如,通过设定初始值来近似很久之前的数据)。通过${{\hat \theta }_T}$我们构造残差项${{\hat u}_t} = G\left( {Y,{{\hat \Omega }_{t - 1}},{{\hat \theta }_T}} \right)$,以及累积碰撞序列的估计式${{\hat H}_t}\left( \alpha \right) = \frac{1}{\alpha }\left( {\alpha - {{\hat u}_t}} \right)1\left( {{{\hat u}_t} \le \alpha } \right)$

然后,采用时间长度为n的样本外观测{Y1, Ω0, …, Yn, Ωn-1}来评估ES模型(后验分析)。我们的后验分析是基于累积碰撞序列的估计值。

ES的无条件后验分析是一个标准的t检验,原假设是H0u: E(Ht(α, θ0))=α/2。

经过简单计算可知,E(Ht2(α))=α/3,以及Var(Ht(α))=α(1/3-α/4)。因此,一个简单的t检验统计量是UES=$\frac{{\sqrt n \left( {\bar H\left( \alpha \right) - \alpha /2} \right)}}{{\sqrt \alpha \left( {1/3 - \alpha /4} \right)}}$,其中,${\bar H}$(α)是{${{\hat H}_t}$(α)} t=1的样本均值,也就是说,$\bar H\left( \alpha \right) = \frac{1}{n}\sum\limits_{t = 1}^n {{H_t}} \left( \alpha \right)$

由于参数估计效应(estimation effect)的存在,UES的渐进分布一般不服从标准正态,而是依赖于样本内时间T和样本外时间n的渐进相对大小。假设,Tn都趋近于无穷大,并且n/Tλ<∞。定理1给出了UES的极限分布,其中Ft(θ, x)是参数误差ut(θ)的条件累积分布函数,Ft(θ, x)≡Pr[ut(θ)≤xt-1],lt是估计值${{\hat \theta }_T}$的影响函数(influence function),附录A中的假设A2给出了该影响函数的定义。符号→d表示依分布收敛,B′表示矩阵B的转置。

定理 1  在附录A中的假设A0-A4下,UESdN(0, σλ2(α)),其中,

$ \sigma _\lambda ^2\left( \alpha \right) = \frac{{\alpha \left( {1/3 - \alpha /4} \right) + \lambda {{R'}_{ES}}E\left[ {{l_t}{{l'}_t}} \right]{R_{ES}}}}{{\alpha \left( {1/3 - \alpha /4} \right)}}, $

这里RES=1/α·E[$\int {_0^\alpha } $(∂Ft(θ0, x)/∂θ)dx]。

注释 1:类似于Escanciano和Olmo(2010),我们在定理1的证明中量化了参数估计效应,具体为:

$ \sqrt n \left( {\bar H\left( \alpha \right) - \frac{\alpha }{2}} \right) = \frac{1}{{\sqrt n }}\sum\limits_{t = 1}^n {\left[ {{H_t}\left( {\alpha ,{\theta _0}} \right) - \frac{\alpha }{2}} \right]} + \underbrace {\frac{{\sqrt \lambda }}{{\sqrt n }}{{R'}_{ES}}\sum\limits_{t = - T + 1}^0 {{l_t} + op\left( 1 \right)} }_{Estimation\;Effect}, $

附录B中给出了RES的详细表达式,包括在一般的位置尺度模型中的具体表达式。λ=0是定理1的特殊情况,即样本内观测显著大于样本外观测。当λ=0时,UES服从标准正态的极限分布,无条件后验分析的推论将会极大简化。

推论 1  在定理1的假设下以及λ=0,UESdN(0, 1)。

接下来,我们讨论ES的条件后验分析。原假设是H0c:E[Ht(α, θo),α/2|Ωt-1]=0,该原假设是对VaR条件后验分析原假设的自然推广(Christoffersen,1998)。我们需要如下的符号。定义Ht(α)滞后j阶(j≥0)的自协方差和自相关系数是rj=Cov(Ht(α),Htj(α))和ρj=$\frac{{{r_j}}}{{{r_0}}}$,基于样本{ Ht(α)} t=1nγjρj的表达式是,rnj=$\frac{1}{{n - j}}\sum\limits_{l = 1 + j}^n {} $(Ht(α)-α/2)(Htj(α)-α/2)和ρnj=$\frac{{{r_{nj}}}}{{{r_{n0}}}}$

在自相关系数的定义中,我们代进了均值等于α/2的约束,这使得基于γnj的检验对原假设Hoc具有更强的检验效能(power)。但是,在我们目前的设定中,{ Ht(α) }t=1不可观测、θ0未知、Ωt-1也不可完全观测,所以我们需要将Ht(α)替换为${{\hat H}_t}$(α),则有

① 经过一些代数计算可得,γnj近似等于$1/n\left( {n - j} \right)\sum\limits_{t = 1 + j}^n {\left[ {\left( {{H_t}\left( \alpha \right) - {{\tilde H}_t}} \right)\left( {{H_{t - j}}\left( \alpha \right) - {{\tilde H}_t}} \right)} \right]} + \left( {{{\tilde H}_t} - \alpha /2} \right)$,其中${{{\tilde H}_t}}$Ht(α)的样本均值,第一项可以检验Ht(α)的自相关,第二项检验无条件后验分析的原假设H0u。或者,在定义自相关系数时不采用无条件均值约束(比如说采用累积违背的样本均值)。但是,蒙特卡洛模拟结果显示,这些检验都没有我们采用的方法更具有检验效能(Power)。

$ {{\hat r}_{nj}} = \frac{1}{{n - j}}\sum\limits_{t = 1 + j}^n {\left( {{{\hat H}_t}\left( \alpha \right) - \alpha /2} \right)\left( {{{\hat H}_{t - j}}\left( \alpha \right) - \alpha /2} \right)} \;和\;{{\hat \rho }_{nj}} = \frac{{{{\hat r}_{nj}}}}{{{{\hat r}_{n0}}}}。$

注意在原假设Hoc下,对于j≥1都有ρj=0。所以,可以通过${{\hat \rho }_{nj}}$构造简单的条件检验,比如说Box-Pierce检验统计量,

$ {C_{ES}}\left( m \right) = n\sum\limits_{j = 1}^m {\hat \rho _{nj}^2} $ (6)

至于无条件后验分析,CES(m)的渐进分布不仅依赖于λ,还依赖于其他的未知量。

定理 2  在附录A的假设A0-A4下,CES(m)→d$\sum\limits_{j = 1}^m {} $πjZj2,其中,{ πj} j=1m是矩阵∑的m个特征值,矩阵∑的第ij个元素是:

$ \sum\nolimits_{ij} { = {\delta _{ij}}} + \lambda {{R'}_i}E\left( {{l_t}{{l'}_t}} \right){R_j} $ (7)
$ {R_j} = \frac{1}{{\alpha \left( {1/3 - \alpha /4} \right)}}E\left[ {\left( {{H_{t - j}}\left( \alpha \right) - \alpha /2} \right)\int_0^\alpha {\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }}dx} } \right] $ (8)

δij是克罗内克函数(Kronecker delta function),该函数在i=j时取值1,否则取值0。{Zj}是服从独立标准正态分布的变量。

从定理2可知,CES(m)服从一个加权的卡方极限分布。该权重是Rj的函数,因为与Yt的分布有关。但当λ=0时,也就是πj=1(对于任意的j=1, …, m),CES(m)就服从标准极限分布。

推论 2  在定理2的假设下以及λ=0,CES(m)→dχm2,其中,χm2是自由度为m的卡方分布。

综上可知,当λ=0时,本文提出的无条件和条件后验分析在零假设下具有标准极限分布;但当λ>0时,它们不再具有标准极限分布。这说明,除非T显著大于n(比如T=2500,n=250),否则基于标准分布临界值的基本检验不能控制第一类错误(Type-Ierror)。为了避免发生该问题,我们提出对估计风险稳健的修正后验分析。

(二) 修正的无条件和条件后验分析

在本节,我们提出修正的后验分析方法,该方法明确考虑了估计效应(estimation effect),并且对于任意的λ(0≤λ<∞)都有标准极限分布。定理1给出了无条件后验分析(式5)的估计效应表达式,据此我们提出如下的修正检验统计量:

$ M{U_{ES}} = \frac{{\sqrt n \left( {\bar H\left( \alpha \right) - \alpha /2} \right)}}{{\sqrt {\alpha \left( {1/3 - \alpha /4} \right) + \frac{n}{T}{{R'}_{ES}}{W_T}{R_{ES}}} }} $

其中,${{\hat R}_{ES}} = \frac{1}{{an}}\sum\limits_{t = 1}^n {\int_0^\alpha {\frac{{\partial {{\hat F}_t}\left( {{{\hat \theta }_T},x} \right)}}{{\partial \theta }}} } dx,{{\hat F}_t}\left( {\theta ,x} \right)$Ft(θ, x)的一致估计量,从而${{\hat r}_{ES}}$=RES+op(1)(op(1)表示依概率收敛于0)。并且,WT=$\frac{1}{T}\sum\limits_{l = - T + 1}^0 {{{\hat l}_t}} {{\hat l'}_t},{{l'}_t}$lt的一致估计量,WT=E[ltl′t]+op(1)。所以,WT是估计量${{\hat \theta }_T}$的渐进方差的一致估计,这可以在许多统计软件中实现。在以CMLE方法估计的GARCH模型情形下,本文第四部分提供了${{\hat F}_t}$(θ, x)和${{\hat l}_t}$的表达式。

类似地,通过定理2可以按照下式修正原有的条件后验分析(式子6),MCES(m)=$n\hat{\rho }_{n}^{\left( m \right)}\sum{^{-1}}\hat{\rho }_{n}^{\left( m \right)}$,其中,$\hat \rho _n^{\left( m \right)} = {\left( {{{\hat \rho }_{n1}},{{\hat \rho }_{n2}} \cdots {{\hat \rho }_{nm}}} \right)^\prime };\hat \Sigma $是∑的一致估计量,即$\hat \Sigma = \hat \Sigma $+op(1),∑的第ij个元素是${{\hat \Sigma }_{ij}} = {\delta _{ij}} + \frac{n}{T}{{\hat R'}_i}{W_T}{{\hat R}_j}$。其中,${{\hat R}_j} = \frac{1}{{\alpha \left( {1/3 - \alpha /4} \right)}}\frac{1}{{n - j}}\sum\limits_{l = j + 1}^n {\left\{ {\left( {{{\hat H}_{t - j}}\left( \alpha \right) - \frac{\alpha }{2}} \right)\int_0^\alpha {\frac{{\partial {{\hat F}_t}\left( {{{\hat \theta }_T},x} \right)}}{{\partial \theta }}dx} } \right\}} $

在附录B中,我们给出了位置尺度模型的${{\hat r}_{ES}}$${{\hat r}_j}$的表达式。也可以从本文第四部分得知这些信息。

从定理1和定理2可知,无论λ取何值,修正的检验统计量MUESMCES(m)都服从标准极限分布。

推论 3  在定理1的假设下以及${{\hat r}_{ES}}$WT具有一致性,MUESdN(0, 1)。

推论 4  在定理2的假设下以及${\hat \Sigma }$具有一致性,MCES(m)→dχm2

如推论1和推论2所示,一般检验统计量只在λ=0时具有标准极限分布;而推论3和推论4表明,稳健的检验统计量对任意的0≤λ<∞都具有标准极限分布。

四、蒙特卡洛模拟

我们采用蒙特卡洛模拟评估本文后验分析方法的有限样本表现。为了便于比较,我们同时汇报了ESVaR的检验结果。参照Kerkhof和Melenberg(2004)及其他相关文献,我们为ES选择了比VaR更大的置信水平α。具体而言,根据经验准则,我们为ES选择了比VaR大两倍(或接近于两倍)的置信水平,从而使碰撞序列和累积碰撞序列的期望值保持一致(或接近一致)。在模拟中,我们为ES设定的置信水平包括α=0.1,0.05以及0.025,对应的VaR置信水平是α=0.05,0.025以及0.01。我们比较ESVaR的无条件后验分析和条件后验分析。其中,VaR的后验分析是UVaR=$\frac{{\sqrt n \left( {\bar h\left( \alpha \right) - \alpha } \right)}}{{\sqrt {\alpha \left( {1 - \alpha } \right)} }},\bar h\left( \alpha \right)$$\left\{ {{{\hat h}_t}\left( \alpha \right) = 1\left( {{{\hat u}_t} \le \alpha } \right)} \right\}_{t = 1}^n$的样本均值;VaRBox-Pierce检验是CVaR(m)=$n\sum\limits_{j = 1}^m {\tilde \rho _{nj}^2} $,其中,${{\tilde \rho }_{nj}} = {{\tilde \gamma }_{nj}}/{{\tilde \gamma }_{no}},{{\tilde \gamma }_{nj}} = 1/\left( {n - j} \right)\sum\limits_{t = 1 + j}^n {\left( {{{\hat h}_t}\left( \alpha \right) - \alpha } \right)} \left( {{{\hat h}_{t - j}}\left( \alpha \right) - \alpha } \right)$。我们同样汇报了对估计效应保持稳健性的修正的VaR后验分析检验结果。MUVaR=$\frac{\sqrt{n}\left( \bar{h}\left( \alpha \right)-\alpha \right)}{\sqrt{\alpha \left( 1-\alpha \right)+\frac{n}{T}{{{{\tilde{R}}'}}_{VaR}}{{W}_{T}}{{{\tilde{R}}}_{VaR}}}}$,以及MCVaR(m)=$n\hat{\rho }{{_{n}^{\left( m \right)}}^{\prime }}{{{\tilde{\Sigma }}}^{-1}}\tilde{\rho }_{n}^{\left( m \right)}$,其中,$\tilde \rho _n^{\left( m \right)} = \left( {{{\tilde \rho }_{n1}},{{\tilde \rho }_{n2}} \cdots {{\tilde \rho }_{nm}}} \right);{{\tilde \Sigma }_{ij}} = {\delta _{ij}} + n/T{{\tilde R}_i}{{\tilde W}_T}{{\tilde R}_j}。{{\tilde R}_{VaR}}$${{\tilde R}_j}$的表达式可以从附录B中得知,也可以参考Escaniano和Olmo(2010)。

我们采用常用的AR(1)-GARCH(1, 1)设定Yt的真模型(原假设),此时VaRES的表达式是:

$ \begin{array}{l} Va{R_t}\left( \alpha \right) = - {a_0}{Y_{t - 1}} - {\sigma _t}F_v^{ - 1}\left( \alpha \right),\sigma _t^2 = {\omega _0} + {\alpha _0}{Y_{t - 1}} + {\beta _0}\sigma _{t - 1}^2\\ E{S_t}\left( \alpha \right) = - {a_0}{Y_{t - 1}} - {\sigma _t}m\left( \alpha \right),m\left( \alpha \right) = E\left[ {{\varepsilon _t}\left| {{\varepsilon _t} \le F_v^{ - 1}\left( \alpha \right)} \right.} \right] \end{array} $ (9)

其中,εt服从自由度是v(未知)的Student-t分布,即εt~tv,其中α分位数记为Fv-1(α)。我们将参数θ0的真实值设定为θ0=(a0, ω0, α0, β0)=(0.05, 0.05, 0.1, 0.85)以及v=5,这也是实证文献中典型的参数值。

在每次模拟中,我们都采用CMLE方法估计θ0v,从而得到${{{\hat{u}}}_{t}}={{F}_{{{v}^{\hat{\ }}}}}\left( {{\varepsilon }_{t}}\left( {{{\hat{\theta }}}_{T}} \right) \right)$${{F}_{{{v}^{\hat{\ }}}}}$是自由度为${\hat{v}}$Sdudent-t分布的累积分布函数,${{F}_{{{v}^{\hat{\ }}}}}$是其概率密度函数。εt(θ)=εt(a, ω, α, β)=(Yt-aYt-1)/σt(θ),其中σt2(θ)=ω+α(Yt-1-aYt-2)+βσt-12(θ)。这些表达式被用来计算如下修正的后验分析:${{{\hat{F}}}_{t}}\left( \theta ,x \right)={{F}_{{{v}^{\hat{\ }}}}}\left( \left( a{{Y}_{t-1}}-\hat{a}{{Y}_{t-1}}+x{{\sigma }_{t-1}}\left( \theta \right) \right)/{{\sigma }_{t}}\left( {{{\hat{\theta }}}_{T}} \right) \right)$,以及lt= S2∂(ln fv(εt(θT))-lnσt(θT))/∂θ,其中S2$\sqrt{T}\left( {{{\hat{\theta }}}_{T}}-{{\theta }_{0}} \right)$渐进方差的一致估计量。我们通过设定m=1、3和5来计算未检验统计量UESUVaRCES(m)、CVaR(m),以及修正后的检验统计量MUESMUVaRMCES(m)、MCVaR(m),但在正文中只汇报了m=5的结果。尽管只有当n/T很小的时候,下述近似才具有理想的效果,我们仍简单地采用标准正态分布近似UESUVaR的极限分布,采用χm2分布计算CES(m)和CVaR(m)的极限分布。通过设定样本内时间T=250、500、2 500,以及样本外时间n=250、500,我们进行了1 000次蒙特卡洛模拟。

① 关于m=1和3的模拟结果,读者如有兴趣,可以向作者索取。

Yt数据生成过程的原假设和备择假设如下,

H0AR(1)-GARCH(1,1)模型,

$ \begin{array}{l} {Y_t} = 0.05{Y_{t - 1}} + {v_t},{v_t} = {\sigma _t}{\varepsilon _t},{\varepsilon _t} \sim {t_5}\\ \sigma _t^2 = 0.05 + 0.1Y_{t - 1}^2 + 0.85 + \sigma _{t - 1}^2 \end{array} $ (10)

A1TAR模型,Yt=atYt-1+vt, vt=σtεt

$ \begin{array}{l} \sigma _t^2 = 0.04 + 0.1v_{t - 1}^2 + 0.89\sigma _{t - 1}^2\\ {a_t} = 0.7 \times 1\left( {{v_{t - 1}} \le - 2} \right)。\end{array} $

A2:均值GARCH模型,Yt=2.5σt2+vt, vt=σtεt

$ \sigma _t^2 = 0.01 + 0.29v_{t - 1}^2 + 0.7\sigma _{t - 1}^2。$

A3AR(1)-ARCH(2)模型,Yt =0.05Yt-1+vt, vt=σtεt

$ \sigma _t^2 = 0.1 + 0.1v_{t - 1}^2 + 0.8v_{t - 2}^2。$

A4AR(1)-EGARCH(1, 1)模型,Yt=0.05Yt-1+vt, vt=htεt

$ \ln h_t^2 = 0.01 + 0.9\ln h_{t - 1}^2 + 0.3\left( {\left| {{\varepsilon _{t - 1}}} \right| - \sqrt {2/{\rm{ \mathsf{ π} }}} } \right) - 0.8{\varepsilon _{t - 1}}。$

A5AR(1)-Stochastic Volatility模型,Yt=0.05Yt-1+vt, vt=htεt

$ \begin{array}{l} h_t^2 = 0.1Y_{t - 1}^2 + \exp \left( {0.98\ln h_{t - 1}^2 + {e_t}} \right)\\ {e_t} \sim iidN\left( {0,1} \right)。\end{array} $

A6AR(1)-GARCH(1, 1)并且具有混合正态残差项,Yt与(10)式相同,

$ {e_t} \sim \left[ {0.6 \cdot N\left( {1,\sqrt 2 } \right) + 0.4 \cdot N\left( { - 1.5,\sqrt {0.75} } \right)} \right]/\sqrt 3 。$

除非被另外设定,在这些模型中{εt}~iid t5。Escanciano和Velasco(2010)、Escanciano和Olmo(2010)采用了类似的模型。A1A2中的条件均值没有被正确设定,A3A4A5中的条件方差没有被正确设定,A6中则是误差项{εt}的分布没有被正确设定。

表 1-9汇报了在5%显著性水平下各检验的实证sizesize-corrected powers与前文理论一致,当T较小时,估计效应导致基本检验存在严重的size扭曲(犯第一类错误的可能性很高);但当T很大时(比如,T=2 500),size扭曲的程度显著下降。除了VaR的条件后验分析MCVaR(5)存在一些过度拒绝的情形外,修正的后验分析在T很小时仍可以得到满意的size。因为在尾部存在很少的观测值,所以ESt(0.025)和VaRt(0.01)后验分析的size扭曲程度最大。对于给定的样本内观测T,修正的ES后验分析MUESMCES(5)的size表现,随着样本外观测n从250增加到500而显著改善,这与基本检验的结论相反。

Size:犯第一类错误的概率,即在原假设为真的情况下,拒绝了原假设;Power:不犯第二类假设的概率,即在原假设为假的情况下,拒绝了原假设。

表 1 显著性水平5%,T=250,ESt(0.1)和VaRt(0.05)的实证拒绝率
UESUVaRCES(5)CVaR(5)MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.1690.1500.1180.1030.0430.0390.0530.075
A10.0800.0960.2180.1640.0770.0860.2070.235
A20.5490.5780.2290.1970.4780.2090.2120.052
A30.0350.0520.1300.0960.0060.0110.1550.137
A40.0630.0760.2060.1420.0120.0220.1990.169
A50.0720.0840.1010.0760.0750.0500.1140.085
A60.3510.5090.2300.2270.4410.5570.2360.203
n=500, Size and Power(size-corrected)
H00.2300.2140.1250.1070.0440.0430.0570.064
A10.0860.0880.3560.2980.0790.0980.2490.393
A20.6510.5960.2830.2160.5640.2290.2190.056
A30.0440.0430.1900.1540.0040.0040.2440.237
A40.0630.0620.2840.1970.0190.0200.2480.237
A50.0760.0760.1140.1100.0910.0620.1300.086
A60.4090.5310.2940.3140.5180.6670.2950.295
表 2 显著性水平5%,T=250,ESt(0.05)和VaRt(0.025)的实证拒绝率
UES UVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.1760.1140.1400.1550.0510.0420.0730.120
A10.0520.0430.1310.1170.0710.0820.0890.102
A20.3580.1930.1800.0480.4180.1380.1510.022
A30.0410.0290.0940.0810.0140.0080.0810.080
A40.0480.0370.1230.1150.0130.0120.1040.101
A50.0380.0240.0550.0550.0690.0640.0590.035
A60.6730.3140.4920.0660.7760.7860.4830.045
n=500, Size and Power(size-corrected)
H00.2340.2220.1290.1230.0480.0440.0600.103
A10.0650.0810.2250.1770.0740.0970.1450.205
A20.4790.4680.2220.1860.5190.1360.1480.029
A30.0380.0500.1470.1230.0100.0180.1650.148
A40.0480.0530.1740.1410.0060.0230.1440.123
A50.0530.0570.0720.0630.0840.0850.0690.041
A60.7950.6550.6140.3810.8240.8370.6300.275
表 3 显著性水平5%,T=250,ESt(0.025)和VaRt(0.01)的实证拒绝率
UES UVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.1790.0340.1400.0900.0710.0780.0640.075
A10.0280.0860.0780.1070.0400.0530.0770.064
A20.1200.0010.1300.0460.1800.1160.1150.009
A30.0280.0300.0670.0930.0100.0080.0760.065
A40.0320.1020.0760.1020.0060.0030.0880.095
A50.0180.0310.0820.1010.0240.0280.0730.079
A60.2650.0000.2750.0670.4180.8120.2940.004
n=500, Size and Power(size-corrected)
H00.2390.2580.1400.1330.0680.0710.0590.096
A10.0480.0730.1360.0930.0590.0580.0970.098
A20.3120.2540.2160.0030.4210.0680.1400.003
A30.0360.0450.1120.0830.0110.0150.1150.098
A40.0300.0570.1270.0950.0170.0080.1170.119
A50.0190.0370.0510.0470.0590.0650.0510.036
A60.6400.1390.5440.0070.8970.8640.5620.008
表 4 显著性水平5%,T=500,ESt(0.1)和VaRt(0.05)的实证拒绝率
UES UVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.1010.0980.0810.0930.0410.0320.0570.085
A10.0720.0900.2300.1730.0750.0830.2030.210
A20.6860.6980.2370.1780.6410.3450.2030.063
A30.0280.0430.1570.1240.0110.0080.1520.140
A40.0590.0820.2040.1720.0220.0200.1840.162
A50.0780.0980.1130.1080.0590.0500.0820.058
A60.4880.6570.2350.2650.5880.6500.2490.238
n=500, Size and Power(size-corrected)
H00.1320.1290.0850.0930.0380.0320.0520.083
A10.0870.0730.4010.3000.1060.1190.3510.382
A20.9060.8030.2750.2130.7750.4810.2300.058
A30.0270.0240.2640.1800.0070.0070.2800.225
A40.0720.0530.3280.2350.0250.0310.2680.235
A50.1150.1050.1430.1230.0620.0580.1040.074
A60.7330.7580.2870.3110.7930.8650.3250.315
表 5 显著性水平5%,T=500,ESt(0.05)和VaRt(0.025)的实证拒绝率
UESUVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.1120.0820.0980.1090.0670.0650.0710.091
A10.0420.0410.1450.1130.0520.0450.1040.125
A20.4900.3560.2160.0670.4930.2070.1750.010
A30.0270.0220.1200.0970.0120.0060.0990.091
A40.0310.0200.1280.1140.0070.0030.1090.101
A50.0380.0520.0720.0700.0430.0470.0520.043
A60.8370.4920.6230.0830.9000.9010.6280.024
n=500, Size and Power(size-corrected)
H00.1510.1430.1000.0980.0540.0550.0630.094
A10.0580.0570.2530.1650.0640.0700.2010.191
A20.7210.6940.2570.1670.6930.3130.1820.035
A30.0240.0330.1730.1270.0130.0120.1400.114
A40.0360.0390.1950.1460.0180.0210.1850.141
A50.0810.0800.1020.0880.0610.0630.0650.038
A60.9560.9700.7890.4670.9590.9640.8040.476
表 6 显著性水平5%,T=500,ESt(0.025)和VaRt(0.01)的实证拒绝率
UES UVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.1460.0220.1300.0790.0850.0890.0870.078
A10.0360.0720.0850.0970.0320.0330.0700.080
A20.2750.1040.2430.0260.2670.0790.1750.010
A30.0270.0320.0820.0900.0180.0040.0780.088
A40.0220.0420.0810.0890.0060.0040.0730.080
A50.0090.0170.0320.0270.0110.0100.0360.035
A60.3550.0970.3210.0630.4280.3650.3350.004
n=500, Size and Power(size-corrected)
H00.1510.1830.1190.1270.0810.0800.0770.109
A10.0360.0630.1010.0840.0380.0320.0730.83
A20.3990.3220.1860.0020.4820.1450.1830.003
A30.0270.0660.1200.0820.0180.0050.1070.100
A40.0210.0550.1160.0970.0100.0050.0890.092
A50.0220.0230.0500.0290.0320.0410.0340.030
A60.6730.0970.6100.0040.9770.9600.6170.004
表 7 显著性水平5%,T=2 500,ESt(0.1)和VaRt(0.05)的实证拒绝率
UES UVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.0690.0720.0510.0620.0590.0670.0440.062
A10.0610.0460.3090.2110.0580.0480.3280.240
A20.8130.7440.2970.2420.7690.5490.2790.166
A30.0310.0290.2180.1500.0160.0090.2210.136
A40.0710.0540.2810.2210.0410.0320.2860.215
A50.1480.1330.2480.2140.0930.0710.1680.124
A60.6500.7350.2550.3050.6560.7350.2950.388
n=500, Size and Power(size-corrected)
H00.0610.0830.0530.0540.0380.0460.0480.054
A10.1010.0470.4940.3670.1020.0650.5720.442
A20.9790.9330.3450.2650.9490.8370.3360.188
A30.0340.0230.3310.2340.0180.0110.3640.259
A40.1060.0680.4080.2970.0450.0440.4390.336
A50.2070.1650.2510.2370.0830.0640.1960.180
A60.9290.9330.3200.3790.9360.9330.3590.407
表 8 显著性水平5%,T=2 500,ESt(0.05)和VaRt(0.025)的实证拒绝率
UES UVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.0830.0470.0810.0950.0780.0470.0680.093
A10.0360.0470.1870.1310.0360.0350.1820.136
A20.6180.5050.2510.0630.5980.3460.2520.021
A30.0290.0410.1360.1100.0230.0150.1410.100
A40.0430.0530.1800.1360.0280.0230.1730.121
A50.1050.1000.1680.1480.0720.0560.1190.087
A60.9460.5150.6700.0820.9530.9460.6970.042
n=500, Size and Power(size-corrected)
H00.0690.0710.0720.0630.0490.0410.0610.069
A10.0560.0480.3010.2080.0500.0530.2760.212
A20.9310.8620.3250.2860.9010.6910.2910.176
A30.0310.0390.2210.1490.0180.0140.2140.147
A40.0650.0570.2360.1930.0300.0290.2380.200
A50.1950.1620.1910.1890.1200.0890.1580.146
A61.0000.9990.8500.6041.0000.9990.8750.584
表 9 显著性水平5%,T=2 500,ESt(0.025)和VaRt(0.01)的实证拒绝率
UESUVaR CES(5) CVaR(5) MUES MUVaR MCES(5) MCVaR(5)
n=250, Size and Power(size-corrected)
H00.1030.0930.1010.0820.0980.0890.0950.071
A10.0290.0770.0780.0970.0270.0270.0670.057
A20.4000.5270.3440.0500.2900.0270.2020.000
A30.0230.0880.0880.0880.0180.0000.0790.084
A40.0340.0820.1000.0820.0170.0050.1020.100
A50.0550.0550.1000.0550.0130.0030.0520.024
A60.4010.9560.3490.0620.4200.9550.3530.001
n=500, Size and Power(size-corrected)
H00.0750.1240.0900.0950.0620.1030.0820.092
A10.0300.0400.1230.0830.0280.0290.1070.090
A20.7320.6060.3600.0510.7200.2920.2490.001
A30.0330.0580.1330.0920.0220.0050.1240.114
A40.0360.0540.1560.1200.0210.0090.1410.124
A50.1170.0580.1330.1010.0710.0400.1000.082
A61.0000.9670.6480.0021.0000.9950.6570.002

由于小样本T存在size扭曲,我们汇报了size-corrected powers。其中,ES的无条件后验分析很好地识别了备择假设A2A6,条件后验分析对备择假设A1A6具有最大的检验效能(Power值最大),对备择假设A2-A5也具有一定的检验效果。在绝大多数情况下,CES(5)和MCES(5)有着比CVaR(5)和MCVaR(5)更大的检验效能(Power值更大)。最后,MUESMCES(5)的检验效能随着样本外观测n的增加而变大,说明了这些检验对备择假设而言是满足一致性的。当模型的残差项服从其他分布时,比如说时变高阶距的Hansen-Skewed-t分布,也可以得到一致的结论。

② 限于篇幅,没有汇报这些模拟结果,读者如有兴趣,可以向作者索取。

蒙特卡洛模拟的主要结论如下。当T很小时(T=250),基本后验分析存在显著的size扭曲,但这些扭曲会随着T的增加而显著下降(T=2 500)。与之相比,修正的后验分析对T的取值具有稳健性。由于检验统计量需要根据模型和估计量去修正,size的改善会导致计算成本的增加。所以,我们建议大家在样本内观测T很大时(T=2 500,n=250)采用基本后验分析方法,在样本内观测T较小时(T=250,n=250)采用修正的后验分析方法。

模拟检验结果也说明了,无条件后验分析和条件后验分析是互补的,而不是替代的。因此,我们建议在实践中同时使用两种后验分析方法。模拟结果也显示,相比于VaR的检验,基于ES的检验效能更好。在本文下一节,我们将采用2007年金融危机期间三大股指的真实数据,进一步验证我们的结论。

五、实证应用

我们通过采用2007年金融危机期间全球三大股票指数,来检验ES作为风险度量指标的优点。实证结果显示,VaR后验分析方法在金融危机时期不能拒绝常规风险模型(残差项服从Student-t分布的AR(1)-GARCH(1, 1)模型);但本文提出的ES后验分析方法能够在金融危机时期显著拒绝常规风险模型。我们的实证结果补充了Kourouma等(2011)及O’Brien和Szerszen(2014)的研究,他们分别以金融危机期间的股票指数和美国五大银行为研究对象,评估了传统后验分析的表现。为与之对比,我们将比较传统VaR后验分析和本文ES后验分析的表现。

① 重复本文实证应用的R code,可以通过Run My Code网站获得(http://www.runmycode.org/)。

具体而言,本文采用S&P 500指数、DAX指数以及恒生指数的日度数据展开分析。数据通过finance.yahoo.com获得,时间期限是1997.1.1 -2009.6.30。表 10从样本内和样本外两个时间段对三大股指进行了描述统计,样本内时间是1991.1.1-2007.6.30,样本外时间是金融危机期间的2007.7.1-2009.6.30。概括地讲,股票指数呈现了尖峰后尾和波动率聚集的特点,并且这些特点在金融危机期间尤为明显。表 10显示,三大股指的超额峰度取值都很大,特别是1997年亚洲金融危机导致了恒生指数的超额峰度最大。图 1显示,三大股指的对数收益率存在波动率聚集现象,金融危机期间股指收益的波动更为明显,尤其是标普500指数在2008.7 -2009.3期间几乎下降了一半。在2001-2003年期间,由于911恐怖袭击和股市处于整体下行的阶段,S&P 500指数和DAX指数具有很大的波动。香港恒生指数则在1997年末经历了明显的波动。

表 10 三大股指对数收益(%)的描述性统计
样本内时间(1997-2007年)样本外时间(2007-2009年)
S&P500 DAX Hangseng S&P500 DAX Hangseng
观测值2 6392 6582 596504509503
均值0.0270.0390.019 -0.098 -0.100 -0.034
中位数0.0590.1060.0420.0360.0160.052
标准差1.1311.5771.6772.2182.0452.762
偏度 -0.089 -0.1520.146 -0.0650.3510.167
超额峰度3.1652.34811.3554.0355.2733.319
最大值5.5747.55317.25010.96010.80013.410
10分位点 -1.324 -2.132 -1.712 -2.478 -2.132 -3.238
5分位点 -1.815 -2.567 -2.552 -3.506 -3.371 -4.381
1分位点 -2.881 -4.547 -4.306 -6.310 -6.061 -7.305
最小值 -7.113 -6.652 -14.73 -9.470 -7.433 -13.580
图 1 三大股指的日均对数收益率

我们通过AR(1)-GARCH(1, 1)-t模型拟合对数收益Yt。在给定置信水平αVaRES等于:VaRt(α)=-a0Yt-1σtFv-1(α), σt2=ω0+α0σt-12εt-12+β0σt-12ESt(α)=-a0Yt-1σtm(α), m(α)=Et|εtFv-1(α)]。

我们采用样本内数据通过CMLE方法估计未知参数,并采用样本外数据做后验分析。表 11汇报了位置参数的估计结果,包括Fv-1(α)和m(α)。表 11显示,三大股指存在明显的波动率惯性现象。恒生指数的自由度参数最小,所以它的厚尾现象也最为明显,这与表 10中恒生指数有最大的峰度相一致。

① 本文中,我们将自由度参数处理成离散、未知的。那么,估计效应仅仅来源于位置参数和尺度参数的不确定性。Escanciano和Olmo(2010)有相似的发现。

表 11 条件极大似然估计(CMLE)
S&P500DAXHangseng
a0 -0.0270.0040.034
ω00.0070.0160.010
α00.0590.0880.058
β00.9370.9100.948
v9104
Fv-1(0.05) -1.617 -1.621 -1.507
Fv-1(0.01) -2.488 -2.472 -2.649
m(0.1) -1.781 -1.779 -1.767
m(0.25) -2.544 -2.521 -2.824

图 2-4分别绘制了S&P 500指数、DAX指数以及恒生指数的VaR(0.05)和ES(0.1)估计结果。从中可知,-ES(0.1)要小于-VaR(0.05)。当Yt低于-VaR(0.05)时,-ES(0.1)更加接近真实的Yt。以2008年9月15日为例,当天雷曼兄弟破产,S&P 500指数下降4.83%,模型估计出的VaR(0.05)是1.82%,ES(0.1)则是2.65%,所以ES估计值更加接近真实损失。S&P 500指数收益在2007.7.1 -2009.6.30期间共有504个观测值中,其中41个观测值小于-VaR(0.05)。在这41个观测值中,S&P 500指数的平均损失是3.82%,VaR(0.05)的平均值是2.79%,而ES(0.1)的平均值则是3.07%。另外,还有11个观测值小于-ES(0.1),S&P 500指数的平均损失是3.76%,VaR(0.05)的平均值是3.13%,而ES(0.1)的平均值则是3.20%。因此,ESVaR更好地描述了极端损失,通过DAX和恒生指数也可以得到类似结论。

图 2 S&P 500指数的对数收益以及VaRES估计值
图 3 DAX指数的对数收益以及VaRES估计值
图 4 恒生指数的对数收益以及VaRES估计值

表 12汇报了2007年金融危机前后三大股票指数的碰撞序列取值$\left( {V\left( \alpha \right) = \sum\limits_{t = 1}^n {{{\hat h}_t}\left( \alpha \right)} } \right)$、累积碰撞序列取值($CV\left( \alpha \right) = \sum\limits_{t = 1}^n {{{\hat H}_t}\left( \alpha \right)} $)以及碰撞序列的预期值(nα)。危机前后时间段分别为2005.07.01 -2097.06.30和2007.07.01-2009.06.30。通过比较危机前后的V(α)和CV(α),可以看到危机发生后风险显著增加。一个例外是DAX指数的V(0.01)在危机发生后下降了,但是CV(0.025)在危机发生后上升了。进一步看,尽管DAX指数在危机发生后的碰撞序列取值V(0.01)下降了,但是危机发生后的损失要大于危机之前,这也就解释了危机发生后CV(0.025)的上升和V(0.01)的下降。表 12的结果说明,在巴塞尔委员会建议的置信水平上(对VaR采取α=0.01),碰撞序列和累积碰撞序列存在显著的差异。

表 12 违背的描述统计:危机前与危机后
金融危机前(2005-2007年) 金融危机后(2007-2009年)
S&P500 DAX Hangseng S&P500 DAX Hangseng
V(0.05) 20 20 24 41 35 29
CV(0.1) 20.309 22.434 24.714 40.026 34.862 30.612
n×0.05 25.2 25.45 25.15 25.2 25.45 25.15
V(0.01) 5 8 2 11 5 5
CV(0.025) 6.110 6.360 4.063 13.702 9.101 6.145
n×0.01 5.04 5.09 5.03 5.04 5.09 5.03

图 5描述了金融危机期间三大股票指数的累积碰撞序列{${{\hat H}_t}$(0.1)}。当${{\hat H}_t}$(0.1)的取值较大,意味着当天股票指数产生了较大的损失。图 5显示,S&P500指数的累积碰撞序列取值大于DAX指数和恒生指数;三大股指的累积碰撞序列也都存在明显的聚集现象,反映了股指满足非鞅差序列的性质。我们将采用条件后验分析方法对此假设进行验证。

图 5 金融危机期间三大股指的累积违背

表 13汇报了三大股票指数无条件后验分析(UESUVaRMUESMUVaR)以及条件后验分析(CES(5)、CVaR(5)、MCES(5)、MCVaR(5))的p值。ES的条件后验分析CES(5)和MCES(5)都拒绝了原假设中的风险模型,而VaR的条件后验分析CVaR(5)和MCVaR(5)则不能拒绝。图 6图 7分别绘制了${{\hat H}_t}$(0.025)和${{\hat h}_t}$(0.01)的样本自相关图,从中也可以清楚地看到 ESt(0.025)在5%显著性水平上显著拒绝了原假设,而VaRt(0.01)则没有拒绝。

表 13 ESVaR后验分析的p
ES(0.025)VaR(0.01) ES(0.1) VaR(0.05)
S&P500
U0.0110.0700.0040.010
C(5)0.0070.2700.0090.052
MU0.0190.0730.0060.013
MC(5)0.0170.2710.0100.053
DAX
U0.2240.9680.0450.095
C(5)0.0020.9980.0910.768
MU0.2530.9680.0520.102
MC(5)0.0150.9980.0950.769
Hangseng
U0.9390.9890.1940.462
C(5)0.0020.9980.0020.002
MU0.9450.9900.3100.509
MC(5)0.0030.9980.0040.002
  注:U是基本的无条件后验分析,MU是稳健的无条件后验分析,C(5)是m=5的基本条件后验分析,MC(5)是m=5的稳健条件后验分析。
图 6 三大股指的${{\hat H}_t}$(0.025)样本自相关
图 7 三大股指的${{\hat h}_t}$(0.01)样本自相关

图 7显示,三个股指序列的碰撞序列${{\hat h}_t}$(0.01)都不存在显著的自相关性。DAX指数和恒生指数在滞后12阶时的${{\hat h}_t}$(0.01)自相关性都非常接近于0,因为这两个股指的Yt只有5次观测值小于-VaRt(0.01),而S&P500指数有11次观测值要小于-VaRt(0.01)。2007年金融危机源于美国,并且对美国有更大的影响,所以导致了美国股市的极端损失要多于德国股市和香港股市。这也解释了为何表 13S&P500指数的无条件检验UVaR只有很小的p值,而另外两个股票指数的p值较大。

另一方面,三个股指序列的累积碰撞序列${{\hat H}_t}$(0.025)都具有显著的自相关性。发生极端损失的次数可能不是很多,但是平均损失额很大,且高度自相关。碰撞序列${{\hat h}_t}$(0.01)仅仅考虑了尾部事件的聚集特点,没有考虑损失规模。但是,累积碰撞序列${{\hat H}_t}$(0.025)则同时考虑了极端损失的发生次数和每次产生的损失额。所以,正如表 13所示,基于累积碰撞序列${{\hat H}_t}$(0.025)的条件后验分析能更好地识别金融危机期间的风险模型问题。

总之,基于VaR的后验分析,我们会认为正常时期建立的风险模型在金融危机发生后也是适用的,并且据此计算的存款准备金也是足够的。但是,如果采用ES度量风险,本文提出的后验分析方法可以明确地拒绝正常时期的风险模型。我们的实证分析证实了ES相比于VaR更具备理论优势(Artzer等,1997,1999),并且该理论优势也可以在市场风险的后验分析中获得经验证据。本文基于累积碰撞序列提出的一套后验分析方法,不仅有助于评估金融损失发生的可能性,也有助于发现金融损失的规模大小。

六、结论

尽管大量的理论证据表明,ES作为风险度量指标比VaR更具有优越性,但是直到最近金融机构和监管者才开始采用ES替换VaR。在这个转变过程中,一大挑战是没有工具可以用来评估ES模型(即,后验分析)。本文通过累积碰撞序列构建ES的无条件和条件后验分析,这也是基于碰撞序列对VaR进行后验分析的自然推广。但与碰撞序列不同,累积碰撞序列包括了尾部风险的信息,为风险提供了更加完整的描述。

本文提出了基本的无条件和条件后验分析方法和对估计风险保持稳健性的经修正的后验分析方法。无条件后验分析采用t检验对累积碰撞序列的均值进行假设检验,条件后验分析采用基于累积碰撞序列的Box-Pierce检验。同时,我们也建议大家采用累积碰撞序列的图形和自相关系数作为补充工具。在具体应用中,实践者需要对条件后验分析做出两个选择,分别是置信水平α和自相关阶数m。对于ES,我们建议选择α等于0.1、0.05或0.025,不建议取更小的值,因为此时需要很大的样本外观测才能对有限样本得到满意的渐进分布性质。关于自相关阶数的选择,我们选取了m=5。当然,一个合理的做法是通过数据驱动方法选择m(Escanciano和Labato,2009b)。该种方法在其他环境下被证明可以获得可靠的推论,它也可以用于本文情形中,从而以较小的计算成本获得数据驱动的ES后验分析。

附录A:假设

本节介绍检验方法所需的假设和一些公式。我们首先介绍一些符号。||·||表示欧几里德范数,C表示各个表达式中的一般常数,可以随表达式而变化。

为了完整性,我们将展示考虑了转换函数φ(ut)的一般化结果。φ$\mathit{\bar \Psi },\mathit{\bar \Psi }$是测度函数集合,φ:[0, 1]→RΨ满足左极限右连续(cadlag)、有限变化或者非递减。累积碰撞序列是满足这些条件的特殊情况:

$ \varphi \left( {{u_t}} \right) = \frac{1}{\alpha }\left( {\alpha - {u_t}} \right)1\left( {{u_t} \le {u_t}} \right) $ (A.1)

正文是在满足下述假设下对累计碰撞序列进行了分析,但在此附录中我们以一般化的φ${\mathit{\bar \Psi }}$展开分析。简化下述符号:ut(θ)=G(Yt, Ωt-1, θ),utut(θ0),cφ=E[φ(ut)]以及vφ=var(φ(ut))。具体而言,对(A.1)式中的φ,我们以cES=α/2,vES=α(1/3-α/4)分别对应它的均值和方差;将Θ0记为θ0∈Θ的任一邻域。考虑下述假设:

假设 A0:给定信息集Ωt-1Yt的条件分布是G(·, Ωt-1, θ)。

假设 A1:{ Yt, Xt }t=-T+1n满足严平稳和遍历性。

假设  A2${{\hat \theta }_T}$θ0$\sqrt T $一致估计量,θ0是Θ的内点。并且,${{\hat \theta }_T}$满足如下的渐进Bahadur扩展:$\sqrt T \left( {{\theta _T} - {\theta _0}} \right) = \frac{1}{{\sqrt T }}\sum\limits_{t = T + 1}^0 {{l_t}} + {o_p}$(1),lt满足E(lt|Ωt-1)=0,E(ltl′t)存在且是正定矩阵。

假设  A3:信息截尾(information truncation)的影响要满足,

$ \mathop {\sup }\limits_{0 \in {\Theta _0}} \frac{1}{{\sqrt n }}\sum\limits_{t = 1}^n {\left| {\varphi \left( {G\left( {{Y_t},{{\mathit{\hat \Omega }}_{t - 1}},\theta } \right)} \right) - \varphi \left( {G\left( {Y,{\mathit{\Omega }_{t - 1}},\theta } \right)} \right)} \right|} = \left. {{O_P}\left( 1 \right)} \right|。$

假设 A4Ft(θ, x)关于θx∈[0, 1]连续可微,并且关于vφ也几乎肯定连续可微,

$ E\left[ {\mathop {\sup }\limits_{0 \in {\Theta _0},0 \le x \le 1} \left\| {\frac{{\partial {F_t}\left( {\theta ,x} \right)}}{{\partial x}}} \right\|} \right] < C\;{\rm{and}}\;E\left[ {\int_0^1 {\mathop {\sup }\limits_{0 \in {\Theta _0}} \left\| {\frac{{\partial {F_t}\left( {\theta ,x} \right)}}{{\partial x}}} \right\|d\varphi \left( x \right)} } \right] < C。$

其中,A0在文献中常用,它假设模型是正确设定的。该假设也可以放松到如下形式,但不会改变本文的理论。P(Ytyt-1)=G(y, Ωt-1, θ0) for all yG-1(α, Ωt-1, θ0)。

假设A1是为了阐述的方便。我们的结果,可以扩展到一些非平稳和非遍历性的序列中(Escanciano,2007)。大多数常用的估计量可以满足假设A2,比如(拟)极大似然估计量和广义距估计量(Bose,1998;Wu,2007)。假设A3是信息截取的影响,由于很久之前的观测数据不可获得,所以产生了信息截取问题。很多有限二阶距的时间序列模型都可以满足假设A3,包括平稳不可逆的ARMA过程、GARCH过程等等(Bai,2003;Hong和Li,2003)。马尔科夫过程则不需要该假设。假设A4是为了满足某些实证过程和大数定律的渐进同等连续性。

附录B:估计效应(Estimation Effect)的表达式

本节给出一般规模尺度模型中的${{\hat r}_{ES}},{{\hat r}_j},{{\tilde R}_{VaR}}$以及${{\tilde R}_j}$详细表达式:

$ {Y_t} = {\mu _t} + {\sigma _t}{\varepsilon _t} $ (B.1)

其中,μt=μ(Ωt-1, θ0)=E[Yt|Ωt-1],σt2=σ2(Ωt-1, θ0)=Var[Yt|Ωt-1];并且εt的累积分布函数是Gε(·),概率密度函数是gε(·)。

推导可得:

$ \frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }} = {g_t}\left( {G_\varepsilon ^{ - 1}\left( x \right)} \right)\frac{{{{\dot u}_t} + G_\varepsilon ^{ - 1}\left( x \right){{\dot \sigma }_t}}}{{{\sigma _t}}} $ (B.2)

其中,${{\dot \mu }_t}$=∂μt-1, θ0)/∂θ,以及${{\dot \sigma }_t}$=∂σt-1, θ0)/∂θ。因此,

$ \begin{array}{l} {R_{ES}} = \frac{1}{\alpha }E\left\{ {\int_0^\alpha {\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }}dx} } \right\} = \frac{1}{\alpha }E\left\{ {\int_0^\alpha {{g_\varepsilon }\left( {G_\varepsilon ^{ - 1}\left( x \right)} \right)\frac{{{{\dot u}_t} + G_\varepsilon ^{ - 1}\left( x \right){{\dot \sigma }_t}}}{{{\sigma _t}}}dx} } \right\}\\ \;\;\;\;\;\; = \frac{1}{\alpha }E\left\{ {\int_{G_\varepsilon ^{ - 1}\left( 0 \right)}^{G_\varepsilon ^{ - 1}\left( \alpha \right)} {{g_\varepsilon }\left( z \right)\frac{{{{\dot u}_t} + z{{\dot \sigma }_t}}}{{{\sigma _t}}}d{G_\varepsilon }\left( z \right)} } \right\} = \frac{1}{\alpha }E\left\{ {{g_\varepsilon }\left( {{\varepsilon _t}} \right)1\left( {{\varepsilon _t} \le G_\varepsilon ^{ - 1}\left( \varepsilon \right)} \right)\frac{{{{\dot u}_t} + {\varepsilon _t}{{\dot \sigma }_t}}}{{{\sigma _t}}}} \right\}, \end{array} $

以及${{\hat R}_{ES}} = \frac{1}{{an}}\sum\limits_{t = 1}^n {{g_e}} \left( {{{\hat \varepsilon }_t}} \right)1\left( {{{\hat \varepsilon }_t} \le G_\varepsilon ^{ - 1}\left( \varepsilon \right)} \right)\frac{{\mathop {{{\hat \mu }_t}}\limits^. + {\varepsilon _t}\mathop {{{\hat \sigma }_t}}\limits^. }}{{{{\hat \sigma }_t}}}$

其中,${\mathop {{{\hat \mu }_t}}\limits^. }$=∂μt-1, θ0)/∂θ,以及${\mathop {{{\hat \sigma }_t}}\limits^. }$=∂σt-1, θ0)/∂θ。并且,

$ \begin{array}{l} {R_j} = \frac{1}{{{v_{ES}}\left( \alpha \right)}}E\left\{ {\left( {{H_{t - j}}\left( \alpha \right) - \alpha /2} \right)\int_0^\alpha {{g_\varepsilon }\left( {G_\varepsilon ^{ - 1}\left( x \right)} \right)\frac{{{{\dot u}_t} + G_\varepsilon ^{ - 1}\left( x \right){{\dot \sigma }_t}}}{{{\sigma _t}}}dx} } \right\}\\ \;\;\;\;\; = \frac{1}{{{v_{ES}}\left( \alpha \right)}}E\left\{ {\left( {{H_{t - j}}\left( \alpha \right) - \alpha /2} \right)\int_{G_\varepsilon ^{ - 1}\left( 0 \right)}^{G_\varepsilon ^{ - 1}\left( \alpha \right)} {{g_\varepsilon }\left( z \right)\frac{{{{\dot u}_t} + z{{\dot \sigma }_t}}}{{{\sigma _t}}}d{G_\varepsilon }\left( z \right)} } \right\}\\ \;\;\;\;\; = \frac{1}{{{v_{ES}}\left( \alpha \right)}}E\left\{ {\left( {{H_{t - j}}\left( \alpha \right) - \alpha /2} \right){g_\varepsilon }\left( {{\varepsilon _t}} \right)1\left( {{\varepsilon _t} \le G_\varepsilon ^{ - 1}\left( \varepsilon \right)} \right)\frac{{{{\dot u}_t} + {\varepsilon _t}{{\dot \sigma }_t}}}{{{\sigma _t}}}} \right\}, \end{array} $

其对应的可行估计是,

$ {{\hat R}_j} = \frac{1}{{{v_{ES}}\left( \alpha \right)}}\frac{1}{{n - j}}\sum\limits_{t = j + 1}^n {\left( {{{\hat H}_{t - j}}\left( \alpha \right) - \alpha /2} \right){g_\varepsilon }\left( {{{\hat \varepsilon }_t}} \right)1\left( {{{\hat \varepsilon }_t} \le G_\varepsilon ^{ - 1}\left( \varepsilon \right)} \right)\frac{{{{\dot {\hat u}}_t} + {\varepsilon _t}{{\dot {\hat \sigma} }_t}}}{{{{\hat \sigma }_t}}}} 。$

类似地,对修正的VaR后验分析而言,我们有:

$ {{\tilde R}_{VaR}} = \frac{{{g_\varepsilon }\left( {G_\varepsilon ^{ - 1}\left( \alpha \right)} \right)}}{n}\sum\limits_{t = 1}^n {\frac{{{{\dot {\hat u}}_t} + G_\varepsilon ^{ - 1}\left( \alpha \right){{\dot {\hat \sigma} }_t}}}{{{{\hat \sigma }_t}}}} , $

以及,${{\tilde R}_j} = \frac{{ - {g_\varepsilon }\left( {G_\varepsilon ^{ - 1}\left( \alpha \right)} \right)}}{{\left( {n - j} \right)\alpha \left( {1 - \alpha } \right)}}\sum\limits_{t = j + 1}^n {\frac{{\mathop {{{\hat \mu }_t}}\limits^. + G_\varepsilon ^{ - 1}\left( \alpha \right)\mathop {{{\hat \sigma }_t}}\limits^. }}{{{{\hat \sigma }_t}}}} \left( {1\left( {{{\hat u}_{t - j}} \le \alpha } \right) - \alpha } \right)$

附录C:证明

对于一般化的定理1和定理2,我们将再给予证明。这种一般性体现在φ(ut),φ${\mathit{\bar \Psi }}$,而H(·)和h(·)只是φ(ut)的特殊形式。这种一般化的结果,可以用于构建不同于ES的一致性风险度量的后验分析。

定理 A1:在假设A0-A4下,$\frac{1}{{\sqrt n }}\sum\limits_{t = 1}^n {\left( {\varphi \left( {{{\hat u}_t}} \right) - {c_\varphi }} \right)} $dN(0, σφ2),

其中,σφ2=vφ+λRφE[ltl′t]RφRφ=-E$\left\{ {\int {_0^1\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{\theta }d\varphi \left( x \right)} } \right\}$

证明定理A1:首先考虑没有信息截尾的情况。

如果G仅仅依赖于有限阶滞后的YtXt,则不存在信息截尾的情形。可以从Escanciano和Olmo(2010)定理1的证明中得到类似的论据。在假设A0-A2以及A4下,

$ \frac{1}{{\sqrt n }}\sum\limits_{t = 1}^n {\left[ {\varphi \left( {{{\hat u}_t}} \right) - E\left[ {\varphi \left( {{{\hat u}_t}} \right)} \right]\left| {{\Omega _{t - 1}}} \right.} \right]} - \frac{1}{{\sqrt n }}\sum\limits_{t = 1}^n {\left[ {\varphi \left( {{u_t}} \right) - E\left[ {\varphi \left( {{u_t}} \right)} \right]\left| {{\Omega _{t - 1}}} \right.} \right]} = {o_P}\left( 1 \right)。$

因此,

$ \begin{array}{l} \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{{\hat u}_t}} \right) - {c_\varphi }} \right]} = \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{{\hat u}_t}} \right) - {c_\varphi }} \right]} + \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {{{\left( {{{\theta '}_T} - {\theta _0}} \right)}^\prime }\frac{{\partial E\left[ {\varphi \left( {{u_t}\left( {{{\tilde \theta }_T}} \right)} \right)\left| {{\Omega _{t - 1}}} \right.} \right]}}{{\partial \theta }} + {o_P}\left( 1 \right)} \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{u_t}} \right) - {c_\varphi }} \right]} + \sqrt \lambda \sqrt T {\left( {{{\hat \theta }_T} - {\theta _0}} \right)^\prime }\frac{1}{n}\sum\limits_{l = 1}^n {\frac{{\partial E\left[ {\varphi \left( {{u_t}\left( {{{\tilde \theta }_T}} \right)} \right)\left| {{\Omega _{t - 1}}} \right.} \right]}}{{\partial \theta }} + {o_P}\left( 1 \right)} , \end{array} $

其中,${{\tilde \theta }_T}$是介于${{\tilde \theta }_T}$θ0之间的中值点。注意:

$ \frac{{\partial E\left[ {\varphi \left( {{u_t}\left( \theta \right)} \right)\left| {{\Omega _{t - 1}}} \right.} \right]}}{{\partial \theta }} = \frac{{\partial \left( {\int_0^1 {\varphi \left( x \right)d{F_t}\left( {\theta ,x} \right)} } \right)}}{{\partial \theta }} = - \frac{{\partial \int_0^1 {{F_t}\left( {\theta ,x} \right)d\varphi \left( x \right)} }}{{\partial \theta }}。$

因此,

$ \begin{array}{l} \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{{\hat u}_t}} \right) - {c_\varphi }} \right]} = \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{u_t}} \right) - {c_\varphi }} \right]} \sqrt \lambda \sqrt T {\left( {{{\hat \theta }_T} - {\theta _0}} \right)^\prime }{R_\varphi } + {o_P}\left( 1 \right)\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{1}{{\sqrt n }}\sum\limits_{t = 1}^n {\left[ {\varphi \left( {{u_t}} \right) - {c_\varphi }} \right]\sqrt \lambda {{R'}_\varphi }\frac{1}{{\sqrt T }}} \sum\limits_{t = - Y + 1}^0 {{l_t} + {o_P}\left( 1 \right)} \end{array} $

注意,等式右侧第一项依分布收敛于N(0, vφ),并且前两项的协方差为零,因为第一项是针对样本外观测的式子,第二项是针对样本内观测的式子。从而完成了定理A1的证明。

其次,考虑信息存在截尾的情形。

定义${{\tilde u}_t}$=G(Yt, Ωt-1, ${{\hat \theta }_T}$),我们可得,

$ \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{{\hat u}_t}} \right) - {c_\varphi }} \right]} = \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{{\hat u}_t}} \right) - \varphi \left( {{{\tilde u}_t}} \right)} \right]} + \frac{1}{{\sqrt n }}\sum\limits_{l = 1}^n {\left[ {\varphi \left( {{{\tilde u}_t}} \right) - {c_\varphi }} \right]} 。$

假设A3隐含了上式的第一项是oP(1)。然后,针对没有信息截尾的$1/\sqrt n \sum\limits_{t = 1}^n {\left( {\varphi \left( {{{\hat u}_t}} \right) - {c_\varphi }} \right)} $的证明可以直接应用到$1/\sqrt n \sum\limits_{t = 1}^n {\left( {\varphi \left( {{{\tilde u}_t}} \right) - {c_\varphi }} \right)} $,从而完成了定理A1的证明。

定理1、推论1以及推论3的证明,可以直接从定理A1中得出。

接下来,我们证明一般化的定理2,为此我们需要如下引理。定义,

$ {R_{nj}}\left( {x,y} \right) = \frac{1}{{n - j}}\sum\limits_{t = 1 + j}^n {\left\{ {1\left( {{u_t} \le x} \right) - x} \right\}\left\{ {1\left( {{u_{t - j}} \le y} \right) - y} \right\}} $
$ {{\hat R}_{nj}}\left( {x,y} \right) = \frac{1}{{n - j}}\sum\limits_{t = 1 + j}^n {\left\{ {1\left( {{{\hat u}_t} \le x} \right) - x} \right\}\left\{ {1\left( {{{\hat u}_{t - j}} \le y} \right) - y} \right\}} 。$

引理 A1:在假设A0-A4下,我们有:

$ \mathop {\sup }\limits_{0 \le x \le 1,0 \le y \le 1} \left| {\sqrt {n - j} \left[ {{{\hat R}_{nj}}\left( {x,y} \right) - {R_{nj}}\left( {x,y} \right)} \right] - \sqrt \lambda \sqrt T {{\left( {{{\hat \theta }_T} - \theta } \right)}^\prime }{E_j}\left( {x,y} \right)} \right| = {o_P}\left( 1 \right), $

其中,Ej(x, y)=E$\left\{ {\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }}\left[ {1\left( {{u_{t - j}} \le y} \right) - y} \right]} \right\}$

引理A1是Du(2015)定理1的一个特殊情形,所以省略此处的证明。

引理 A2:定义R(x, y)是[0, 1]2上的函数。对于任意的0≤y≤1都有R(, y)∈${\mathit{\bar \Psi }}$,对于任意的0≤x≤1都有R(x, )∈${\mathit{\bar \Psi }}$,以及在边界上R=0。定义l([0, 1]2)是所有R(x, y)函数的矩阵空间,并且拥有上确界函数。然后,如下映射在R上对任意的φ${\mathit{\bar \Psi }}$都是连续的。

$ R \to \int_0^1 {\int_0^1 {\varphi \left( x \right)\varphi \left( y \right)R\left( {dx,dy} \right)} } $

证明引理A2:根据分部积分定理(Shiryaev,1996,pp206,定理11)以及R的定义,我们有$\int_0^1 {\int_0^1 {\varphi \left( x \right)} } \varphi \left( y \right)R\left( {dx,dy} \right) = \int_0^1 {\int_0^1 {R\left( {x,y} \right)} } \varphi \left( {dx} \right)\varphi \left( {dy} \right)$

注意,下式对任意的R1R2l([0, 1]2),以及∫|φ(dx)|<∞都成立。从而,完成了证明。

$ \begin{array}{l} \left| {\int_0^1 {\int_0^1 {{R_1}\left( {x,y} \right)\varphi \left( {dx} \right)\varphi \left( {dy} \right)} } - \int_0^1 {\int_0^1 {{R_2}\left( {x,y} \right)\varphi \left( {dx} \right)\varphi \left( {dy} \right)} } } \right|\\ \le \sup \left| {{R_1}\left( {x,y} \right) - {R_2}\left( {x,y} \right)} \right|\int_0^1 {\int_0^1 {\left| {\varphi \left( {dx} \right)\varphi \left( {dy} \right)} \right|} } , \end{array} $

在表述了两个引理之后,我们将证明一般化的定理2。定义φ(ut)滞后j阶(j>0)的自协方差和自相关系数是γj=Cov(φ(ut), φ(utj))和ρj=$\frac{{{\gamma _j}}}{{{\gamma _0}}}$,样本{ ut} t=1n对应的γjρj是,γnj=$\frac{1}{{n - j}}\sum\limits_{t = 1 + j}^n {} $(φ(ut)-ct)(φ(utj)-ct))和ρnj=$\frac{{{\gamma _{nj}}}}{{{\gamma _{n0}}}}$,但是由于{ ut} t=1n不可观测,所以我们采用${{\hat u}_t}$替换ut

$ {{\hat \gamma }_{nj}} = \frac{1}{{n - j}}\sum\limits_{l = 1 + j}^n {\left( {\varphi \left( {{{\hat u}_t}} \right) - {c_t}} \right)\left. {\left( {\varphi \left( {{{\hat u}_{t - j}}} \right) - {c_t}} \right)} \right)} \;和\;{{\hat \rho }_{nj}} = \frac{{{{\hat \gamma }_{nj}}}}{{{{\hat \gamma }_{n0}}}}。$

定理 A2:在假设A0-A4下,$\sqrt n \hat \rho _n^{\left( m \right)}$dN(0, ∑)。∑的第ij个元素是$\sum\nolimits_{ij} {} $=δij+λRiE[ltl′t]Rj

其中,Rj见下式,δij是克罗内克函数,δiji=j时取值1,否则取值0。

$ {R_j} = \frac{{ - 1}}{{{v_\varphi }}}E\left\{ {\left( {\varphi \left( {{u_{t - j}}} \right) - {c_\varphi }} \right)\int_0^1 {\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }}d\varphi \left( x \right)} } \right\} $ (C.1)

证明定理A2:首先考虑没有信息截尾的情形。

如果G仅仅依赖于有限阶滞后的YtXt,则不存在信息截尾的情形。注意,

$ \sqrt {n - j} {{\hat \gamma }_{nj}} = \sqrt {n - j} \int_0^1 {\int_0^1 {\varphi \left( x \right)\varphi \left( y \right){{\hat R}_{nj}}\left( {dx,dy} \right)} } $
$ \sqrt {n - j} {\gamma _{nj}} = \sqrt {n - j} \int_0^1 {\int_0^1 {\varphi \left( x \right)\varphi \left( y \right){R_{nj}}\left( {dx,dy} \right)} } 。$

通过引理1和引理2可得,

$ \sqrt {n - j} {{\hat \gamma }_{nj}} = \sqrt {n - j} {\gamma _{nj}} + \sqrt \lambda \sqrt T {\left( {{{\hat \theta }_T} - {\theta _0}} \right)^\prime }\int_0^1 {\int_0^1 {\varphi \left( x \right)\varphi \left( y \right){E_j}\left( {dx,dy} \right)} } + {o_P}\left( 1 \right) $ (C.2)

其中,

$ \begin{array}{l} \int_0^1 {\int_0^1 {\varphi \left( x \right)\varphi \left( y \right){E_j}\left( {dx,dy} \right)} } = \int_0^1 {\int_0^1 {E\left\{ {\varphi \left( x \right)\frac{{{\partial ^2}{F_t}\left( {{\theta _0},x} \right)}}{{\partial x\partial \theta }}dx\varphi \left( y \right)\left[ {1\left( {{u_{t - j}} \le dy} \right) - dy} \right]} \right\}} } \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{ = }}\int_0^1 {E\left\{ {\varphi \left( x \right)\frac{{{\partial ^2}{F_t}\left( {{\theta _0},x} \right)}}{{\partial x\partial \theta }}dx\left( {\varphi \left( {{u_{t - j}}} \right) - {c_\varphi }} \right)} \right\}} \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{ = }}E\left\{ {\int_0^1 {\varphi \left( x \right)\frac{{{\partial ^2}{F_t}\left( {{\theta _0},x} \right)}}{{\partial x\partial \theta }}dx\left( {\varphi \left( {{u_{t - j}}} \right) - {c_\varphi }} \right)} } \right\}\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{ = }}E\left\{ {\left[ {\varphi \left( x \right)\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }}\left| {_0^1} \right. - \int_0^1 {\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }}dx} } \right]\left( {\varphi \left( {{u_{t - j}}} \right) - {c_\varphi }} \right)} \right\}\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{ = }} - E\left\{ {\int_0^1 {\frac{{\partial {F_t}\left( {{\theta _0},x} \right)}}{{\partial \theta }}d\varphi \left( x \right)\left( {\varphi \left( {{u_{t - j}}} \right) - {c_\varphi }} \right)} } \right\}\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;{\rm{ = }}{v_\varphi }{R_j} \end{array} $

(C.1)式定义了Rj。由假设A4可对上式进行期望与积分互换,分部积分原理参见Shiryaev(1996,pp.206)。

因此,我们证明了$\sqrt {n - j} \left( {{{\hat \gamma }_{nj}} - {\gamma _{nj}}} \right) = \sqrt \lambda \sqrt T {\left( {{{\hat \theta }_T} - {\theta _0}} \right)^\prime }{v_\varphi }{R_j} + {o_p}\left( 1 \right)$

然后,我们可得出,

$ \sqrt {n - j} \left( {{{\hat \rho }_{nj}} - {\rho _{nj}}} \right) = \frac{{\sqrt {n - j} \left( {{{\hat \gamma }_{nj}} - {\gamma _{nj}}} \right)}}{{{v_\varphi }}} + {o_p}\left( 1 \right) = {{R'}_j}\sqrt \lambda \sqrt T \left( {{\theta _T} - {\theta _0}} \right) + {o_p}\left( 1 \right)。$
$ \begin{array}{l} 因此,\sqrt {n - j} {{\hat \rho }_{nj}} = \sqrt {n - j} {\rho _{nj}} + {{R'}_j}\sqrt \lambda \sqrt T \left( {{\theta _T} - {\theta _0}} \right) + {o_p}\left( 1 \right)\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{1}{{\sqrt {n - j} {v_\varphi }}}\sum\limits_{l = 1 + j}^n {\left( {\varphi \left( {{u_t}} \right) - {c_\varphi }} \right)\left( {\varphi \left( {{u_{t - j}}} \right) - {c_\varphi }} \right) + {{R'}_j}\sqrt \lambda \frac{1}{{\sqrt T }}\sum\limits_{l = - T + 1}^0 {{l_t} + {o_p}\left( 1 \right)} } 。\end{array} $

注意,$\sqrt n $(ρn1, ρn2ρnm) ′→dN(0, Im),等式右侧前两项的协方差为0,因为第一项是样本外观测的式子,第二项是样本内观测的式子。综上,我们完成定理A2的证明。

接下来,我们考虑存在信息截尾的情形。

定义${{\tilde u}_t}$=G(Yt, Ωt-1, ${{\hat \theta }_T}$),以及${{\tilde \gamma }_{nj}}$=1/(n-j)$\sum\limits_{t = 1 + j}^n {\left( {\varphi \left( {{{\tilde u}_t} - {c_\varphi }} \right)} \right)} \left( {\varphi \left( {{{\tilde u}_{t - j}} - {c_\varphi }} \right)} \right)$。从而,

$ \sqrt {n - j} \left( {{{\hat \gamma }_{nj}} - {\gamma _{nj}}} \right) = \sqrt {n - j} \left( {{{\hat \gamma }_{nj}} - {{\tilde \gamma }_{nj}}} \right) + \sqrt {n - j} \left( {{{\tilde \gamma }_{nj}} - {\gamma _{nj}}} \right)。$

通过证明可知,上式中的第一项是op(1)。因为,

$ \begin{array}{l} \sqrt {n - j} \left( {{{\hat \gamma }_{nj}} - {{\tilde \gamma }_{nj}}} \right) = \frac{1}{{\sqrt {n - j} }}\sum\limits_{l = 1 + j}^n {\left[ {\left( {\varphi \left( {{{\hat u}_t}} \right) - {c_\varphi }} \right)\left( {\varphi \left( {{{\hat u}_{t - j}}} \right) - {c_\varphi }} \right)\left( {\varphi \left( {{{\tilde u}_t}} \right) - {c_\varphi }} \right)\left( {\varphi \left( {{{\tilde u}_{t - j}}} \right) - {c_\varphi }} \right)} \right]} \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{1}{{\sqrt {n - j} }}\sum\limits_{l = 1 + j}^n {\left( {\varphi \left( {{{\hat u}_t}} \right) - \varphi \left( {{{\tilde u}_t}} \right)} \right)\left( {\varphi \left( {{{\hat u}_{t - j}}} \right) - {c_\varphi }} \right)} \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\; + \frac{1}{{\sqrt {n - j} }}\sum\limits_{l = 1 + j}^n {\left( {\varphi \left( {{{\tilde u}_t}} \right) - {c_\varphi }} \right)\left( {\varphi \left( {{{\hat u}_{t - j}}} \right) - \varphi \left( {{{\tilde u}_{t - j}}} \right)} \right)} 。\end{array} $

以及从假设A3可知,φ(${{\tilde u}_t}$)=Op(1)。不存在信息截尾的$\sqrt {n - j} \left( {{{\hat \gamma }_{nj}} - {{\tilde \gamma }_{nj}}} \right)$论证可以直接应用到$\sqrt {n - j} \left( {{{\tilde \gamma }_{nj}} - {\gamma _{nj}}} \right)$,从而完成了定理A2的证明。

定理2的证明:定义∑ =QΛQ′,其中Q是正交矩阵,Λ是对角矩阵,对角线元素是{π}j=1m。从定理A2可知,$Q'\sqrt n \rho _n^{\left( m \right)}$dN(0, QQ′)=N(0, Λ)。然后,可以通过CES(m)= ${\left( {Q'\sqrt n \rho _n^{\left( m \right)}} \right)^\prime }\left( {Q'\sqrt n \rho _n^{\left( m \right)}} \right)$完成定理2的证明。

推论2和推论4可从定理2得出。

主要参考文献
[1] Acerbi C, Tasche D. On the coherence of expected shortfall[J]. Journal of Banking & Finance, 2002, 26(7): 1487–1503.
[2] Acerbi C, Szekely B. Backtesting expected shortfall[N]. Risk Magazine, 2014.
[3] Artzner P, Delbaen F, Eber M., et al. Thinking coherently[J]. Risk, 1997, 10: 68–71.
[4] Artzner P, Delbaen F, Eber M., et al. Coherent measures of risk[J]. Mathematical Finance, 1999, 9(3): 203–226. DOI:10.1111/mafi.1999.9.issue-3
[5] Bai J. Testing parametric conditional distributions of dynamic models[J]. Review of Economics and Statistics, 2003, 85(3): 531–549. DOI:10.1162/003465303322369704
[6] Basak S, Shapiro A. Value-at-risk based risk management:Optimal policies and asset prices[J]. Review of Financial Studies, 2001, 14(2): 371–405. DOI:10.1093/rfs/14.2.371
[7] Basel Committee on Banking Supervision. Consultative document:Fundamental review of the trading book[R]. Basel, Switzerland, 2012.
[8] Berkowitz J. Testing density forecasts with applications to risk management[J]. Journal of Business and Economic Statistics, 2001, 19(4): 465–474. DOI:10.1198/07350010152596718
[9] Berkowitz J, Christoffersen P, Pelletier D. Evaluating value-at-risk models with desk-level data[J]. Management Science, 2011, 57(12): 2213–2227. DOI:10.1287/mnsc.1080.0964
[10] Bose A. Bahadur representation of mestimates[J]. Annals of Statistics, 1998, 26(2): 771–777. DOI:10.1214/aos/1028144859
[11] Box G, Pierce D. Distribution of residual autocorrelations in autoregressive integrated moving average time series models[J]. Journal of American Statistical Association, 1970, 65(332): 1509–1527. DOI:10.1080/01621459.1970.10481180
[12] Christoffersen P. Evaluating interval forecasts[J]. International Economic Review, 1998, 39(4): 841–862. DOI:10.2307/2527341
[13] Christoffersen P, Goncalves P. Estimation risk in financial risk management[J]. Journal of Risk, 2005, 7(3): 1–28. DOI:10.21314/JOR.2005.112
[14] Christoffersen P. Value-at-risk models[M]. 2009.
[15] Colletaz G, Hurlin C, Perignon C. The risk map:A new tool for validating risk models[J]. Journal of Banking and Finance, 2013, 37(10): 3843–3854. DOI:10.1016/j.jbankfin.2013.06.006
[16] Du Z. Nonparametric bootstrap tests for the independence of generalized errors[R]. CAEPR Working Paper No. 023-2009, 2015.
[17] Emmer S, Kratz M, Tasche D. What is the best risk measure in practice? A comparison of standard measures[R]. ESSEC Business School:Paris, France, 2014.
[18] Escanciano J. Weak convergence of non-stationary multivariate marked processes with applications to martingale testing[J]. Journal of Multivariate Analysis, 2007, 98(7): 1321–1336. DOI:10.1016/j.jmva.2007.03.004
[19] Escanciano J, Lobato I. Testing the martingale hypothesis[M]. 2009a.
[20] Escanciano J, Lobato I. An automatic portmanteau test for serial correlation[J]. Journal of Econometrics, 2009b, 151(2): 140–149. DOI:10.1016/j.jeconom.2009.03.001
[21] Escanciano J, Olmo J. Backtesting parametric value-at-risk with estimation risk[J]. Journal of Business and Economic Statistics, 2010, 28(1): 36–51. DOI:10.1198/jbes.2009.07063
[22] Escanciano J, Velasco C. Specification tests of parametric dynamic conditional quantiles[J]. Journal of Econometrics, 2010, 159(1): 209–221. DOI:10.1016/j.jeconom.2010.06.003
[23] Escanciano J, Pei P. Pitfalls in backtesting historical simulation models[J]. Journal of Banking and Finance, 2012, 36(8): 2233–2244. DOI:10.1016/j.jbankfin.2012.04.004
[24] Francq C, Zakoian J. Risk-parameter estimation in volatility models[J]. Journal of Econometrics, 2015, 184(1): 158–173. DOI:10.1016/j.jeconom.2014.06.019
[25] Gourieroux C, Zakoian J. Estimation-adjusted VaR[J]. Econometric Theory, 2013, 29(4): 735–770. DOI:10.1017/S0266466612000680
[26] Hansen B. Autoregressive conditional density estimation[J]. International Economic Review, 1994, 35(3): 705–730. DOI:10.2307/2527081
[27] Hong Y, Lee T. Diagnostic checking for adequacy of linear and nonlinear time series models[J]. Econometric Theory, 2003, 19(6): 1065–1121.
[28] Hong Y, Li H. Nonparametric specification testing for continuous-time modelswith applications to term structure of interest rates[J]. The Review of Financial Studies, 2005, 18(1): 37–84. DOI:10.1093/rfs/hhh006
[29] Hurlin C, Tokpavi S. Backtesting value-at-risk accuracy:A simple new test[J]. Journal of Risk, 2007, 9(9): 19–37.
[30] Jorion P. Value at risk:The new benchmark for managing financial risk[M]. New York: McGraw-Hill, 2006.
[31] Kerkhof J, Melenberg B. Backtesting for risk-based regulatory capital[J]. Journal of Banking and Finance, 2004, 28(8): 1845–1865. DOI:10.1016/j.jbankfin.2003.06.007
[32] Kourouma L, Dupre D, Sanfilippo G, et al. Extreme value at risk and expected shortfall during financial crisis[R]. Working Paper, 2011.
[33] Kupiec P. Techniques for verifying the accuracy of risk measurement models[J]. The Journal of Derivatives, 1995, 3(2): 73–84. DOI:10.3905/jod.1995.407942
[34] McNeil A, Frey R. Estimation of tail-related risk measures for heteroscedastic financial time series:An extreme value approach[J]. Journal of Empirical Finance, 2000, 7(3/4): 271–300.
[35] O'Brien J, Szerszen P. An evaluation of bank VaR measures for market risk during and before the financial crisis[R]. FEDS Working Paper No. 2014-21, 2014.
[36] Perignon C, Smith D. A new approach to comparing VaR estimation methods[J]. Journal of Derivatives, 2008, 16(2): 54–66. DOI:10.3905/JOD.2008.16.2.054
[37] Rosenblatt M. Remarks on a multivariate transformation[J]. Annals of Mathematical Statistics, 1952, 23: 470–472. DOI:10.1214/aoms/1177729394
[38] Shiryaev A. Probability[M]. New York: Springer, 1996.
[39] van der Vaart A, Wellner J. Weak convergence and empirical processes[M]. New York: Springer, 1996.
[40] Wong W. Backtesting trading risk of commercial banks using expected shortfall[J]. Journal of Banking & Finance, 2008, 32(7): 1404–1415.
[41] Wong W. Backtesting value-at-risk based on tail losses[J]. Journal of Empirical Finance, 2010, 17(3): 526–538. DOI:10.1016/j.jempfin.2009.11.004
[42] Wu W. M-estimation of linear models with dependent errors[J]. Annals of Statistics, 2007, 35(2): 495–521. DOI:10.1214/009053606000001406
[43] Yamai Y, Yoshiba T. Comparative analyses of expected shortfall and value-at-risk:Their estimation error, decomposition, and optimization[J]. Monetary and Economic Studies, 2002, 20(3): 87–122.
[44] Yamai Y, Yoshiba T. Value-at-risk versus expected shortfall:A practical perspective[J]. Journal of Banking and Finance, 2005, 29(4): 99–115.