EVT

Oct

2019

Valor em Risco de Índices Setoriais na Bovespa

Neste artigo serão analisadas as séries de retornos de seis principais índices de ações de setores da Bovespa. Foram escolhidos os quatro maiores índices setoriais pelo critério de valor de mercado ao final de março de 2018, índices Financeiro (IFNC), Consumo (ICON), Industrial (INDX) e Materiais (IMAT), além do índice de Governança (IGCX) e o próprio índice Bovespa (IBOV). Os retornos coletados foram entre as datas de 01/01/2009 a 31/12/2013 para o período considerado dentro da amostra, no qual são feitas algumas análises preliminares. O período fora da amostra, de onde são retirados os resultados de backtest se estende de 01/01/2014 a 08/05/2018. Em dias sem negociação nos mercados, os períodos iniciam-se na data útil seguinte e terminam em data útil imediatamente anterior.

No primeiro artigo desta sequência foi apresentada uma vasta revisão de literatura sobre a EVT e suas aplicações em finanças, com enfoque especial ao gerenciamento de risco. No segundo artigo a Teoria do Valor Extremo – EVT foi formalizada e apresentadas as equações para o cálculo tanto do VaR quanto do ES para um ativo financeiro. Também foi abordada a diferença entre medidas incondicionais e condicionais de risco. No presente artigo faremos uma aplicação da EVT para o cálculo do VaR condicional dos seis índices da Bovespa e faremos uma comparação deste modelo com o conhecido Riskmetrics.

A tabela 1 apresenta algumas das estatísticas descritivas mais importantes para as séries de retornos dos ativos no período completo, dentro e fora da amostra. É possível verificar que os retornos não podem ser considerados normais, com a estatística de Jarque-Bera rejeitando a hipótese nula e com o alto grau de curtose em excesso verificado para todos os índices analisados.

Também é possível verificar a grande autocorrelação serial entre os quadrados dos retornos, uma proxy para a autocorrelação das variâncias, através da estatística $Q^2(10)$ de Ljung-Box, o que corrobora os fatos estilizados de séries financeiras, vide Cont (2001).

Tabela 1: Estatísticas descritivas dos retornos (amostra completa de 02/01/2009 08/05/2018 ).
Descritivas	IBOV	ICON	IFNC	IGCX	INDX	IMAT
Média	0.00034	0.00069	0.00066	0.00052	0.00047	0.00043
Máximo	0.06929	0.05183	0.09295	0.06188	0.06388	0.07572
Mínimo	-0.09211	-0.07446	-0.12288	-0.08837	-0.07370	-0.09079
Desvp	0.01497	0.01148	0.01640	0.01269	0.01247	0.01820
Assimetria	-0.03784	-0.11441	0.00658	-0.16642	-0.01978	0.08989
Curtose exc.	2.13179	2.23608	3.23913	3.06149	2.43070	1.37705
Jarque-Bera	439.98***	488.47***	1013.68***	916.29***	571.28***	186.72***
$Q^2(10)$	122.14***	104.32***	97.44***	146.68***	256.11***	230.39***
N.obs	2311	2311	2311	2311	2311	2311

Na figura 1 são visualizadas as séries de retornos logarítmicos em estudo. Por inspeção visual simples é possível verificar a heterocedasticidade destes retornos, corroborando as estatísticas encontradas na tabela 1.

A figura 2 é mais interessante para se apreciar a normalidade destes retornos. Tratam-se de gráficos quantil-quantil feitos entre a amostra completa dos retornos e uma distribuição normal de referência. Para todas as séries é observado um desvio da normalidade nas caudas, configurando distribuições leptocúrticas em todos os casos.

Figura 1: Retornos dos índices do estudo. Período completo entre 02/01/2009 a 08/05/2018.

Figura 2: Análise de normalidade dos retornos através de gráficos quantil-quantil.

Filtro GARCH

Voltando-se para o período dentro da amostra, o filtro proposto GARCH(1,1) foi aplicado a estas séries e seus coeficientes estimados. A função do modelo GARCH neste primeiro estágio é a filtragem da série de perdas, de modo que os resíduos padronizados resultantes não sejam autocorrelacionados e tampouco possuam heterocedasticidade.

Para trabalhar com o VaR em seus quantis altos e portanto, modelar a cauda direita da distribuição, passa-se a trabalhar com a distribuição das perdas dos ativos. A tabela 2 apresenta novamente as estatísticas Jarque-Bera e Ljung-Box (Q e $Q^2$) desta vez para os resíduos padronizados resultantes da filtragem das perdas no primeiro estágio do modelo GARCH-POT. Enquanto que os resíduos padronizados, assim como os retornos, não são normais como já se esperava, as estatísticas de autocorrelação agora estão todas em favor da ausência desta. Para todos os índices analisados, não é possível rejeitar $H_0$ nos testes de autocorrelação, tanto para os resíduos ($Q(10)$) como para os seus quadrados ($Q^2(10)$) em evidente contraste com os valores apresentados na tabela 1 quando foram analisados os retornos destes índices. Evidência que a filtragem inicial foi bem sucedida em remover autocorrelação serial tanto nas perdas quanto na variância destas.

Tabela 2: Estatísticas de diagnóstico para o modelo GARCH. Valores p entre parênteses. (Período dentro da amostra entre 02/01/2009 a 31/12/2013).
Estatística	IBOV	ICON	IFNC	IGCX	INDX	IMAT
Curtose exc.	1.04702	0.80399	1.07619	1.06174	0.94823	0.85436
Jarque-Bera	59.68837	35.65255	60.39086	65.08960	49.34559	38.82424
	(0.00000)	(0.00000)	(0.00000)	(0.00000)	(0.00000)	(0.00000)
Q(10)	2.22678	4.56100	2.93792	2.56408	2.64320	2.44096
	(0.91608)	(0.57468)	(0.82868)	(0.87790)	(0.86803)	(0.89259)
$Q^2(10)$	8.48918	3.04788	3.72839	6.32895	5.37480	5.52198
	(0.13786)	(0.81307)	(0.70876)	(0.32562)	(0.45069)	(0.42978)

Sendo assim, com retornos padronizados que não são normalmente distribuídos e possuem cauda longas com excesso de curtose, mas que após filtragem não apresentam mais autocorrelação ou heterocedasticidade, pode-se passar ao segundo estágio do modelo, ou seja, aplicar a teoria do valor extremo através do método peaks over treshold para parametrizar a cauda direita das distribuições de perdas dos ativos.

Método POT

Os resíduos padronizados são tratados como as realizações do processo de inovação no modelo GARCH. Estas inovações serão analisadas sob a ótica da EVT para a obtenção dos parâmetros da GPD que definem a cauda direita de sua distribuição.

Para tanto, deve ser estabelecido um limiar u adequado para cada uma das séries, de modo que seja satisfeito o teorema de Pickands-Balkema-de Haan. Este valor de limiar será diferente para cada série e sua escolha deve seguir os princípios delineados no artigo Medidas de Risco com a Teoria do Valor Extremo através da função média dos excessos. Entretanto, considerando o trade-off existente entre o viés e a variância dos parâmetros da GPD estimados com relação a escolha do valor deste limiar, pode-se abordar o problema desta escolha de outra forma.

Neste artigo foi utilizado o quantil empírico a 90% para a escolha do valor do limiar. Conforme visto anteriormente, um valor de limiar que resulte em um número de excessos observados ($N_u$) entre 100 e 130 é o mais indicado. Considerando o tamanho da janela de dados dentro da amostra para os índices sob análise, este quantil resulta em número de excessos nesta quantidade.

A escolha do limiar através de um quantil empírico fixo também é mais adequada considerando-se que para a fase de backtest do modelo é necessário reavaliar o valor deste limiar para cada dia dentro do período fora da amostra, o que se tornaria inviável de ser feito através da análise gráfica da função média dos excessos.

Escolhido o limiar u, trata-se de obter a série de inovações em excesso ao limiar $Z^u_t:\{Z^u_t = Z_t-u |Z_t > u\}$, onde $Z_t$ são as inovações, em que os resíduos padronizados encontrados são suas realizações e $Z^u_t$ são portanto, as inovações em excesso.

A esta série de inovações em excesso é aplicada a função log-verossimilhança dada na equação (1) que por sua vez é maximizada em relação aos parâmetros $\xi$ e $\psi$ para a obtenção de suas estimativas.

\[\begin{align}
\ln L(\xi, \psi; Z^u_j)=&\sum\limits_{j=1}^{N_u}\ln g_{\xi, \psi}(Z^u_j)\nonumber\\
=&-N_u \ln \psi-\left(1+\frac{1}{\xi}\right)\sum\limits_{j=1}^{N_u}\ln \left(1+\xi\frac{Z^u_j}{\psi}\right)
\tag{1}
\end{align}\]

A tabela 3 apresenta os valores destes parâmetros e seus erros padrão para cada um dos índices, com a estimação feita com os dados do período dentro da amostra. Também são apresentados o número de observações dentro da amostra para o total dos resíduos padronizados, assim como o número de excessos observados ($N_u$) para o limiar escolhido ($u$). Observa-se como o número de excessos varia de acordo com o índice (asim como o total de observações), porém todos ficam em torno de 120 excessos, que é considerado um valor ideal.

Tabela 3: Parâmetros estimados para o modelo EVT dos resíduos padronizados. Período dentro da amostra.
	IBOV	ICON	IFNC	IGCX	INDX	IMAT
N.obs.	1236	1236	1236	1236	1236	1236
Limiar $u$	1.27441	1.21387	1.24376	1.28281	1.27872	1.24701
Num.exc. $N_u$	124	124	124	124	124	124
Par. forma $\xi$	-0.00769	-0.06855	-0.08808	0.02810	0.06821	-0.01423
Erro padrão	0.08675	0.09660	0.06545	0.10628	0.10726	0.09281
Par. escala $\psi$	0.57865	0.65301	0.64641	0.56854	0.51291	0.54368
Erro padrão	0.07225	0.08603	0.07164	0.07910	0.07168	0.07021
Quantil $z_{0.975}$	2.07417	2.07937	2.08917	2.08844	2.02629	1.99505
Quantil $z_{0.990}$	2.59690	2.60662	2.59265	2.63717	2.55947	2.48030

Na figura 3 é possível visualizar os gráficos de ajuste das inovações em excesso de cada um dos índices contra suas distribuições GPD de referência, ou seja, aquelas com os parâmetros de forma e escala estimados para os respectivos índices. Verifica-se que a distribuição destes excessos pouco se desvia com relação a curva de referência, denotando um bom ajuste dos dados ao modelo teórico. Em contraste, quando modelados diretamente através de uma distribuição normal, as séries de retornos se afastavam consideravelmente de suas referências como já apresentado na figura 2. Ao se utilizar um método semi-paramétrico como o proposto, modelando apenas uma parte da cauda da distribuição, a parte que interessa para a modelagem de risco, obtém-se uma estimação muito mais próxima da realidade que os dados apresentam.

Figura 3: Qualidade do ajuste dos dados de inovações em excesso contra uma GPD de referência. Período dentro da amostra.

Avaliação dos modelos

A avaliação dos modelos aqui referidos concentra-se em testar através de backtest o modelo EVT condicional apresentado, o qual utiliza a metodologia em dois estágios proposta por McNeil and Frey (2000) assim como o modelo proposto por RiskMetrics (1995), sendo, portanto, dois modelos testados e comparados para fins de estimação da medida de risco.

O modelo EVT incondicional aqui proposto é diferente daquele encontrado nas outras referências. A filtragem através de um modelo GARCH é realizada e os resíduos padrão resultantes são utilizados para estimar o quantil desejado através da EVT, entretanto, ao se calcular a medida de risco são utilizados a média e o desvio padrão incondicionais do filtro, resultando em menor volatilidade do VaR. Uma vantagem teórica deste método é que se está aplicando a teoria de valor extremo a uma série iid, os resíduos padronizados, conforme preconizado pela teoria. Outra vantagem de cunho mais prático é que esta abordagem se torna um modelo que não possui a alta volatilidade dos modelos condicionais e apresenta de forma mais branda que os modelos incondicionais (às vezes chamados de estáticos) os agrupamentos nas violações ao VaR.

Para fazer o backtest, considere a série $x_1, x_2, \ldots, x_m$, com $m\gg n$ e o conjunto de dias $T = \{n, \ldots, m-1\}$. Uma janela de dados de tamanho fixo contendo as últimas $n$ observações é utilizada e para cada dia $t \in T$ é reestimado o valor de $VaR^t_\alpha$. O período de teste fora da amostra vai de 01/01/2015 a 08/05/2018, com dados diários para as perdas dos índices sob análise. O número de observações ($n$) dentro da janela de dados utilizada para fazer a estimação dos modelos para cada um dos índices é aquele apresentado na tabela 3 (N.obs.), esse valor é fixo para cada série. Portanto, a partir do início do período de teste, esta janela de tamanho fixo avança um dia e o modelo é reestimado, resultando no valor estimado de $VaR_\alpha^t$, ou seja, a medida de risco calculada ao final do dia $t$ que deverá ser comparada a perda incorrida no dia a frente, $t+1$.

O quantil para a definição do limiar u é fixo em 0,90, o que resultará em valores distintos de limiar para cada rodada do teste, e possivelmente um número diferente de excessos observados. Entretanto essas diferenças, considerando o tamanho fixo da janela de dados, será muito pequeno em torno de uma unidade apenas. Mantém-se assim, um número de excessos em torno de 120 observações, valor adequado para se fazer as estimativas dos parâmetros da GPD.

A figura 4 apresenta o resultado do backtest para o modelo EVT condicional para cada um dos índices analisados. É possível verificar como a medida condicional de risco oscila de valor, acompanhando a volatilidade do índice, sendo especialmente responsiva a grandes choques. Em comparação com o modelo Riskmetrics, o EVT apresenta maior persistência em seu nível medido de risco após um choque de volatilidade, ou em outras palavras, uma menor taxa de decaimento. Através da figura 5 pode-se verificar esta condição para o índice IBovespa onde, após a grande perda ocorrida em 18 de maio de 2017, fica evidente que o modelo retorna aos seus níveis de risco anteriores de forma mais lenta que a medida Riskmetrics. Entende-se por modelos incondicionais aqueles em que a volatilidade histórica de toda a janela de dados é utilizada para calcular as medias de risco. É nítido como o modelo condicional, que utiliza a previsão para a média e volatilidade das perdas e então utiliza-os para obter a medida de risco, é muito mais responsivo a alterações no regime de volatilidade do ativo. Um modelo incondicional, por sua vez, não responde de forma acentuada a variações de curto-prazo na volatilidade do ativo, pois estas observações mais extremas são atenuadas em meio a todas as outras observações utilizadas da janela de dados.

$$VaR_{99\%}$ no modelo EVT condicional para todos os índices. Violações demarcadas.$

Figura 4: $VaR_{99\%}$ no modelo EVT condicional para todos os índices. Violações demarcadas.

Teste fora da amostra para o IBOV. O modelo EVT condicional (linha sólida) possui menor taxa de decaimento após um choque de volatilidde que o modelo Riskmetrics (linha tracejada).

Figura 5: Teste fora da amostra para o IBOV. O modelo EVT condicional (linha sólida) possui menor taxa de decaimento após um choque de volatilidde que o modelo Riskmetrics (linha tracejada).

Uma violação é dita ocorrida quando a perda observada é maior que a medida de risco estimada no dia anterior, $x_{t+1}>VaR^t_\alpha$ para um $\alpha$ dentro do conjunto de níveis de significância, neste artigo $\alpha \in \{0,975; 0,990\}$. A tabela 4 apresenta em termos percentuais as violações ocorridas para cada um dos modelos para os níveis de cobertura dados. Dentre os dois modelos analisados, o EVT condicional se saiu melhor nos dois níveis de cobertura. %Os modelos condicionais apresentaram uma tendência a subestimação do risco, com um número superior de violações ao esperado. Os modelos incondicionais, ao contrário, superestimam o risco e apresentam tendência a um número menor de violações. Dentre os modelos estimados o EVT condicional apresentou as violações percentuais mais próximas ao valor esperado, $1-\alpha$.

Tabela 4: Percentual de violações. Período fora da amostra.
Modelo	IBOV	ICON	IFNC	IGCX	INDX	IMAT
Cobertura = 1%
EVT Condicional	0.65	1.21	0.74	1.12	0.93	0.93
RiskMetrics	1.02	1.68	1.12	1.30	1.40	1.40
Cobertura = 2.5%
EVT Condicional	2.14	2.61	2.14	2.14	2.42	2.70
RiskMetrics	2.42	2.79	2.14	2.61	3.54	2.61

Testes estatísticos

Pode ser realizado um teste estatístico para verificar se o modelo para $VaR_\alpha$ foi corretamente especificado levando-se em consideração o seu nível de cobertura, $1-\alpha$. Este teste foi originalmente proposto por Kupiec (1995) e pretende derivar propriedades estatísticas formais do teste utilizado para verificar a precisão de modelos VaR. Este teste permite inferir se a frequência de violações ao VaR é consistente com o valor esperado destas, o nível de cobertura. Sob a hipótese nula de um modelo corretamente especificado o número de violações segue uma distribuição binomial e o teste toma a forma de razão de verossimilhança com a seguinte estatística:

\[\begin{equation}
LR_{uc}=-2\ln\left(\frac{(1-p)^{N-X}p^X}{(1-\frac{X}{N})^{N-X}(\frac{X}{N})^X}\right)
\tag{2}
\end{equation}\]

onde $p$ é o nível de cobertura, $N$ é o número de observações do período fora da amostra e $X$ neste caso é o número de violações ocorridas.

Este teste não faz nenhum tipo de assunção, e por conseguinte não testa, a hipótese de independência entre as violações, sendo considerado um teste de cobertura incondicional para o VaR.

Um teste condicional é aquele proposto, entre outros, por Christoffersen and Pelletier (2004). A hipótese de independência entre as violações está relacionada a duração entre as observações destas. O tempo que se passa entre uma violação e outra deve ser independente e não formar agrupamentos (clusters). Sob a hipótese nula de um modelo corretamente especificado, a duração não deve possuir memória. Como a única distribuição contínua que não possui memória é a distribuição exponencial, os autores propuseram ajustar os dados a uma distribuição Weibull da qual a exponencial é um caso particular quando o parâmetro $b=1$ e, portanto, o teste é feito sobre este parâmetro. O teste de duração de Christoffersen é feito sob a forma de razão de verossimilhança, sendo a função densidade de uma Weibull:

\[\begin{equation}
f_W(D; a, b) = \begin{cases}
a^b b D^{b-1}e^{-(aD)^b}, &D \geq 0\\
0,&D<0.
\end{cases}
\tag{3}
\end{equation}\]

onde $D$ é a duração entre as violações e $a$ e $b$ são os parâmetros da distribuição.

Nota-se que este teste é destinado apenas a verificação da hipótese de independência das violações. Em conjunto com o teste de Kupiec, a tabela 5 fornece um panorama completo sobre a adequação das especificações de modelos VaR.

Tabela 5: Testes estatísticos para o VaR. Teste incondicional de Kupiec, *LRuc*, e teste de independência por duração de Christoffersen e Pelletier, *LRdur*. Os modelos testados são: EVT condicional (cevt) e Riskmetrics (riskmetrics). Período fora da amostra.
Modelo	Estatística	IBOV	ICON	IFNC	IGCX	INDX	IMAT
Cobertura 1%
cevt	LRuc	1.50	0.45	0.77	0.14	0.05	0.05
cevt	LRdur	3.73	1.45	0.53	0.00	2.36	0.03
riskmetrics	LRuc	0.01	4.12**	0.14	0.91	1.52	1.52
riskmetrics	LRdur	0.05	0.13	0.09	0.01	3.88**	0.22
Cobertura 2.5%
cevt	LRuc	0.59	0.05	0.59	0.59	0.03	0.17
cevt	LRdur	0.30	0.02	0.94	0.37	0.83	0.99
riskmetrics	LRuc	0.03	0.37	0.59	0.05	4.22**	0.05
riskmetrics	LRdur	0.96	0.25	0.00	0.69	0.02	0.53

Inspecionando a tabela 5 verifica-se como o modelo EVT condicional, especialmente para o nível de cobertura a 1% é superior ao seu rival, prevalecendo como o único modelo a não rejeitar a hipótese nula a 95% de confiança para ambos os testes e níveis de cobertura.

Conclusão

Este artigo tratou de estimar e comparar dois modelos de VaR para seis índices de ações em segmentos diferentes da Bovespa. Os modelos EVT condicional e Riskmetrics foram estudados e comparados com base em dois tipos diferentes de testes. Especial ênfase foi dada ao modelo EVT condicional o qual se utiliza da teoria do valor extremo para chegar ao resultado da medida de risco. Dentre os modelos estimados, o EVT condicional apresentou os percentuais de violações mais próximos ao valor esperado.

Nos testes estatísticos de cobertura incondicional e independência, a superioridade do modelo EVT condicional se apresenta de forma mais concreta. Este modelo não apresentou rejeição a hipótese nula da correta especificação, tanto para o teste de Kupiec quanto para o teste de duração de Christoffersen e Pelletier ao nível de confiança de 95%.

Apesar de os modelos condicionais se mostrarem mais adequados a estimação do VaR através dos testes estatísticos apresentados, este tipo de modelo, em virtude de sua grande variabilidade ao longo do tempo no valor estimado da medida de risco, impõe uma barreira de cunho prático a sua implementação. Para alterar o VaR tão drasticamente e em curto período de tempo, a instituição financeira deve ser capaz de rapidamente alterar a alocação de ativos de seu portfólio, o que não é a realidade da grande maioria destas instituições. O mercado pode não possuir a liquidez ou a profundidade necessária para realizar estas operações, isso sem contar os custos envolvidos nas transações.

Além deste trade-off entre superioridade teórica do modelo EVT condicional e sua implementação prática mais complexa, a medida de risco VaR atualmente está sendo utilizada em conjunto com a Expected Shortfall. Esta última pode ser derivada a partir do modelo EVT condicional com facilidade e deve ser abordada em outro trabalho, juntamente com testes específicos para o ES com intuito de averiguação do melhor modelo.

Christoffersen, Peter, and Denis Pelletier. 2004. “Backtesting Value-at-Risk: A Duration-Based Approach.” Journal of Financial Econometrics 2 (1). Oxford University Press: 84–108.

Cont, R. 2001. “Empirical properties of asset returns: stylized facts and statistical issues.” Quantitative Finance 1 (2): 223–36. doi:10.1080/713665670.

Kupiec, Paul H. 1995. “Techniques for Verifying the Accuracy of Risk Measurement Models.” The Journal of Derivatives 3 (2). Institutional Investor Journals: 73–84.

McNeil, Alexander J, and Rüdiger Frey. 2000. “Estimation of tail-related risk measures for heteroscedastic financial time series: an extreme value approach.” Journal of Empirical Finance 7 (3-4): 271–300. doi:10.1016/s0927-5398(00)00012-8.

RiskMetrics. 1995. “Technical Document – 3rd Edition.” J.P Morgan Guaranty Trust Company.

Oct

2019

Medidas de Risco com a Teoria do Valor Extremo

Teoria do valor extremo (EVT da sigla em inglês) é um ramo da estatística que lida diretamente com eventos raros, extremos. Seu objetivo é modelar eventos que se distanciam muito da mediana de uma distribuição. Justamente por esta característica, a EVT está sendo utilizada para modelar riscos que possuem distribuição com caudas longas, um dos fatos estilizados que apresentamos sobre retornos de ativos financeiros.

No primeiro artigo desta sequência foi apresentada uma vasta revisão de literatura sobre a EVT e suas aplicações em finanças, com enfoque especial ao gerenciamento de risco. Neste artigo formalizaremos a teoria e serão apresentadas as equações para o cálculo tanto do VaR quanto do ES para um ativo financeiro. Também será abordada a diferença entre medidas incondicionais e condicionais de risco.

Ao utilizarmos a EVT, e mais especificamente o método conhecido como peaks over treshold – POT, estamos interessados em modelar apenas a parte da cauda da distribuição das perdas de um ativo financeiro maiores que um determinado valor de limiar u. É da modelagem desta cauda, portanto, que faremos as estimativas de risco VaR e ES.

Distribuição de valores extremos generalizada

Consideremos uma amostra de uma variável aleatória cujas observações sejam independentes e igualmente distribuídas (va iid) $L_i,i\in \mathbb{N}$ que represente as perdas financeiras de um determinado ativo.

A EVT está interessada em investigar o comportamento da distribuição dos máximos desta va iid dados por $M_n = \max (L_1, \ldots , L_n)$ para vários valores de $n$ e a medida que $n\rightarrow \infty$. A sequência $M_n$ é chamada de máximos em bloco e é possível demonstrar que a única distribuição para a qual $M_n$ converge com $n\rightarrow \infty$ é a distribuição de valores extremos generalizada (GEV, da sigla em inglês).

Para tanto, é necessário normalizarmos esta sequência de máximos de forma que sua distribuição seja convergente para uma distribuição $H(x)$ não-degenerada¹. Seja $F(x)$ a distribuição original de uma variável aleatória iid, é possível normalizar seus máximos em bloco através da relação $M_n^*=(M_n-d_n)/c_n$ de forma que:

\[\begin{equation}
\lim_{n \rightarrow \infty} P\left(\frac{M_n-d_n}{c_n} \leq x \right)
= \lim_{n \rightarrow \infty} F^n(c_nx + d_n)
= H(x)
\tag{1}
\end{equation}\]

Em outras palavras, para determinadas sequências $c_n$ e $d_n$ a serem escolhidas, existe uma distribuição de $H(x)$ não-degenerada a qual representa a distribuição dos máximos em bloco de $F(x)$.

A potenciação de $F$ em $n$ deriva diretamente da suposição que a variável aleatória é iid, enquanto que a transformação de $x \rightarrow c_n x+d_n$ é a normalização dos máximos em bloco.

Definição 1 (Domínio de atração de máximos) Se a equação (1) é válida para uma $H$ não-degenerada, então se diz que $F \in MDA(H)$, $F$ pertence ao domínio de atração de máximos de $H$.

Teorema 1 (Fisher-Tippett) Se $F \in MDA(H)$ para alguma $H$ não-degenerada, então $H$ deve ser uma distribuição do tipo de valores extremos generalizada – GEV.

O teorema 1 foi estabelecido através de três artigos, Fisher and Tippett (1928), Gnedenko (1941) e Gnedenko (1943).

Definição 2 (Distribuição de valores extremos generalizada) É definida por sua p.d.f (função densidade de probabilidades) a qual é dada por:

\[\begin{equation}
H_\xi(x) =
\begin{cases}
exp(-(1+\xi x)^{-\frac{1}{\xi}}), & \xi \neq 0,\\
exp(-e^{-x}), & \xi = 0,\\
\end{cases}
\tag{2}
\end{equation}\]

O parâmetro $\xi$ (leia-se qsi) é conhecido como o parâmetro de forma da distribuição e dependendo deste valor teremos diferentes tipos de distribuição (casos particulares da GEV). Quando $\xi=0$ a distribuição resultante é uma Gumbel, quando $\xi>0$ uma Fréchet surge, e por fim quando $\xi<0$ temos uma Weibull.

Tomemos como exemplo a distribuição exponencial e calcularemos seu MDA e verificaremos se este está entre umas das distribuições GEV. Uma distribuição exponencial é caracterizada pela seguinte função de distribuição (c.d.f):

\[\begin{equation*}
F(x)=1-e^{- \beta x}, \beta > 0 \text{ e } x \geq 0
\end{equation*}\]

Se escolhermos as sequências $c_n=1/\beta$ e $d_n=\ln n /\beta$ podemos substituir diretamente na equação e calcular $H(x)$.

\[\begin{equation*}
F^n \left(c_nx+d_n \right)=\left(1-\frac{1}{n}e^{-x} \right)^n
\end{equation*}\]
\[\begin{equation*}
\lim_{n \rightarrow \infty} \left(1-\frac{1}{n}e^{-x} \right)^n = H(x)
\end{equation*}\]

Fazendo uma simples substituição de variáveis, $i=-e^{-x}$, então:

\[\begin{equation*}
H(x)=\lim_{n \rightarrow \infty}\left(1+\frac{i}{n} \right)^n
\end{equation*}\]

Que é o limite fundamental $e^i$, o qual substituindo novamente $i$ temos:

\[\begin{equation*}
H(x)=exp\left(-e^{-x}\right)=H_0(x), \text{Distribuição Gumbel}
\end{equation*}\]

Ou seja, a distribuição exponencial pertence ao $MDA$ da distribuição Gumbel, a qual por sua vez é um dos casos particulares da GEV quando $\xi=0$.

Via de regra não necessitamos calcular a qual $MDA$ pertencem nossas distribuições, bastando saber que basicamente todas as distribuições contínuas de utilidade prática estão contidas em $MDA(H_\xi)$ para algum valor de $\xi$.

Excessos acima de um limiar

O método conhecido como POT, para calcular a função de distribuição dos valores que excedem um determinado limiar de um conjunto de dados vem sendo empregado no mundo financeiro para ajustar as caudas das distribuições de retornos, ou perdas, dos ativos. Este método é preferido a teoria clássica de valores extremos (e.g. máximos em bloco), pois, desperdiça uma quantidade menor de dados da série original. Qualquer valor que exceda o limiar pré-determinado é considerado na distribuição dos excessos. Esta distribuição dos valores da série que estão acima de um determinado limiar u é definida como:

Definição 3 (Distribuição dos excessos) Seja X uma variável aleatória com função de distribuição c.d.f F. A distribuição dos excessos sobre um limiar u tem a seguinte função de distribuição:

\[\begin{equation}
F_u(x)=P(X-u \leq x | X > u)=\frac{F(x+u)-F(u)}{1-F(u)}
\tag{3}
\end{equation}\]

para $0 \leq x < x_F-u$, onde $x_F \leq \infty$ é o limite direito da distribuição F.

Ou seja, a função distribuição dos excessos sobre um limiar u é a probabilidade condicional que um valor X retirado dos dados subtraído de u (o excesso) seja menor que um dado quantil x, sabendo-se que X é maior que u. Uma importante distribuição que surge na modelagem dos excessos sobre um limiar é a distribuição de pareto gereralizada – GPD, que segue.

Definição 4 (Distribuição de Pareto Generalizada) É definida por sua função de distribuição:

\[\begin{equation}
G_{\xi,\beta(u)}(X) =
\begin{cases}
1- \left(1+ \frac{\xi x}{\beta(u)} \right)^{-\frac{1}{\xi}}, & \xi \neq 0,\\
1-exp\left(-\frac{x}{\beta(u)}\right), & \xi = 0,\\
\end{cases}
\tag{4}
\end{equation}\]

onde $\beta > 0$, e $x\geq 0$ quando $\xi \geq 0$ ou $0 \leq x \leq -\beta / \xi$ quando $\xi < 0$.

Os parâmetros $\xi$ e $\beta$ são conhecidos respectivamente como parâmetros de forma e escala da distribuição. Na figura 1 abaixo, são mostradas três parametrizações para a função de distribuição acumulada (c.d.f) e para a densidade de probabilidades (p.d.f) de GPD com parâmetro $\xi$ iguais a -0,5, 0 e 0,5 enquanto que o parâmetro de escala $\beta$ é mantido constante e igual a 1. Perceba como para $\xi <0$ a p.d.f tem um limite direito que é dado por $-\beta / \xi$ a partir do qual os valores de $g(x)$ são zero.

$Três parametrizações para uma GPD. A linha sólida corresponde a $\xi=0,5$, a linha pontilhada a $\xi=-0,5$ e a linha tracejada a $\xi=0$.$

Figura 1: Três parametrizações para uma GPD. A linha sólida corresponde a $\xi=0,5$, a linha pontilhada a $\xi=-0,5$ e a linha tracejada a $\xi=0$.

A distribuição de Pareto generalizada tem papel fundamental na teoria de valor extremo em função do teorema de Pickands-Balkema-de Haan (Pickands (1975) e Balkema and Haan (1974)) conforme abaixo:

Teorema 2 (Pickands-Balkema-de Haan) Pode ser encontrada uma função $\beta(u)$ tal que:
\[\begin{equation*}
\lim\limits_{u \rightarrow x_F} \; \sup\limits_{0\leq x <x_F – u} |F_u(x)-G_{\xi, \beta(u)}(x)| = 0
\end{equation*}\]
se e somente se $F\in MDA(H_\xi)$ para $\xi \in \mathbb{R}$.

O que este teorema nos diz é que para distribuições as quais os máximos em bloco normalizados convergem para uma GEV (na forma da equação (2)), então a distribuição dos excessos acima de um limiar destas mesmas distribuições convergem para uma GPD, dado um valor de limiar u adequado. Podemos fazer então a seguinte suposição:

Suposição 1: Seja F a distribuição de perdas com limite direito $x_F$, assuma que para um valor limiar alto o suficiente u nós temos que $F_u (x)=G_{\xi,\beta} (x)$, onde $F_u (x)$ denota a distribuição dos excessos de x em relação ao valor de limiar u, para $0 \leq x < x_F-u$, $\xi \in \mathbb{R}$ e $\beta > 0$.

Esta é uma suposição, uma vez que a distribuição dos excessos não segue exatamente uma GPD, mas apenas tende a esta distribuição dado um limiar u alto e uma amostra de dados grande o suficiente.

Dada a parametrização de uma GPD, é interessante sabermos o valor esperado desta distribuição, uma vez que esta medida de valor central nos fornece importante informação sobre a quantidade de risco que estamos buscando medir, assim como a informação de que a própria distribuição foi ajustada aos dados de forma satisfatória, como será demonstrado adiante.

O valor esperado de uma variável aleatória não negativa pode ser computado através da integral de sua cauda, $P(X>x) = 1-P(X \leq x)$. A cauda da GPD é, para $\xi \neq 0$, $\left(1+\xi x / \beta(u) \right)^{-1/ \xi}$

Bastando, portanto, integrar em relação a $x$ sobre o domínio deste, que é de $0$ a $\infty$.

\[\begin{equation*}
\displaystyle\int\limits_{0}^{\infty} \left(1+ \xi x /\beta(u) \right)^{-1/\xi} dx
\end{equation*}\]

Desta forma, o valor esperado de uma GPD $G_{\xi,\beta(u)} (X)$, ou seja, sua média, converge para valores de $\xi<1$ e é dado pela seguinte equação:

\[\begin{equation}
E\left[G_{\xi,\beta(u)} (X) \right]=\frac{\beta(u)}{1-\xi}
\tag{5}
\end{equation}\]

Definição 5 (Função média dos excessos) A função média dos execessos de uma variável aleatória X com média finita é dada por:

\[\begin{equation}
e(u)=E\left(X-u | X > u\right)
\tag{6}
\end{equation}\]

Ou seja, a equação (6) representa o valor esperado da função de distribuição dos excessos dada pela Definição 3. Ela representa a média de $F_u$ como uma função do limiar u. Esta função por vezes também é conhecida como função média de vida residual (mean residual life function), sendo encontrada esta denominação em alguns pacotes de software estatísticos.

Para uma variável distribuída na forma de uma GPD, o parâmetro de escala é uma função linear em u dado por $\beta(u)=\beta + \xi u$, Teorema 3.4.13(e) em Embrechts, Klüppelberg, and Mikosch (1997). Utilizando-se deste fato e da equação (5) chegamos ao cálculo da função média dos excessos para uma GPD, dada por:

\[\begin{equation}
e(u)=\frac{\beta+\xi u}{1-\xi}
\tag{7}
\end{equation}\]

onde $0 \leq u < \infty$ se $0 \leq \xi <1$ e $0 \leq u \leq -\beta / \xi$ se $\xi < 0$. É possível observar que de fato a função média dos excessos em uma GPD é linear em u. Esta é uma característica importante de uma GPD e que nos auxilia a escolher um valor adequado do limiar u de tal forma que a Suposição feita anteriormente faça sentido.

Assim, quando estamos analisando uma determinada distribuição de perdas F e desejamos ajustar a cauda desta distribuição, ou seja, as perdas acima de um dado valor limiar u a uma GPD $G_{\xi, \beta}(x)$ precisamos primeiramente determinar um valor adequado de u de modo que a suposição $F_u(x)\rightarrow G_{\xi, \beta}(x)$ seja válida. Um método frequentemente utilizado é o gráfico da função média dos excessos com relação a u. Analisando este gráfico, escolhemos o menor valor de u para o qual a partir deste ponto a relação $e(u) \text{ vs } u$ torna-se linear.

Desejamos o menor valor de u para o qual a relação é linear pois, mesmo o método POT implica em grande perda de dados da série temporal, já que apenas os valores acima deste limiar são utilizados para fazer a estimação dos parâmetros $\xi$ e $\beta$ da GPD. Portanto, existe um trade-off na escolha do valor limiar u, escolhendo um valor muito baixo termos uma boa quantidade de dados para estimar os parâmetros da GPD, mas a própria distribuição resultante não será GPD, uma vez que não estaremos trabalhando na região onde a relação $e(u) \text{ vs } u$ é linear. Por outro lado, um valor limiar muito alto nos impõe o custo de trabalhar com poucos dados para fazer a estimação dos parâmetros da distribuição e por conseguinte, os erros padrões dessas estimativas serão elevados.

Lema 1 Sob a Suposição 1 segue que $F_v (x)=G_{\xi,\beta+\xi(v-u)} (x)$ para qualquer valor limiar $v \geq u$.

Logo, a distribuição dos excessos sobre limiares mais altos que u, também segue uma GPD com o mesmo parâmetro de forma $\xi$ e parâmetro de escala que cresce linearmente com este limiar mais alto v. Se $\xi < 1$, a média desta nova GPD converge e é dada por:

\[\begin{equation}
e(v)=\frac{\beta+\xi(v-u)}{1-\xi}=\frac{\xi v}{1- \xi}+ \frac{\beta-\xi u}{1-\xi}
\tag{8}
\end{equation}\]

Esta é a função média dos excessos sobre limiares mais altos, e está definida para $u \leq v < \infty$ se $0 \leq \xi < 1$ e, $u \leq v \leq u-\beta / \xi$ se $\xi < 0$.

Esta função é muito útil para calcularmos o $ES_\alpha$ (expected shortfall), considerando que $VaR_\alpha$ nada mais é que um quantil superior ao limiar $u$ escolhido.

Modelando caudas e medidas de risco associadas

Através da modelagem da cauda da distribuição F de perdas por uma GPD, como feito na seção anterior, é possível calcularmos as medidas de riscos $VaR_\alpha \text{ e } ES_\alpha$ para esta distribuição de perdas em função dos parâmetros da GPD estimada e também fazendo uso da distribuição empírica de F.

Sob a Suposição 1 nós temos que a cauda da distribuição F, $\bar{F}(x)$, para $x \geq u$ é dada por:

\[\begin{align}
\bar{F}(x) & = P(X>u)P(X>x|X>u) \nonumber \\
& = \bar{F}(u) P(X-u>x-u|X>u) \nonumber \\
& = \bar{F}(u)\bar{F}_u(x-u) \nonumber \\
& = \bar{F}(u)\left(1+\xi \frac{x-u}{\beta}\right)^{-1/\xi}
\tag{9}
\end{align}\]

Da qual se soubéssemos exatamente a distribuição F teríamos um modelo analítico para as probabilidades de perdas na cauda da distribuição. Aqui $x$ são os valores a serem observados das perdas, e portanto $x-u$ são as perdas em excesso ao limiar.

O que fizemos através da equação (9) foi efetivamente separar a distribuição F, ou melhor, sua cauda, em duas partes. A primeira parte, para valores menores que u, não foi modelado analiticamente e portanto utilizamos a distribuição empírica das perdas, aqui representada por sua cauda $\bar{F}(u)$, que nada mais é que o número observado de excessos de u sobre o número total de observações da amostra.

A segunda parte é justamente a modelagem através de uma GPD com parâmetros $\xi \text{ e } \beta$ dado o limiar u. Por esta modelagem paramétrica podemos conhecer as probabilidades de cauda para valores de x maiores que u.

O quantil $\alpha$ é a inversa da função distribuição e nos retorna o valor para o qual um percentual $\alpha$ de observações da amostra é menor ou igual. Assim sendo, $VaR_\alpha$ nada mais é que um quantil alto para o qual determinamos que $\alpha \%$ das perdas devem ser menores ou iguais a este valor.

Como a equação (9) fornece a probabilidade de cauda, então esta é igual a $1- \alpha$ para um valor de $\alpha \geq F(u)$. Fazendo $\bar{F}(x)=1-\alpha$ na equação (9) o valor de x representará $VaR_\alpha$ e nos basta manipular esta equação até isolarmos $VaR_\alpha$ como função de $\bar{F}(u), \alpha \text{ e dos parâmetros da GPD } \xi \text{ e } \beta$. Que nos garante a equação abaixo:

\[\begin{equation}
VaR_\alpha = q_\alpha(F) = u+\frac{\beta}{\xi}\left[ \left( \frac{1-\alpha}{\bar{F}(u)}\right)^{-\xi}-1 \right]
\tag{10}
\end{equation}\]

A medida $ES_\alpha$ pode ser entendida como a média das perdas que excedem o valor dado por $VaR_\alpha$. Como o próprio $VaR_\alpha$ é um quantil acima do valor de limiar u, $ES_\alpha$ é dado pelo valor do $VaR_\alpha$ somado a função média dos excessos dada pela equação (8) fazendo $v = VaR_\alpha$. Esta média é convergente para valores de $\xi < 1$ conforme já demonstrado. Ou seja, $ES_\alpha=VaR_\alpha + e(VaR_\alpha)$. A qual nos rende de forma mais geral:

\[\begin{equation}
ES_\alpha = \frac{VaR_\alpha}{1-\xi}+\frac{\beta-\xi u}{1-\xi}
\tag{11}
\end{equation}\]

Portanto, ambas medidas de risco $VaR_\alpha$ e $ES_\alpha$, para distribuições de perdas que tiveram suas caudas modeladas através de uma GPD da forma $G_{\xi, \beta(u)}$ com $\xi <1 \text{ e } \beta > 0$, podem ser calculadas respectivamente através das equações dadas em (10) e (11). As estimativas destas medidas de risco serão encontradas através das estimativas dos parâmetros da GPD, assim como do limiar utilizado e de uma medida empírica de $\bar{F}(u)$ que será o número de excessos verificados sobre o total de amostras. É claro que, ao adotarmos esta estimativa para $\bar{F}(u)$ estamos implicitamente supondo que o número de amostras na série de perdas é significativa, assim como o número de excessos verificados. Daí a importância de se utilizar um valor u adequado, conforme explicitado na seção anterior.

As estimativas de medidas de risco desenvolvidas nesta seção se qualificam como medidas incondicionais, no sentido que elas não dependem do estado atual das coisas, mas sim de todo o histórico de eventos de forma uniforme. Em outras palavras, $VaR_\alpha \text{ e } ES_\alpha$ derivados a partir das equações (10) e (11) são medidas históricas de risco associado ao ativo em análise e não levam em consideração se nos eventos mais recentes a volatilidade das perdas pode ser diferente do valor histórico.

De fato, uma das características marcantes das perdas (ou retornos, como o leitor preferir) dos ativos financeiros é o chamado clustering de volatilidade, onde grandes volatilidades (retornos positivos ou negativos) têm tendência a ficarem próximas ao longo da linha temporal. Em geral estas aglomerações de volatilidades surgem a partir da autocorrelação destas, ou seja, a volatilidade em um período t é dependente das volatilidades verificadas em períodos anteriores. Um modelo bastante encontrado na literatura que busca modelar estas dependências é o modelo GARCH e suas variantes.

Assim, ao passo que as estimativas de risco desenvolvidas nesta seção são valiosas para prazos mais longos, ainda é necessário desenvolver um modelo que lide com o fato das autocorrelações de volatilidades e portanto, que nossa variável aleatória não é independente e igualmente distribuída ao longo do tempo. O modelo proposto por McNeil and Frey (2000) pode ser utilizado para encontrar as medidas de risco $VaR_\alpha$ e $ES_\alpha$ condicionais que desejamos, ainda dentro da metodologia de peaks over treshold.

Medidas condicionais de risco

Ativos financeiros possuem características de autocorrelação, senão em seus retornos propriamente ditos, ao menos em suas volatilidades ou variações absolutas. Ou seja, dada uma grande variação no momento t é de se esperar novamente uma grande variação, não necessariamente na mesma direção daquela anterior, para o momento t+1 e posteriores. Desta forma, medidas de risco incondicionais, conforme aquelas derivadas na seção de medidas de risco podem ser adequadas somente para horizontes temporais mais longos, pois implicitamente tomam em consideração os fatos mais recentes com o mesmo valor de predição que fatos mais longínquos.

Também já foi bastante estudado e mostrado no artigo anterior que modelos que levem em conta riscos condicionais ao incorporarem as autocorrelações nas volatilidades, levam a resultados de testes melhores. Assim, nesta seção trabalharemos com o modelo proposto por McNeil and Frey (2000) os quais fazem uma adequação dos retornos dos ativos a um modelo GARCH e posteriormente tratam os erros desta modelagem como iid e portanto, a metodologia de POT e ajuste de uma GPD pode ser feito. Este modelo pode ser entendido como um modelo condicional para medidas de risco pois, efetivamente, é levado em conta o estado atual da previsão para a média e principalmente para a volatilidade ao se calcular o VaR. Desta forma a medida responde rapidamente às variações nos humores do mercado e pode sinalizar de forma ágil uma inadequação de capital reservado pela instituição financeira.

Além desta vantagem de cunho prático, a técnica possui uma atratividade teórica. O método POT deve ser aplicado a séries iid que sabidamente não é o caso de perdas de ativos financeiros. Ao se utilizar a técnica POT nos resíduos padronizados de um modelo GARCH o que se está realizando é uma pré-filtragem destas perdas, de forma a obter resíduos padronizados que sejam iid e portanto, aplicável a teoria de valor extremo.

Primeiramente vamos estabelecer um modelo GARCH para as perdas do ativo subjacente. Se denotarmos $L_t$ como sendo a perda observada no período t, $\mu_t$ e $\sigma_t$ são respectivamente a média e o desvio padrão condicionais e mensuráveis através do conjunto de informações disponíveis em t-1 e seja $Z_t$ inovações iid com média zero e desvio padrão unitário, então temos que:

\[\begin{equation}
L_t=\mu_t+\sigma_t Z_t
\tag{12}
\end{equation}\]

Seja $F_L(l)$ a distribuição marginal de $L_t$, então $F_{L_{t+1}} | \mathcal{G}_t(l)$ é a distribuição preditiva da perda para o próximo período, onde $\mathcal{G}_t$ é o conjunto de informações disponíveis no período t, incluindo-o. Portanto, para o cálculo das medidas condicionais de risco estamos interessados em um quantil $\alpha$ na cauda de $F_{L_{t+1} | \mathcal{G}_t}(l)$. Este quantil $\alpha$, que será o nosso $VaR_\alpha$, é o ínfimo l tal que o valor da distribuição preditiva seja maior ou igual a $\alpha$. Ao passo que o valor condicional do ES será o valor esperado das perdas previstas que sejam maiores que VaR para o mesmo intervalo de confiança. Ou seja:

\[\begin{align}
VaR_\alpha^t=&\inf\{l \in \mathbb{R}: F_{L_{t+1} | \mathcal{G}_t}(l) \geq \alpha\}, \\
ES_\alpha^t=&E[L_{t+1} | L_{t+1} > VaR_\alpha^t]
\end{align}\]

Considerando que nossa distribuição de perdas é dada pela equação (12) e sabendo das propriedades de variáveis aleatórias e do operador de expectância, as equações dadas acima subsumem a:

\[\begin{align}
VaR_\alpha^t=&\mu_{t+1}+\sigma_{t+1}z_\alpha, \tag{13} \\
ES_\alpha^t=&\mu_{t+1}+\sigma_{t+1}E[Z | Z>z_\alpha] \tag{14}
\end{align}\]

onde $z_\alpha$ é o quantil $\alpha$ das inovações Z.

Agora nos falta escolher um processo que modele nossa série temporal dada em (12), ou seja, precisamos especificar o comportamento de $\mu_t$ e $\sigma_t$. Por suposição do modelo, especificamos que o comportamento destas variáveis é dependente de acontecimentos passados, contidos no conjunto de informações $\mathcal{G}_{t-1}$ . Dentre os diversos modelos já propostos para estimar médias e volatilidades condicionais, está o simples porém efetivo modelo GARCH(1,1) para a volatilidade condicional e o modelo AR(1) para a média condicional. Uma extensão destes modelos básicos para outros mais complexos pode ser facilmente obtida e é vasta na literatura, como exemplo modelos GARCH-M, Treshold GARCH, EGARCH, etc. para volatilidades condicionais e um modelo do tipo ARMA para a média.

Como critérios para a escolha deste modelo de filtro no primeiro estágio, deseja-se que as inovações $Z_t$, através de suas realizações na forma dos resíduos padronizados estimados no modelo possuam 2 características, ausência de autocorrelação serial em seus valores e nos seus quadrados.

Neste artigo, visando aplicar a teoria do valor extremo para o cálculo das medidas condicionais de risco, não faremos maiores assunções acerca da distribuição das inovações, como por exemplo assumir uma determinada distribuição (e.g. Normal ou t de Student), mas está implícito que esta pertence ao MDA de uma GEV e portanto a distribuição de seus excessos sobre um limiar segue aproximadamente uma GPD.

Dadas estas considerações, o modelo adotado segue um formato em dois estágios para ser implementado, como segue.

Referências

Balkema, A A, and L de Haan. 1974. “Residual Life Time at Great Age.” The Annals of Probability 2 (5): 792–804. doi:10.1214/aop/1176996548.

Embrechts, P, C Klüppelberg, and T Mikosch. 1997. Modelling Extremal Events for Insurance and Finance. Springer.

Fisher, R A, and L H C Tippett. 1928. “Limiting forms of the frequency distribution of the largest or smallest member of a sample.” Proceedings of the Cambridge Philosophical Society 24: 180–90.

Gnedenko, B V. 1941. “Limit theorems for the maximal term of a variational series.” Comptes Rendus (Doklady) de L’Académie Des Sciences de L’URSS 32: 7–9.

———. 1943. “Sur la distribution limite du terme maximum d’une série aléatoire.” Annals of Mathematics 44: 423–53.

Pickands, James. 1975. “Statistical Inference Using Extreme Order Statistics.” Annals of Statistics 3: 119–31. doi:10.1214/aos/1176343003.

Distribuição degenerada é aquela cuja densidade de probabilidade está totalmente concentrada em apenas um ponto de seu domínio.↩

Oct

2019

Risco de mercado, princípios de Basileia e a teoria do valor extremo

Neste artigo iniciaremos uma discussão sobre a utilização da teoria do valor extremo – EVT para o cálculo de risco de mercado de ativos financeiros. Desta forma, a EVT pode ser utilizada tanto para o cálculo de VaR quanto ES, recaindo sobre a categoria de modelo semi-paramétrico.

Este será o primeiro artigo de uma série de três. Nesta introdução a EVT, faremos uma vasta revisão da literatura aplicada a finanças. O segundo artigo apresentará ao leitor já familiarizado a modelagem matemática das medias de risco utilizando a EVT e por fim, o último artigo apresentará um estudo de caso, comparando diversos modelos para o cálculo do VaR e inferindo qual modelo é mais adequado com base em critérios bem definidos na literatura. Os artigos foram adaptados de um trabalho de iniciação científica do autor e, portanto, apresentam um caráter mais acadêmico que o normalmente encontrado nos artigos do Clube de Finanças. Ainda assim, o assunto é relevante e atual dentro do gerenciamento de risco das instituições financeiras e desta forma acreditamos que nossos leitores se beneficiarão desta série.

Introdução

A medição do risco de mercado ao qual os portfólios dos investidores está sujeito é objeto de devoção de esforços tanto por parte das instituições e investidores em geral como por parte dos reguladores. Instituições financeiras – IF em todo o mundo, de acordo com suas regulações locais e com os princípios de Basileia ( Basel Comittee on Banking Supervision – BCBS do Banco de Compensações Internacionais – BIS) são obrigadas a reservar uma parcela de seu capital como provisionamento contra flutuações adversas do mercado, como forma de mitigar seu risco de insolvência.

Estas instituições devem manter seu risco de insolvência controlado, e a percepção externa deve ser tal que não haja desconfiança do público com sua habilidade em controlar este risco. Se a confiança na instituição se esvai e a percepção de risco é elevada, rapidamente uma crise de liquidez pode surgir, com depositantes sacando seus recursos ao mesmo tempo em que outras fontes de funding também se tornam escassas. Em tal situação, é natural o banco ou IF, ir ao mercado para vender seus ativos e levantar os recursos necessários. Neste momento uma crise de liquidez no mercado pode levar a uma possível insolvência da IF pois, não há garantias que no mercado aberto, os ativos do banco serão justamente avaliados e arrematados.

Uma importante característica das séries de retornos financeiros é sua alta volatilidade, não constante e tampouco seguindo uma distribuição Normal. Assim, eventos extremos, e neste caso estamos interessados em perdas de grande magnitude, acontecem com uma frequência alta demais para serem descartadas como apenas outliers, e portanto passaram a atrair a atenção dos participantes do mercado, entre eles os investidores e reguladores. Estas observações induziram uma gama de estudos, empíricos e teóricos, voltados a explicar o comportamento dos retornos de séries financeiras e modelar de forma adequada as caudas da distribuição destes retornos. Não somente estes estudos são de grande relevância para o gerenciamento de risco nas instituições financeiras, como também são obrigatórios segundo o acordo de Basileia, uma vez que este requer o cálculo do Valor em Risco – VaR, para então a instituição poder projetar o seu nível requerido de capital.

De acordo com os princípios de Basileia III, BCBS (2011), BCBS (2013 a), BCBS (2014), as instituições financeiras supervisionadas pelos Bancos Centrais devem manter buffers de capital contra riscos de mercado, crédito, liquidez, entre outros. Dentro dos riscos de mercado, as duas formas mais usuais de fazer a quantificação destes são os métodos de Valor em Risco – VaR e o Expected Shortfall – ES. Este último relacionado ao primeiro, sendo definido como o valor esperado das perdas que excedem o VaR calculado para um determinado nível de confiança.

VaR é um quantil alto $\alpha$ da distribuição de perdas de um ativo ou portfólio em um determinado período de tempo, ao passo que ES é o valor esperado das perdas que excedem VaR, para um mesmo período e nível de confiança $\alpha$.

O método VaR para cálculo de risco de mercado ao qual um portfólio está sujeito foi primeiramente introduzido através de RiskMetrics (1995), uma metodologia adotada pelo banco J. P. Morgan. Vem desde então sendo amplamente adotado pela indústria financeira e largamente estudado pela academia. Inúmeras variantes do modelo foram propostas e continuam sendo utilizadas com o passar dos anos. Para o cálculo do VaR é necessária uma suposição acerca da distribuição dos retornos, e por conseguinte do comportamento da cauda desta.

As variações na metodologia original de estimação do VaR surgem principalmente em função de críticas a abordagem proposta, a qual inclui a suposição de retornos independentes e igualmente distribuídos, covariâncias constantes entre os ativos de um portfólio e a distribuição normal dos retornos.

Por meio de dois artigos Artzner et al. (1997) e Artzner et al. (1999), foi introduzido na literatura o conceito de medida coerente de risco. Para uma medida ser considerada coerente, primeiramente foram introduzidas quatro propriedades cunhadas através de axiomas, as quais estas medidas deveriam possuir, invariância translacional, sub-aditividade, homogeneidade positiva, e monotonicidade.

VaR especificamente não possui a propriedade da sub-aditividade para alguns casos, sendo esta uma das grandes críticas ao VaR. Desta forma, em casos específicos, é possível uma carteira diversificada em que sejam computados o VaR de cada um de seus ativos, ser agregada e possuir um VaR do portfólio maior que o maior VaR de seus componentes, algo que não condiz com uma medida coerente de risco. Para contornar este fato, Acerbi and Tasche (2002) propuseram o Expected Shortfall e comprovam que este é uma medida coerente de risco. Além de ser coerente, o ES possui uma segunda vantagem com relação ao VaR, considerando que o ES nos informa uma medida de tendência central do tamanho das perdas que excedem o valor do quantil VaR. Ou seja, o VaR nos informa apenas que uma proporção $\alpha$ das perdas serão menores que a medida, mas nada nos informa se esta perda extraordinária de fato ocorrer. Mesmo sendo criticado como uma medida não coerente de risco, o VaR continua a ser amplamente utilizado, mesmo que agora em conjunto com o ES.

Mais recentemente o Comitê de Supervisão Bancária de Basileia tem se proposto a adotar o Expected Shortfall como medida de risco de mercado. BCBS (2013 b). O Comitê cita a grande importância da escolha da medida de risco e sua calibração, e portanto estas são relevantes para as decisões de política do Banco. Entre as dificuldades encontradas pelo VaR estão mais notadamente sua inabilidade em estimar o “risco de cauda” da distribuição de perdas, uma vez que VaR não leva em conta a distribuição das perdas acima do valor de corte.

Desta forma, foi decidido que o ES seria a medida de risco favorita para a abordagem pelo banco chamada de modelos internos. Ou seja, os bancos supervisionados devem utilizar o ES para o cálculo do risco de mercado a que estão sujeitos em seus modelos internos. O comitê também se decidiu por um nível de confiança de 97,5% para o ES, em contraposição a 99% para o VaR. O comitê espera que esta abordagem para o cálculo da medida de risco de mercado trará benefícios se comparada a antiga abordagem pelo Var, entre elas um modelo com resultados mais estáveis e menor sensibilidade a observações extremas (outliers).

Revisão de Literatura

Teoria do valor extremo, é um ramo da estatística que lida diretamente com eventos raros, extremos. Seu objetivo é modelar o comportamento assintótico de eventos que se distanciam muito da mediana de uma distribuição. Justamente por esta característica, a EVT está sendo utilizada para modelar riscos que possuem distribuição com caudas longas, um dos fatos estilizados bem conhecidos sobre retornos de ativos financeiros.

Ao utilizar a EVT, e mais especificamente o método conhecido como peaks over treshold – POT, se está interessado em modelar apenas a parte da cauda da distribuição das perdas de um ativo financeiro maiores que um determinado valor de limiar u. É da modelagem desta cauda, portanto, que se calcula a estimativa de VaR.

A teoria do valor extremo vem sendo utilizada nas finanças a algum tempo. Devido as características das séries financeiras, por exemplo a leptocurtose, a distribuição normal para os retornos vem sendo rechaçada, enquanto outras distribuições mais adequadas assumem o posto para descrever o comportamento das perdas e retornos de séries financeiras. A EVT, ao modelar distribuições com caudas longas, pode ser utilizada para esta finalidade. A introdução da EVT em dois estágios para a estimação de medidas condicionais de risco pode ser atribuída a McNeil and Frey (2000). Neste artigo os autores propuseram um modelo para a estimação do VaR e ES de forma condicional, tanto para período de um dia como para dez dias a frente, de acordo com o normativo de Basileia vigente a época. Seu modelo, que leva em conta as longas caudas e a natureza estocástica da volatilidade, se ajustam de forma mais fidedigna aos dados. Daníelsson and Morimoto (2000) fizeram uma crítica aos modelos condicionais de cálculo do VaR para o mercado japonês e chegaram a conclusão que um modelo EVT incondicional, inclusive sem o estágio de filtragem inicial, era mais adequado para fins práticos.

Byström (2004) encontrou que ambas abordagens da EVT, máximos em bloco como POT, combinadas com análise de séries temporais tradicional (ARIMA e GARCH), no que se configura uma abordagem condicional para a estimação do VaR, têm os melhores resultados tanto em períodos ditos tranquilos como em épocas de alta volatilidade. Voltando a aplicação da EVT para mercados emergentes, Gencay and Selcuk (2004) utilizaram a teoria de valor extremo para o cálculo de VaR e teste de estresse. Seus resultados apontam que a EVT se torna melhor a medida que o quantil utilizado para o cálculo se eleva. Além disso, encontraram que as caudas da distribuição de retornos se comportam de maneira diferente entre ganhos e perdas. Uma comparação entre diversos modelos de previsão de VaR foi realizada por Kuester, Mittnik, and Paolella (2006). Encontraram que a grande maioria dos modelos subestima o risco, mesmo sendo aceitáveis do ponto de vista regulatório, sendo que o modelo condicional GARCH-EVT está entre as melhores estimações.

Karmakar and Shukla (2014) retomam o modelo em dois estágios e fizeram uma comparação entre o modelo EVT condicional e outros modelos já consagrados no cálculo de VaR em 3 mercados desenvolvidos (EUA, Reino Unido e Japão) e 3 mercados emergentes asiáticos (Índia, Hong Kong e Corea do Sul). O modelo GARCH adotado no primeiro estágio é diferente para cada mercado, porém com uma particularidade comum, todos são modelos assimétricos. Novamente encontram que o modelo EVT condicional é superior aos demais através de testes de cobertura incondicional e condicional.

Chavez-Demoulin, Davison, and McNeil (2005) e Herrera and Schipp (2013) tomam um caminho diferente para modelar a EVT. Enquanto o primeiro adota o método de processos pontuais de auto-excitação¹, que dadas algumas condições, converge para o método POT, o segundo modela explicitamente as durações de tempo entre as observações de extremos, ou seja, as perdas em excesso ao limiar escolhido. A magnitude destas perdas continua a ser modelada através da distribuição generalizada de Pareto – GPD. Seu modelo é então chamado de autoregressive conditional duration peaks over threshold model – ACD-POT.

Rocco (2014) fez uma grande revisão sobre o uso da EVT em finanças. As principais aplicações encontradas foram o teste de suposições para diferentes distribuições dos dados, cálculo de medidas de risco como o VaR e ES, alocação de ativos sob restrições e otimização de portfólios, e no estudo de contágio e dependência entre mercados sob condições de alto estresse.

Mais recentemente a EVT encontrou outras formas de aplicação e cálculo. Chavez-Demoulin, Embrechts, and Hofert (2016) sugeriram um modelo onde a frequência e a severidade das perdas podem ser modeladas através da EVT com covariantes. Karmakar and Paul (2016) por sua vez, fizeram uma aplicação do modelo EVT condicional a retornos intra-diários de dezesseis mercados diferentes.

O cálculo de VaR em instituições financeiras e bancos comerciais vem sendo implementado e é requerimento do comitê de Basileia. A EVT entra como uma das metodologias utilizadas neste cálculo, Longin (2000) a utilizou e propôs um modelo para agregar o risco de uma posição de mercado, em contraste a modelos univariados apenas. Testes de estresse podem ser realizados através de sua técnica. Utilizando-se de dados reais de seis grandes bancos comerciais americanos, Berkowitz and O’Brien (2002) analisou a precisão de seus modelos VaR. Ele encontrou que os bancos são amplamente conservadores em suas estimativas de VaR, com níveis de cobertura muito acima dos valores nominais. Wong, Cheng, and Wong (2003) promoveu um estudo sobre as implicações da precisão do modelo VaR no gerenciamento do risco de mercado em bancos. Ele adotou os critérios de Basileia para realizar um estudo de backtest e verificou que modelos baseados em previsões de volatilidade através de GARCH não estão de acordo com estes critérios por muitas vezes. Já em um estudo recente, O’Brien and Szerszeń (2017) fez uma avaliação dos modelos de risco de mercado de bancos no pré, durante e pós crise financeira de 2008. Encontrou que tanto no pré quanto no pós crise, os bancos se comportaram de maneira excessivamente conservadora, entretanto, durante a crise financeira as violações ao VaR excederam muito seu valor esperado assim como aconteceram de forma agrupada, um sinal de má especificação nos modelos adotados. O autor comparou estes resultados com um modelo baseado em GARCH e verificou que esta alternativa é muito superior aos atuais modelos.

Conclusão

A avaliação da probabilidade de eventos raros e extremos é uma questão importante no gerenciamento de riscos das carteiras financeiras. A teoria dos valores extremos fornece os fundamentos sólidos necessários para a modelagem estatística de tais eventos e o cálculo de medidas de risco extremo. Não somente a teoria é adequada para este tipo de modelagem, como também é requerido das instituições financeiras que façam suas estimativas de risco de cauda de maneira conservadora mas realista com as atuais condições de mercado. Seja qual for a medida de risco de mercado desejada, VaR ou ES, a EVT através do método POT vem sendo utilizada com excelentes resultados e tem se tornado a prática de mercado.

Em um próximo artigo faremos uso da EVT e outras técnicas de modelagem de VaR para avaliar, através de testes estatísticos, a capacidade preditiva de sete modelos distintos de cálculo da métrica de valor em risco comumente encontrados na literatura, por meio da técnica de backtesting. Os testes aplicados abrangem características importantes do VaR como cobertura incondicional, independência entre violações e superioridade do modelo dada uma função de perda adequada.

Referências

Acerbi, Carlo, and Dirk Tasche. 2002. “On the coherence of expected shortfall.” Journal of Banking & Finance 26 (7). Elsevier: 1487–1503.

Artzner, Philippe, Freddy Delbaen, Jean-Marc Eber, and David Heath. 1997. “Thinking Coherently.” RISK 10 (11): 68–71.

———. 1999. “Coherent Measures of Risk.” Mathematical Finance 9 (3): 203–28. doi:10.1111/1467-9965.00068.

BCBS. 2011. “Basel III: A global regulatory framework for more resilient banks and banking systems.” Revised ve. Bank for International Settlements -Basel Committee on Banking Supervision. http://www.bis.org/publ/bcbs189.pdf.

———. 2013a. “Basel III: The liquidity coverage ratio and liquidity risk monitoring tools.” Bank for International Settlements – Basel Committee on Banking Supervision. http://www.bis.org/publ/bcbs238.pdf.

———. 2013b. “Fundamental review of the trading book: A revised market risk framework.” Bank for International Settlements – Basel Committee on Banking Supervision. http://www.bis.org/publ/bcbs265.pdf.

———. 2014. “Basel III: The net stable funding ratio.” Bank for International Settlements – Basel Committee on Banking Supervision. http://www.bis.org/bcbs/publ/d295.pdf.

Berkowitz, Jeremy, and James O’Brien. 2002. “How Accurate Are Value-at-Risk Models at Commercial Banks?” The Journal of Finance 57 (3). Blackwell Publishers, Inc.: 1093–1111. doi:10.1111/1540-6261.00455.

Byström, Hans NE. 2004. “Managing Extreme Risks in Tranquil and Volatile Markets Using Conditional Extreme Value Theory.” International Review of Financial Analysis 13 (2). Elsevier: 133–52.

Chavez-Demoulin, V, A C Davison, and A J McNeil. 2005. “Estimating value-at-risk: a point process approach.” Quantitative Finance 5 (2): 227–34. doi:10.1080/14697680500039613.

Chavez-Demoulin, Valérie, Paul Embrechts, and Marius Hofert. 2016. “An Extreme Value Approach for Modeling Operational Risk Losses Depending on Covariates.” Journal of Risk and Insurance 83 (3): 735–76. doi:10.1111/jori.12059.

Daníelsson, Jón, and Yuji Morimoto. 2000. “Forecasting Extreme Financial Risk: A Critical Analysis of Practical Methods for the Japanese Market.” Monetary and Economic Studies 2 (18). Institute for Monetary; Economic Studies, Bank of Japan: 25–48.

Gencay, Ramazan, and Faruk Selcuk. 2004. “Extreme Value Theory and Value-at-Risk: Relative Performance in Emerging Markets.” International Journal of Forecasting 20 (2). Elsevier: 287–303.

Hawkes, Alan G. 1971. “Spectra of Some Self-Exciting and Mutually Exciting Point Processes.” Biometrika 58 (1): 83–90. doi:10.2307/2334319.

Herrera, Rodrigo, and Bernhard Schipp. 2013. “Value at risk forecasts by extreme value models in a conditional duration framework.” Journal of Empirical Finance 23: 33–47. doi:10.1016/j.jempfin.2013.05.002.

Karmakar, Madhusudan, and Samit Paul. 2016. “Intraday Risk Management in International Stock Markets: A Conditional Evt Approach.” International Review of Financial Analysis 44. Elsevier: 34–55.

Karmakar, Madhusudan, and Girja K. Shukla. 2014. “Managing Extreme Risk in Some Major Stock Markets: An Extreme Value Approach.” International Review of Economics and Finance. doi:https://doi.org/10.1016/j.iref.2014.09.001.

Kuester, Keith, Stefan Mittnik, and Marc S. Paolella. 2006. “Value-at-Risk Prediction: A Comparison of Alternative Strategies.” Journal of Financial Econometrics 4 (1): 53–89. doi:10.1093/jjfinec/nbj002.

Longin, François M. 2000. “From Value at Risk to Stress Testing: The Extreme Value Approach.” Journal of Banking & Finance 24 (7): 1097–1130. doi:https://doi.org/10.1016/S0378-4266(99)00077-1.

O’Brien, James, and Paweł J. Szerszeń. 2017. “An Evaluation of Bank Measures for Market Risk Before, During and After the Financial Crisis.” Journal of Banking & Finance 80 (Supplement C): 215–34. doi:https://doi.org/10.1016/j.jbankfin.2017.03.002.

RiskMetrics. 1995. “Technical Document – 3rd Edition.” J.P Morgan Guaranty Trust Company.

Rocco, Marco. 2014. “Extreme Value Theory in Finance: a survey.” Journal of Economic Surveys 28 (1). Wiley Online Library: 82–108. doi:10.1111/j.1467-6419.2012.00744.x.

Wong, Michael Chak Sham, Wai Yan Cheng, and Clement Yuk Pang Wong. 2003. “Market Risk Management of Banks: Implications from the Accuracy of Value-at-Risk Forecasts.” Journal of Forecasting 22 (1). Wiley Online Library: 23–33.

Para maiores detalhes sobre processos pontuais de auto-excitação, Hawkes (1971) é a referência original.↩

EVT

Valor em Risco de Índices Setoriais na Bovespa

Filtro GARCH

Método POT

Avaliação dos modelos

Testes estatísticos

Conclusão

Medidas de Risco com a Teoria do Valor Extremo

Distribuição de valores extremos generalizada

Excessos acima de um limiar

Modelando caudas e medidas de risco associadas

Medidas condicionais de risco

Referências

Risco de mercado, princípios de Basileia e a teoria do valor extremo

Introdução

Revisão de Literatura

Conclusão

Referências

Blogpost

Archives