extrapolação

Feb

2019

Métodos de calibração de superfícies de volatilidade

2019/02/08

Métodos de calibração são as diferentes formas existentes entre “interpolação”, “suavização” e “parametrização” que podem ser utilizadas para fazer o ajustes dos dados obtidos do mercado de opções às superfícies de volatilidade.

Como já apresentado em artigos anteriores, existem diversas formas de interpolar, extrapolar, parametrizar e calibrar smiles de volatilidade. Existem vantagens e desvantagens para cada método.

Calibração versus Interpolação

Uma forma simples de gerar um smile de volatilidade a partir de dados observados no mercado é a interpolação destes dados. Diversas formas de interpolação existem, sendo talvez a mais conhecida a spline cúbica. Não é a proposta deste artigo detalhar os procedimentos de interpolação, restando saber que em tal procedimento é gerada uma função contínua em partes (piecewise) que passa por todos os pontos observados.

Uma interpolação força a passagem da função interpolada em todos os seus pontos de referência, como se estivesse ligando estes pontos em um desenho a mão livre. Portanto, nestes pontos o erro da interpolação é zero por definição, entretanto em pontos intermediários podem surgir erros, inclusive aqueles que possibilitam a existência de arbitragem entre strikes de um mesmo smile¹.

Em contraposição a métodos de interpolação, podem ser derivados métodos de suavização (smoothing) ou então a parametrização do smile de volatilidade. Seja suavização, ou parametrização, estes métodos não forçam a passagem da função que representa o smile pelos pontos de mercado, mas buscam minimizar alguma função perda dos desvios em relação a estes pontos ao mesmo tempo em que buscam “suavizar” o smile, para que este não apresente variações bruscas entre os strikes ou alterações de convexidade na curva de preços, que não são condizentes com a teoria de precificação de derivativos.

Um método paramétrico, como o SVI, Heston ou SABR, busca ajustar às volatilidades implícitas observadas através dos preços das opções sendo praticados no mercado a uma determinada função, que possui parâmetros em sua definição que por sua vez determinam a forma desta. Ao se ajustar os parâmetros, pode-se adequar a função para ficar “o mais próxima possível” dos dados observados, sem necessariamente, no entanto, passar por todos estes pontos.

A figura abaixo tenta mostrar as diferenças entre uma interpolação spline cúbica, uma suavização e uma parametrização SVI. Enquanto que a interpolação liga todos os pontos marcados, a suavização e a parametrização não necessariamente passam sobre estes mas fornecem uma curva mais “suave”, sem trocas de convexidade, o que geraria oportunidades de arbitragem e probabilidades negativas de ocorrência de determinados preços para o ativo subjacente, que ferem os princípios de precificação de opções. Os dados utilizados neste e nos próximos artigos sobre superfícies de volatilidade foram obtidos do site ivolatility.com na forma de amostra gratuita fornecida livremente. O ativo subjacente é o ETF IWM para a data de 21/09/2017.

Figura 1: Diferentes métodos de ajuste de dados a um smile.

Pode-se verificar como os métodos SVI e a suavização não passam sobre todos os pontos marcados, com a suavização tendo dificuldade com a curvatura nos valores mais altos de moneyness e a SVI possuindo uma inclinação mais branda na asa esquerda do smile.

Spline cúbica

Este método é possivelmente um dos mais flexíveis e conhecidos de interpolação de dados univariados existente, embora também exista sua versão bi-dimensional. Uma spline nada mais é que “uma curva definida matematicamente por dois ou mais pontos de controle”².

No caso da spline cúbica, esta é uma função polinomial de grau 3 definida em cada subintervalo demarcados pelos pontos de controle, no caso de interpolação são todos nós. Ou seja, considere um segmento entre dois pontos consecutivos \([c, d]\in S\) a spline é uma função cúbica com seus parâmetros calculados pelo algoritmo de ajuste. Para o próximo intervalo de pontos dentro do domínio da função, um novo polinômio de grau 3 é ajustado, sendo que nos pontos de nós uma restrição de igualdade entre as derivadas nos dois segmentos é aplicada para garantir a suavidade da função interpolada como um todo.

Assim, uma spline cúbica é uma função contínua, suave e diferenciável até a segunda ordem. Entretanto, suas derivadas, apesar de contínuas, podem não ser suaves, especialmente aquela de segunda ordem que pode apresentar pontos de “ruptura”. Esta característica de uma spline cúbica a torna pouco atrativa para a inferência de distribuições de probabilidade a partir de dados de volatilidade ou mesmo dos preços de opções.

Figura 2: Cada segmento de uma spline cúbica é um polinômio de grau 3 diferente.

Suavização

A técnica de suavização é muito semelhante a interpolação, inclusive o método spline também é aplicado, com algumas modificações de forma que nem todos os pontos fornecidos serão nós.

Na spline de suavização (ou aproximação), os pontos fornecidos são separados entre os nós, onde a função deve passar e pontos de controle, que são utilizados para controlar a curvatura da função nestes pontos.

Estas suavizações são principalmente utilizadas quando se possui muitas observações sujeitas a ruídos, de forma que uma interpolação entre todos os pontos seria tanto impraticável quanto sem sentido. O que se deseja, portanto, é uma função aproximada que melhor descreva o processo sob análise.

Um ponto em comum entre estas técnicas é o parâmetro de suavização, ausente, na interpolação, que controla a “suavidade” da função estimada.

Figura 3: Menor parâmetro de suavização gera granularidade na curva.

Parametrização

E por fim as técnicas de parametrização. Nesta categoria estão diversos conhecidos modelos de superfícies de volatilidade implícita, dentre eles os modelos de Heston (1993) e SVI de Gatheral (2004).

Em comum, estes modelos tentam parametrizar a superfície, e por conseguinte o smile de volatilidade, de acordo com alguma função, em geral não-linear, que possui características condizentes com a teoria de precificão de derivativos e também a observação empírica das superfícies.

Por exemplo, a parametrização raw da SVI possui a seguinte forma para a variância total³ :

\[ w(k) = a + b\left(\rho(k-m)+\sqrt{(k-m)^2 + \sigma^2}\right)\]

que fornece um espaço de cinco parâmetros \(\chi_B=\{a, b, \rho, m, \sigma\}\) que definem o smile e devem, portanto, serem calibrados a partir de dados observados no mercado.

O procedimento de calibração consiste em encontrar o conjunto de parâmetros que minimizam uma função perda entre a volatilidade prevista pelo modelo e os dados de mercado, enquanto satisfazem algumas restrições adicionais, como “ausência de arbitragem”, suavidade, etc. Trata-se, via de regra, de problemas de otimização não-linear com restrições de inequalidade também não-lineares.

Função perda

A função perda, ou função de calibração pode ser definida de diversas maneiras, de forma geral, para uma determinada maturidade, ela toma a forma:

\[L=\sum\limits_{i=1}^n\lambda_i||\hat w(k_i)-w_{imp}(k_i)||\] onde \(||\cdot||\) é alguma medida de norma, sendo a mais conhecida o quadrado das diferenças, dando origem a minimização do erro quadrático médio (MSE). Para o presente smile sendo calibrado existem \(n\) strikes (\(k_i\)) e suas volatilidades implícitas observadas são \(w_{imp}(k_i)\). A resposta do modelo para um determinado strike é \(\hat w(k_i)\) e \(\lambda_i\) são os pesos dados na função perda para cada um destes strikes.

Os pesos \(\lambda_i\) são utilizados para ponderar as observações das volatilidades mais importantes para o cálculo, onde se deseja que a curva ajustada possua um menor erro. Em geral, estes pesos são calculado como inversamente proporcionais:

ao quadrado dos spreads bid-ask, para dar mais importância às opções mais líquidas
ao quadrado da grega vega calculada a partir do modelo BSM

Otimizadores

Os otimizadores são os algoritmos pelos quais o problema de minimização posto é resolvido. Se a função perda é convexa, e ela deve ser construída de forma a ser, mesmo que não estritamente, então ela possui um ou mais pontos de mínimo onde o gradiente desta função é igual a zero. O que os otimizadores fazem é buscar o conjunto de parâmetros que minimizam a função perda e atendem as restrições impostas simultaneamente. Os otimizadores podem ser classificados em dois grandes grupos, globais e locais.

Algoritmos locais dependem de uma estimativa inicial dos parâmetros para começarem a busca pelo mínimo. Seguindo uma regra utilizando-se o gradiente da função ou alguma heurística, estes otimizadores caminham em direção ao ponto de mínimo mais próximo da estimativa inicial, daí o nome “local”. Como desvantagem destes otimizadores é a mais evidente é que se a função perda for altamente não-linear, com diversos pontos de mínimo local, este otimizador pode ficar preso em um destes pontos sem nunca, no entanto, encontrar o mínimo global. Eles são, portanto muito sensíveis à estimativa inicial dos parâmetros.

Por sua vez, otimizadores globais buscam mapear todo o espaço factível para os parâmetros e encontrar o ponto mínimo da função perda dentro deste espaço. Estes algoritmos não dependem de estimativas iniciais, uma vez que tentarão avaliar o espaço completo. São utilizados quando o problema de minimização é não-linear e possui múltiplos pontos de mínimo local. Estes algoritmos usam alguma forma de heurística para encontrar a região onde o mínimo global está localizado, mas são, em geral, ineficientes em apontar rapidamente onde este ponto de mínimo se encontra com precisão. Por esta razão, é frequente a utilização de otimizadores globais com um posterior refinamento de sua solução por algum algoritmo local.

Abaixo apresentamos alguns exemplos mais comuns de otimizadores, tanto locais quanto globais:

Gauss-Newton: Este método é utilizado para encontrar as raízes de alguma função. Para encontrar o ponto de mínimo da função perda, precisa-se encontrar as raízes do gradiente desta função, portanto o método de Newton em otimização faz uso da função gradiente. Este é um método de otimização local.
Levenberg-Marquardt: Método muito utilizado para problemas não-lineares, ele parte de uma modificação ao método de Gauss-Newton ao introduzir um fator de amortecimento calculado iterativamente.
L-BFGS-B: BFGS é um método conhecido como quasi-Newton, onde não é necessário calcular a Hessiana do problema, ela é aproximada a partir do próprio gradiente. É bastante utilizado para resolver problemas não-lineares e em sua versão L-BFGS-B pode lidar com restrições do tipo box, intervalo dos parâmetros é fixo.
Nelder-Mead: Este é um método livre do uso de gradiente, já que usa uma heurística para construir um simplex e a partir deste “procurar” por um mínimo. Bastante utilizado quando a função objetivo pode não ser diferenciável. Faz uso de um simplex inicial, que pode ser grande o suficiente para encampar o mínimo global, entretanto, não se classifica como um otimizador global.
Algoritmo Genético: Este método utiliza conceitos da seleção natural para gerar os resultados da otimização. É um otimizador global, no sentido que independe de uma estimativa inicial de parâmetros e faz uma busca por todo o espaço factível. Em um algoritmo genético, uma população aleatória inicial de parâmetros é criada e a partir desta, as gerações evoluem conforme mutações e cross-over de características e é avaliado o fitness de cada conjunto de parâmetros até um deles ser considerado adequado.
Evolução Diferencial: É um método de otimização global, assim como o Algoritmo Genético e o Enxame de Partículas. Sua diferença reside no fato de que sua população inicial é constantemente avaliada e deslocada de posição. Se o agente obtiver uma situação melhor (menor valor para a função perda) na nova posição, esta agora faz parte da população. Desta forma os agentes, antes espalhados pelo espaço factível dos parâmetros, tendem a convergir para um ponto com o menor valor da função perda.
Enxame de Partículas: Do inglês, Particle Swarm Optimization – PSO este método é semelhante ao DE (Differential Evolution) porém as partículas (o equivalente dos agentes no DE) matém informações sobre a posição da melhor partícula até então, de forma a fazer com que as partículas tendam para a melhor solução.

Conclusão

Dependendo do objetivo da aplicação, superfícies de volatilidade podem ser interpoladas, suavizadas ou parametrizadas. A parametrização tem recebido especial interesse pois pode, ao mesmo tempo que garante uma superfície livre de arbitragem estática se devidamente construída, ajustar-se muito bem aos dados observados e gerar distribuições neutras ao risco implícitas factíveis.

Para gerar uma superfície parametrizada, primeiramente é necessário um modelo teórico com propriedades desejáveis e que se ajuste aos dados de mercado quando calibrado. Escolhido este modelo paramétrico, passa-se a calibração do mesmo onde existem diversas opções de escolha entre otimizadores. Ao final do processo teremos um modelo de superfície devidamente parametrizado com valores que melhor se ajustam segundo alguma função perda escolhida.

Com a superfície de volatilidade calibrada, as aplicações possíveis incluem a precificação de derivativos, gerenciamento de risco, simulações de Monte Carlo, análises de stress, entre outras.

Referências

Gatheral, Jim. 2004. “A Parsimonious Arbitrage-Free Implied Volatility Parameterization with Application to the Valuation of Volatility Derivatives.” Presentation at Global Derivatives & Risk Management, Madrid.

Heston, Steven L. 1993. “A Closed-Form Solution for Options with Stochastic Volatility with Applications to Bond and Currency Options.” The Review of Financial Studies 6 (2). Oxford University Press: 327–43.

Veja mais detalhes no artigo anterior: Smile de volatilidade – parte 2 ↩

Definição retirada de https://pt.wikipedia.org/wiki/Spline ↩

A variância total é o produto entre a variância implícita e o tempo para expiração, (w=\sigma^2_{imp}\cdot\tau).↩

Feb

2019

Superfícies de Volatilidade

2019/02/01

Já mostramos em artigos anteriores, processos estocásticos em finanças, o modelo de Black&Scholes e, como na realidade dos mercados surgem os smiles de volatilidade em duas partes, uma anomalia não prevista por B&S. Dado que este modelo não pode explicar o surgimento do smile de volatilidade e tampouco sua superfície, o estudo da volatilidade implícita tornou-se uma preocupação central nas finanças. Diversos modelos de superfícies de volatilidade foram propostos ao longo dos anos, e ainda o são, para buscar conciliar a presença do smile de volatilidade e a natureza estocástica da precificação do ativo subjacente.

Apresentaremos alguns poucos destes modelos.

Modelos estocásticos

Volatilidade estocástica apresenta a noção que a volatilidade instantânea do ativo subjacente também é, por si só, um processo estocástico que pode ser correlacionado com o processo de formação do preço do ativo. O resultado destes modelo é um procedimento livre de arbitragem para a interpolação dos dados de mercado a superfície de volatilidade.

Heston

O modelo de Heston, baseado no trabalho de Heston (1993), assume que o quadrado da volatilidade segue uma equação diferencial estocástica – EDE – do tipo Cox-Ingersoll-Ross – CIR, a qual apresenta características desejáveis do ponto de vista da variância. Abaixo estão as três equações que definem um modelo de Heston:

\[\begin{equation} \begin{aligned} dS_t=&\mu S_t dt + \sqrt{v_t}S_t dW_1\\ dv_t=&-\lambda(v_t-\bar v)dt+\eta\sqrt{v_t}dW_2\\ d\left\langle W_1, W_2 \right\rangle=&\rho dt \end{aligned} \tag{1} \end{equation}\]

onde \(v_t\) é a variância estocástica, \(\lambda\) é o parâmetro que define a velocidade de convergência da volatilidade para seu valor de longo prazo \(\bar v\), \(\eta\) é a famigerada volatilidade da volatilidade e a notação \(d\left\langle W_1, W_2 \right\rangle\) indica a covariação entre os movimentos Brownianos padrões \(dW_1\) e \(dW_2\).

Esta modelagem apresenta uma característica desejável, e até certo ponto, intuitiva para a volatilidade, o retorno a uma média de longo prazo. Empiricamente observamos regimes distintos de volatilidade para os ativos financeiros, em alguns momentos a volatilidade está anormalmente baixa ou durante momentos de estresse no mercado, incrivelmente alta. Porém não faria sentido um modelo onde a volatiliade pudesse estacionar permanentemente no limite inferior ou então divergir para infinito. O modelo de Heston garante que, mesmo sendo estocástica, a volatilidade não é atraída para estes extremos.

Os preços das calls e puts européias possuem fórmula fechada para seu cômputo através da transformada de Fourier, como apresentado no artigo original. A complexidade destas equações e do método para sua resolução está fora do escopo deste blog, entretanto o leitor aficcionado pode encontrar uma demonstração da forma de resolução em Gatheral (2011).

Basta-nos saber que em um framework geral de precificação de derivativos, o preço de uma call não descontada (preço de Black) pode ser escrita da seguinte forma:

\[\begin{equation} C_B(x, v, \tau)=K\left[e^xP_1(x, v, \tau)-P_0(x, v, \tau)\right] \tag{2} \end{equation}\]

onde \(x:=\ln K/F_t\). \(P_1\) e \(P_0\) são duas probabilidades na medida neutra ao risco, \(\mathbb Q\). Enquanto \(e^xP_1\) informa o valor esperado do ativo no vencimento dado que a opção está no dinheiro, \(P_0\) representa a probabilidade de ficar dentro do dinheiro na data de expiração.

As probabilidades \(P_j\), \(j = 0, 1\) podem ser calculadas através da seguinte equação:

\[\begin{equation} P_j(x, v, \tau)=\frac{1}{2}+\frac{1}{\pi}\int\limits_0^\infty Re\left\lbrace\frac{exp\{C_j(u, \tau)\bar v + D_j(u, \tau)v + iux\}}{iu}\right\rbrace du \tag{3} \end{equation}\]

onde \(i\) representa o número imaginário \(\sqrt{-1}\) e \(Re\{\cdot\}\) é apenas a parte real de seu argumento.

Primeiramente vamos definir algumas variáveis auxiliares:

\[\alpha_j=-\frac{u^2}{2}-\frac{iu}{2}+jiu\]

\[\beta_j=\lambda-j\rho\eta-\rho\eta i u\]

\[\gamma=\frac{\eta^2}{2}\]

\[r_{\pm}=\frac{\beta_j\pm\sqrt{\beta^2-4\alpha\gamma}}{2\gamma}=\frac{\beta\pm d}{\eta^2}\]

\[d=\sqrt{\beta^2-4\alpha\gamma}\]

\[g=\frac{r_-}{r_+}\]

Então:

\[C_j(u, \tau)=\lambda\left\lbrace r_-\tau-\frac{2}{\eta^2}\ln\left(\frac{1-ge^{-d\tau}}{1-g}\right) \right\rbrace \tag{4}\]

\[D_j(u, \tau)=r_-\frac{1-e^{-d\tau}}{1-ge^{-d\tau}} \tag{5}\]

SABR

Este modelo foi apresentado por Hagan et al. (2002) e assume que o preço forward, \(F_t\) do ativo subjacente e sua volatilidade instantânea, \(\alpha_t\), seguem as seguintes EDEs:

\[ \begin{aligned} dF_t=&\alpha_tF_t^\beta dW_1\\ d\alpha_t=&\nu\alpha_t dW_2\\ d\left\langle W_1, W_2 \right\rangle =&\rho dt \end{aligned} \tag{6} \]

onde \(\nu > 0\) é a volatilidade da volatilidade e \(\beta > 0\) é conhecido como o coeficiente de alavancagem.

A interpretação financeira se dá pela seguinte maneira: \(\alpha_t\) determina o nível geral de volatilidade do forward no dinheiro, \(\beta\) mede a assimetria do smile sendo as duas escolhas particulares: \(\beta = 1\) correspondendo ao modelo log-normal sem smile e \(\beta = 0\) correspondendo ao modelo normal com um smile irrealista, \(\rho\) também controla a inclinação do smile, quando \(\rho < 0\) uma inclinação negativa típica de equities surge e com a opção \(\rho = 0\) produzindo um smile de volatilidade simétrico, por fim, \(\nu\) é uma medida de convexidade. Também é possível verificar que a volatilidade estocástica, \(\alpha_t\) segue uma distribuição log-normal.

Comparado com outros modelos de volatilidade estocástica, o SABR é um dos mais simples e possui aproximações analíticas para o cálculo do preço de opções Europeias. Ele pode ser utilizado para ajustar um smile observado no mercado de forma acurada, entretanto, para ajustar uma superfície completa este modelo sofre com algumas restrições.

Bates

Em modelos de difusão como B&S e mesmo Heston, o processo de formação de preço do ativo se comporta como um movimento browniano e a probabilidade de que este preço se mova bruscamente em um curto período de tempo é muito pequena. Assim, em tais modelos, os preços das opções OTM mais curtas são muito inferiores ao que se observa nos mercados reais.

Para endereçar esta deficiência, Bates (1996) amplia o modelo de Heston incluindo saltos no processo de preço do ativo subjacente. Estes modelos, com a inclusão de saltos aleatórios na dinâmica de preços são conhecidos como Jump-Diffusion. A dinâmica é especificada pelas seguintes equações:

\[\begin{equation} \begin{aligned} dS_t=&\mu S_tdt+\sqrt{v_t}S_tdW_1(t)+J_t S_t dN_t\\ dv_t=&-\lambda(v_t-\bar v)dt+\eta\sqrt{v_t}dW_2(t)\\ d\left\langle W_1, W_2 \right\rangle =&\rho dt \end{aligned} \tag{7} \end{equation}\]

Muito semelhante, portanto ao modelo de Heston nas equações (1), com a diferença da inclusão de um processo de Poisson, \(dN_t\) com intensidade \(\theta\) indicando a probabilidade instantânea de um salto de tamanho unitário. \(J_t\) é o tamanho do salto aleatório e seu logaritmo segue uma distribuição gaussiana:

\[\begin{equation} \ln{(1+J)}\sim N\left(\ln(1+\beta)-\frac{1}{2}\alpha^2\,\, ,\,\,\alpha^2\right) \tag{8} \end{equation}\]

Este modelo possui fórmulas fechadas para os preços de calls e puts, novamente utilizando-se o método da transformada de Fourier, que podem ser encontrados utilizando o método de Duffie, Pan, and Singleton (2000).

Volatilidade local

Conforme visto neste artigo anterior sobre o smile de volatilidade, é possível a partir das volatilidades implícitas obter a distribuição neutra ao risco do preço terminal do ativo subjacente. O pesquisador e profissional de mercado Bruno Dupire em seu artigo, Dupire (1994), fez então o seguinte questionamento: dada uma distribuição implícita, existe apenas um processo de difusão¹ que seja consistente com esta distribuição? A resposta obtida foi sim, e deste processo surge a função de volatilidade local, \(\sigma_L(S, t)\), por vezes também conhecida como função de volatilidade implícita.

A equação de Dupire é apresentada abaixo:

\[\frac{\partial C_B}{\partial \tau}=\frac{1}{2}\sigma_L^2K^2\frac{\partial^2C_B}{\partial K^2} \tag{9}\]

da qual todos os termos podem ser obtidos a partir dos dados de mercado de uma superfície de volatilidade, com exceção é claro, da função de volatilidade local \(\sigma_L\) que poderá ser calculada. Esta equação pode ser vista como a definição da função de volatiliade local independente do processo que governa a evolução da volatilidade (um processo estocástico, por exemplo).

Uma forma de interpretar a volatilidade, ou mais precisamente a variância local, é na forma de valor esperado dentro da medida neutra ao risco. Resultado devido a trabalho de Derman and Kani (1998), onde a equação de Dupire pode ser reescrita da seguinte forma:

\[\frac{\partial C_B}{\partial \tau}=\mathbb E\left[v_T|S_T=K\right]\frac{1}{2}K^2\frac{\partial^2C_B}{\partial K^2} \tag{10}\]

Ou seja, a variância local é a expectativa neutra ao risco da variância instantânea condicionada ao preço terminal do ativo, \(S_T\) ser igual ao preço de exercício \(K\).

Uma das formas mais praticadas para a implementação de uma superfície de volatilidade local é através de árvores binomiais conforme apresentado por Derman and Kani (1994).

Modelos paramétricos

Diversas representações paramétricas já foram apresentadas para a superfície de volatilidade. Neste tipo de modelo uma função não-linear, dependente de um conjunto de parâmetros é especificada e, a partir dos dados observados no mercado, a parametrização é encontrada através da minimização de alguma função objetivo, método conhecido como calibração.

SVI

A parametrização da do tipo SVI (Stochastic Volatility Inspired) para o smile foi introduzida por Gatheral (2004) e é motivada pelo comportamento assintótico para strikes extremos. É baseada no smile gerado por um modelo de Heston (1993). Sua parametrização é dada em termos de forward log-moneyness conforme apresentado anteriormente, \(k=\ln(K/S)-r\tau=\ln(K/F)\), por:

\[\begin{equation} w(k) = a + b\left(\rho(k-m)+\sqrt{(k-m)^2 + \sigma^2}\right) \tag{11} \end{equation}\]

onde \(w\) é a variância total e o conjunto de parâmetros \(\chi_R = \{a, b, \rho, m, \sigma\}\) definem a forma deste smile que é conhecido como parametrização raw do SVI. Os limites destes parâmetros são tais que: \(a \in \mathbb R\), \(b \geq 0\), \(|\rho| < 1\), \(m \in \mathbb R\), \(\sigma > 0\), e a condição “óbivia” segundo Gatheral and Jacquier (2014), \(a+b \sigma\sqrt{1 − \rho^2} \geq 0\), que garante \(w(k; \chi_R) \geq 0\) para todo \(k \in \mathbb R\). Alterações nestes parâmetros têm os seguintes efeitos:

Aumentar \(a\) eleva o nível geral de variância, um deslocamento vertical do smile
Aumentar \(b\) aumenta as inclinações das asas, comprimindo o smile
Aumentar \(\rho\) provoca uma rotação no sentido anti-horário
Aumentar \(m\) desloca o smile para a direita
Aumentar \(\sigma\) reduz a curvatura no dinheiro (ATM) do smile

Figura 1: Duas parametrizações hipotéticas para a SVI.

A figura 1 acima apresenta duas parametrizações hipotéticas para o modelo. A variância total \(w_1\) tem como conjunto de parâmetros, \(\chi = \{0, 0.5, -0.6, 0, 0.3\}\) e poderia representar um smile de taxas de câmbio por exemplo. Enquanto que o modelo \(w_2\) conta com \(\chi = \{-0.04, 0.5, -0.9, 0, 0.4\}\) e se ajusta melhor ao mercado de equities.

Existem outras duas parametrizações para o SVI, a natural e a jump-wings que podem ser conferidas no artigo de Gatheral and Jacquier (2014) e serão abordadas em outro artigo a ser publicado futuramente pelo CF.

O SVI tem muitas vantagens, como o baixo tempo computacional, a variância implícita se comporta linearmente nos extremos, conforme prescrito pela fórmula do momento de Lee (2004), e boa aproximação de volatilidades implícitas para strikes muito dentro ou fora do dinheiro. O ajuste do SVI para os mercados de equities é muito melhor do que para outros mercados.

Modelos não-paramétricos

Se violações de arbitragem na estimativa da superfície não representam um problema de interesse particular, virtualmente qualquer método não-paramétrico pode ser aplicado a dados de volatilidade implícita. Uma escolha específica deve ser feita a partir de considerações práticas.

Interpolação e suavização spline

As seguintes splines² podem ser empregadas para interpolar smiles de volatilidade:

Spline cúbica
B-spline cúbica

No caso da spline cúbica, esta é uma função polinomial de grau 3 definida em cada subintervalo demarcados pelos pontos de controle, no caso de interpolação são todos nós. Uma spline cúbica é uma função contínua, suave e diferenciável até a segunda ordem.

Uma B-spline³, ou basis-spline é uma função básica para funções spline de mesma ordem, o que significa que todas as funções spline possíveis podem ser construídas a partir de uma combinação linear de B-splines. Estas podem ser preferidas às splines cúbicas, devido à sua robustez a dados ruins e à capacidade de preservar a monotonicidade e a convexidade.

Praticamente qualquer linguagem de programação e até mesmo o Excel⁴ possui funções pré-programadas para implementar interpolações spline, sendo um método de fácil aplicação. Entretanto, estas técnicas de interpolação não são específicas para superfícies de volatilidade e, portanto, não garantem que a superfície interpolada seja livre de oportunidades de arbitragem, mesmo que os dados apresentados o sejam.

Algoritmos livres de arbitragem

Considerando as limitações das interpolações com relação a presença de arbitragem na superfície gerada, vários artigos propõe algoritmos de interpolação que garantem que oportunidades de arbitragem estática não se apresentem, como em Kahalé (2004) e Wang, Yin, and Qi (2004).

Em comum, estes algoritmos possuem como requisito que os dados a serem interpolados sejam livres de arbitragem desde o início, o que nem sempre pode ser obtido. Kahalé (2004), por exemplo, propõe um procedimento de interpolação baseado em polinômios convexos por partes que simulam a fórmula de B&S. O resultado da função de preço de calls é livre de arbitragem e, portanto, também a volatilidade implícita calculada a partir dela. Em uma segunda etapa, a variância total implícita é interpolada linearmente ao longo dos strikes.

A abordagem de Fengler (2012) é baseada na suavização dos preços das opções por spline cúbica, e não em interpolação. Desta forma, os dados de entrada não precisam ser livres de arbitragem. Restrições especificamente adicionadas ao problema de minimização, a fim de garantir que não haja arbitragem, são impostos ao algoritmo spline. Uma possível desvantagem dessa abordagem é o fato de que a função de preço calls é aproximada por polinômios. Isso pode se mostrar desvantajoso, especialmente se extrapolação for necessária, já que a função de precificação certamente não é um polinômio. A escolha de uma grade suficientemente densa nos strikes pode minimizar este problema.

Extrapolação do smile

É argumentado em Benaim, Dodgson, and Kainth (2008) que que um método de extrapolação deve resultar em preços livres de arbitragem para as opções europeias (baunilha), ou seja, os preços das opções devem ser funções decrescentes (crescentes) para calls (puts), convexas com relação ao strike, e permanecer dentro de certos limites de inclinação. Além disso, o método de extrapolação deve idealmente ter as seguintes propriedades:

Deve precificar corretamente todas as opções baunilha observadas
A densidade da distribuição implícita e os preços das opções baunilha devem ser fáceis de calcular
O método não deve gerar caudas irrealistas e, se possível, deve permitir controlá-las
Deve ser robusto e flexível o suficiente para ser usado com uma ampla variedade de superfícies de volatilidade implícita
Deve ser fácil e rápido inicializar para um determinado smile

Uma das formas de extrapolação comumente utilizada é fazer a interpolação dos dados dentro da área observada, por exemplo com splines cúbicas, e então fazer a extrapolação na forma de uma linha reta, ou seja, mantendo na região de extrapolação a mesma inclinação observada no último ponto interpolado. Esta forma, segundo os autores não é adequada pois insere uma descontinuidade na densidade e também gera caudas muito curtas, de fato truncadas, a partir do ponto onde se inicia a extrapolação.

É proposto um método de extrapolação através de fórmulas fechadas para a asa esquerda (OTM puts) e direita (OTM call) do smile. Estas fórmulas têm as propriedades desejadas para strikes extremos e mantêm a convexidade dos preços. Suponha um intervalo de preços de exercício os quais existem observações de mercado e portanto, é possível fazer interpolação: \(K_-\leq K \leq K_+\), os valores das puts, \(P(K)\), para \(K e das calls, \(C(K)\), para \(K>K_+\) são dados por:

\[\begin{equation} P(K)=K^\mu \exp\left(a_1+b_1K+c_1K^2\right) \tag{12} \end{equation}\] \[\begin{equation} C(K)=K^{-\nu} \exp\left(a_2+\frac{b_2}{K}+\frac{c_2}{K^2}\right) \tag{13} \end{equation}\]

onde se garante \(\lim\limits_{K\rightarrow 0} P(K)=0\) e \(\lim\limits_{K\rightarrow \infty} C(K)=0\), fazendo \(\mu > 1\) e \(\nu > 0\). Estes parâmetros também servem para controlar a massa de probabilidade sob as caudas da distribuição.

As condições para ajustar o preço e suas duas primeiras derivadas em \(K_-\) e \(K_+\) produz um conjunto de equações lineares para os parâmetros \(a_1, b_1, c_1\) e \(a_2, b_2, c_2\), respectivamente.

Conclusão

Repassamos neste artigos, algumas das principais metodologias para a construção da superfície de volatilidade implícita. Modelos de volatilidade estocástica são capazes de gerar smiles compatíveis com aqueles observados nos mercados, sendo dependentes de técnicas de calibração destes modelos. O modelo paramétrico SVI pode ser adequado para mercado de equities, entretanto, assim como acontece nas técnicas de interpolação, restrições com relação aos parâmetros devem ser impostas a fim de evitar o surgimento de oportunidades de arbitragem estática. Por fim uma estratégia de como implementar a extrapolação do smile fora da região central foi apresentada.

Referências

Bates, David S. 1996. “Jumps and Stochastic Volatility: Exchange Rate Processes Implicit in Deutsche Mark Options.” The Review of Financial Studies 9 (1). Oxford University Press: 69–107.

Benaim, Shalom, Matthew Dodgson, and Dherminder Kainth. 2008. “An Arbitrage-Free Method for Smile Extrapolation.” Royal Bank of Scotland, Technical Report.

Derman, Emanuel, and Iraj Kani. 1994. “The Volatility Smile and Its Implied Tree.” Goldman Sachs Quantitative Strategies Research Notes 7 (January).

———. 1998. “Stochastic Implied Trees: Arbitrage Pricing with Stochastic Term and Strike Structure of Volatility.” International Journal of Theoretical and Applied Finance 01 (01): 61–110. doi:10.1142/S0219024998000059.

Duffie, Darrell, Jun Pan, and Kenneth Singleton. 2000. “Transform Analysis and Asset Pricing for Affine Jump-Diffusions.” Econometrica 68 (6). Wiley Online Library: 1343–76.

Dupire, Bruno. 1994. “Pricing with a Smile.” Risk 7 (1): 18–20.

Fengler, Matthias R. 2012. “Option Data and Modeling Bsm Implied Volatility.” In Handbook of Computational Finance, 117–42. Springer.

———. 2011. The Volatility Surface: A Practitioner’s Guide. Vol. 357. John Wiley & Sons.

Gatheral, Jim, and Antoine Jacquier. 2014. “Arbitrage-Free Svi Volatility Surfaces.” Quantitative Finance 14 (1). Taylor & Francis: 59–71.

Hagan, Patrick S, Deep Kumar, Andrew S Lesniewski, and Diana E Woodward. 2002. “Managing Smile Risk.” The Best of Wilmott 1: 249–96.

Kahalé, Nabil. 2004. “An Arbitrage-Free Interpolation of Volatilities.” Risk 17 (5): 102–6.

Lee, Roger W. 2004. “The Moment Formula for Implied Volatility at Extreme Strikes.” Mathematical Finance: An International Journal of Mathematics, Statistics and Financial Economics 14 (3). Wiley Online Library: 469–80.

Wang, Y, H Yin, and L Qi. 2004. “No-Arbitrage Interpolation of the Option Price Function and Its Reformulation.” Journal of Optimization Theory and Applications 120 (3). Springer: 627–49.

Processo de difusão é a solução de uma equação diferencial estocástica com propriedades de Markov. O Movimento Browniano é um exemplo.↩

Spline ↩

B-Spline ↩

Cubic Spline Function in VBA ↩

extrapolação

Métodos de calibração de superfícies de volatilidade

Calibração versus Interpolação

Spline cúbica

Suavização

Parametrização

Função perda

Otimizadores

Conclusão

Referências

Superfícies de Volatilidade

Modelos estocásticos

Heston

SABR

Bates

Volatilidade local

Modelos paramétricos

SVI

Modelos não-paramétricos

Interpolação e suavização spline

Algoritmos livres de arbitragem

Extrapolação do smile

Conclusão

Referências

Blogpost

Archives