Estimación bayesiana de modelos de volatilidad estocástica
John Freddy Moreno trujillo *
* Matemático de la Universidad Nacional de Colombia, Magíster en matemática aplicada de la Universidad Nacional de Colombia. Docente investigador de la Facultad de Finanzas, Gobierno y Relaciones Internacionales de la Universidad Externado de Colombia.
Resumen
El modelo clásico para el comportamiento del precio de activos riesgosos asume volatilidad constante, lo que, por lo general, no coincide con el comportamiento de activos reales. Como alternativa se plantean modelos de volatilidad estocástica, que presentan una mayor número de parámetros y dificultad en su estimación. En el documento se describen algunos modelos de volatilidad estocástica en el contexto de modelos espacio estado, y la forma como puede realizarse su estimación aplicando algoritmos MCMC. Se considera el problema de la estimación de la función de verosimilitud en este tipo de modelos, y la forma como el muestreador de Gibbs se utiliza en estos casos. Se realiza la aplicación empírica utilizando series de acciones colombianas y se concluye acerca de los valores estimados en el procesos de volatilidad no observada de dichas series. Se propone la extensión a modelos con ruidos no gaussianos y saltos.
Palabras clave: Volatilidad estocástica, estimación bayesiana, algoritmos MCMC, filtro de Kalman.
Códigos jel: C02, C11, C33.
Abstract
The classical model for the behavior of the price of risky assets assumes constant volatility, which usually does not match the behavior of real assets. Alternatively stochastic volatility models, which have a higher number of parameters and difficulty in estimation arise. In the paper stochastic volatility models are described in the context of state space models, and how it may be done by applying the MCMC estimation algorithms. The problem of estimating the likelihood function in this type of models is considered, and how the Gibbs sampler is used in these cases. The empirical application is performed using series of Colombian stocks and concludes on the estimated volatility processes in the unobserved values ?? of such series. Extension to models with non-Gaussian noise and jumps is proposed.
Key words: Stochastic Volatility, Bayesian estimation, MCMC algorithms, Kalman Filter.
jel codes: C02, C11, C33.
Introducción
El modelo fundamental y más ampliamente estudiado para el comportamiento del precio de activos riesgosos en un mercado financiero es el desarrollado por Fisher Black y Myron Scholes en 1973 [?], propuesto en el contexto de la valoración de opciones financieras de compra y venta europeas.
El modelo desarrollado por Black y Scholes (BS), se fundamenta en asumir queel precio del activo satisface la ecuación diferencial estocástica:
donde dSt denota los cambios en el precio del activo subyacente entre t y t + dt, µ es la tasa instantánea de retorno del activo, que se asume constante, σ es la volatilidad del precio, que también se asume constante, y dWt es el incremento del movimiento browniano o proceso de Wiener en el intervalo [t, t + dt], sobre el cualse tiene, que sigue una distribución normal con media 0 y varianza dt.
Por la aplicación de la formula de Itô1 sobre este proceso, considerando la función f(x) = ln(x), se tiene que:
luego,
de donde se concluye que bajo el modelo BS los retornos logaritmos de los activos riesgosos siguen una distribución normal con media (µ - σ²/2)dt y varianza σ²dt. Si bien este modelo resulta ser fundamental en el ámbito de la modelación financiera, presenta un problema esencial: el supuesto de volatilidad constante, ya que en muchos casos, en los que se consideran observaciones reales de retornos de activos en el mercado, estos no se ajusten al modelo, pues presentan distribuciones con colas más anchas que las de la distribución normal.
Como respuesta a este problema se plantean los modelos con volatilidad estocástica, en los cuales el comportamiento del precio del activo es descrito por un par de ecuaciones diferenciales estocásticas acopladas, una para el proceso de varianza del precio y otra para el precio mismo. De esta forma, el precio del activo bajo volatilidad estocástica (SV) es descrito por:
con
donde α(t, Vt) es una función que denota el componente de tendencia del proceso de varianza (Vt), y β(t, Vt) es la función asociada al componente de difusión del proceso. Wt1 y Wt2 son movimientos brownianos con posible correlación ρ.
Los primeros autores en sugerir el uso de modelos de volatilidad estocástica son Hull y White en 1987 [?], quienes describen la dinámica del precio del activo como:
donde θ y ξ corresponden a los coeficientes de tendencia y difusión del proceso de varianza y µ es el coeficiente de tendencia del precio del activo, cantidades que se asumen como constantes. La Figura 1. muestra 20 posibles trayectorias seguidas por el proceso de varianza y por el proceso de precio del activo bajo este modelo. Para la simulación se considera la discretización de Euler de las ecuaciones (6) y (7), lo que lleva a las expresiones recursivas:
donde Z1 y Z2 son variables aleatorias normales estándar independientes. Los parámetros utilizados en la simulación son T = 1, dt = 1/365, µ = 1, ξ = 0,3, θ = 1, S0 = 100 y V0 = 0,4.
Si se consideran los resultados de estas simulaciones en comparación con el comportamiento del precio de activos, siguiendo el supuesto estándar del modelo BS, se puede observar que el modelo Hull-White permite sistemáticamente la presencia de valores más extremos de los retornos, lo que significa que bajo este modelo las colas en la distribución de los retornos serán más anchas. La Figura 2 muestra en un mismo plano los retornos bajo el modelo Hull-White y bajo el modelo estándar BS, se pude observar como los retornos bajo Hull-White toman valores extremos un mayor número de veces.
Otro modelo muy utilizado es el propuesto por Stein y Stein en 1991 [?], en el cual se modela directamente el proceso de volatilidad. En este caso se tiene que:
donde µ, η, θ, ξ son constantes reales con η > 0. La forma particular del proceso σt indica que es un proceso con reversión a la media, donde la media de largo plazo, o valor en el largo plazo de la volatilidad, es θ y la velocidad con la cual el proceso revierte a este valor es η.
La Figura 3 muestra 20 simulaciones del proceso de volatilidad y las correspondientes trayectorias del precio del activo bajo este modelo. La simulación de las mismas se realiza a partir de la discretización de Euler de las ecuaciones (10) y (11). Los valores de los parámetros utilizados para este caso son T = 1, dt = 1/365, µ = 1, ξ = 0,3, θ = 0,3, η = 1, S0 = 100 y σ0 = 0,4.
Un modelo muy popular de volatilidad estocástica es el desarrollado por Heston en 1993 [?], en el cual se asume que los procesos de precio St y de varianza Vt, satisfacen las ecuaciones diferenciales estocásticas:
donde θ es la media de largo plazo del proceso Vt, η es la velocidad o tasa mediade reversión al valor θ, ξ es la volatilidad del proceso Vt y Wt1, Wt2 son movimientos brownianos estándar con posible correlación ρ. En este caso se puede ver que la varianza sigue un tipo especial de proceso con reversión a la media conocido como proceso Cox-Ingersoll-Ross (CIR).
La Figura 4 muestra 20 simulaciones del proceso de volatilidad y las correspondientes trayectorias del precio del activo bajo el modelo Heston. La simulación de las mismas se realiza a partir de la discretización de Euler de las ecuaciones (12) y (13). Los valores de los parámetros utilizados para este caso son T = 1, dt = 1/365, µ = 1, ξ = 0,3, θ = 0,3, η = 1, S0 = 100 y V0 = 0,2.
Como se puede ver en los modelos antes expuestos, en la mayoría de los casos se consideran procesos con reversión a la media para describir la varianza o la volatilidad del precio del activo. Bajo este esquema, y aplicando de nuevo la fórmula de Itô, es posible expresar los modelos de volatilidad estocástica en forma genérica como modelos con una ecuación de volatilidad latente:
y una ecuación de retorno:
Un problema de los modelos presentados o con su versión general expresada en las ecuaciones (14) y (15), es que siguen asumiendo que condicional a la volatilidad, la distribución de los retornos logarítmicos es normal, lo que conserva el problema del rápido decaimiento de las colas de la distribución de retornos. Soluciones a este problema se han propuesto en trabajos como los de Chib, Nardari y Shepardde 2002 [?], en el que se consideran modelos de volatilidad estocástica con errores que siguen una distribución t-student.
Si bien este tipo de trabajos muestran que es posible extender los modelos para considerar un espectro amplio de situaciones, complican el uso de los mismos dado el mayor número de parámetros por estimar. Es por esto que en este documento se propone el uso de técnicas MCMC para la estimación de los parámetros de modelos de volatilidad estocástica. Esto siguiendo los desarrollados presentados en Jacquier, Polson y Rossi de 1994 [?] y de Asma y Afif de 2014 [?], quienes proponen una serie de algoritmos recursivos para el cálculo de los estimadores bayesianos, como se expone más adelante.
Para lograr el objetivo en la Sección 1 se describen los modelos de volatilidad estocástica estándar, con distribución t del error y el modelo con saltos. En la Sección 2 se describe la estimación bayesiana del modelo de volatilidad estocástica estándar, considerando algoritmos MCMC de un solo movimiento y de múltiples movimientos. Se describe también, de forma breve, el procedimiento de filtro de Kalman. En la Sección 3 se realiza una implementación empírica para los datos de las acciones de Bancolombia y Ecopetrol de 2012 a 2014. En la Sección 4 se presentan algunas conclusiones y extensiones.
1. Modelos de volatilidad estocástica (SV)
El modelo estándar de volatilidad estocástica es introducido por Taylor en 1982 [?], y está determinado por:
donde yt es el retorno logarítmico en el instante t, t = 1, 2, T.ht es el logaritmo de la volatilidad que, se asume, sigue un proceso AR(1) con parámetro de persistencia |φ| < 1, ut ~ N(0, 1) y ηt ~ N(0,ση2). A las expresiones anteriores se llega de las ecuaciones (14) y (15), considerando la discretización de Euler con yt = ln(St) - ln(St-1) y α = 0.
Aunque los modelos de volatilidad estocástica se han desarrollado para capturar el comportamiento aleatorio de la volatilidad que exhiben muchas series financieras, el modelo estándar puede fallar en capturar el comportamiento de colas anchas que se presenta en algunos casos, o los potenciales saltos de dichas series. Esto ha motivado la extensión del modelo estándar hacia otros que consideran este tipo de situaciones.
1.1. Modelo con errores t-Student
El modelo de volatilidad estocástica con errores t-Student (SVT) es especificado por:
donde ut sigue una distribución t estandarizada con v > 2 grados de libertad. El modelo puede ser presentado de forma alternativa como una combinación de distribuciones normales escaladas en las que λt denota variables i.i.d que sigue unadistribución gamma inversa, como se muestra en Polson [?].
En el modelo de volatilidad estocástica estándar, grandes valores de |yt| son determinados por grandes valores de ht, en contraste, con el modelo con errores t es posible capturar grandes valores de |yt| sin necesidad de incrementar ht.
1.2. Modelo con componente de saltos
El modelo de volatilidad estocástica con saltos en los retornos está determinado por:
donde qt es una variable aleatoria Bernulli que toma el valor 1 cuando un salto ocurre y 0 en otro caso. El tamaño del salto es representado por una variable aleatoria kt que sigue una distribución normal con media αk y varianza βk. Como las variables qt y kt son variables latentes, el modelo completo tiene las variables latentes ht, qt y kt.
Componentes similares de saltos pueden ser incluidos en el modelo de volatilidad con el objetivo de capturar movimientos instantáneos de esta, y la inclusión de este componente tanto en el retorno como en la volatilidad resulta ser un modelo apropiado para describir el comportamiento de índices, como se muestra en los trabajos de Bates en 2000 [?].
2. Estimación bayesiana del modelo SV
Desde una perspectiva práctica, el objetivo principal de un modelo SV es proporcionar la estimación para la sucesión de las volatilidades no observadas y predecir sus valores un determinado número de períodos adelante. Carlin, Polson y Stoffer en 1992 [?] presentan un tratamiento de este tipo de modelos en el contexto espacio-estado, mientras que Jacquier, Polsion y Rossi en 1994 [?] presenta un primer análisis bayesiano.
Retomando las ecuaciones que definen el modelo SV estándar
donde:
Se puede observar que los parámetros del modelo son Θ = (µ, φ, στ2), y dado que la volatilidad es no observada (constituye la ecuación de estado mientras que los retornos conforman la ecuación de observación en un modelo espacio estado), la función de verosimilitud para Θ no tiene forma conocida, ya que si y = (y1, … yT) y h = (h1, …, hT) son vectores de retornos y de volatilidad latentes respectivamente, la función de verosimilitud
es una integral T-dimensional analíticamente intratable, respecto a volatilidad es latentes desconocidas. Para resolver este problema, las volatilidades latentes son simuladas junto con los demás parámetros del modelo desde sus distribuciones condicionales, de forma que un solo algoritmo permita obtener los estimadores bayesianos de los parámetros y evaluar las volatilidades.
Jacquier, Polson y Rossi [?] proponen una aproximación mediante MCMC de un solo movimiento, que consiste en actualizar el vector de parámetros un solo elemento a la vez. Esta metodología se presenta e implementa a continuación para el caso del modelo estándar.
2.1. Algoritmo MCMC de un solo movimiento para modelos SV
Por la aplicación del teorema de Bayes se tiene que
de donde de observa que el modelo está totalmente especificado por las distribuciones prior sobre Θ. Si se asume que las distribuciones prior para Θ son independientes y dadas por:
donde IG(·, ·) es la distribución inversa gamma y N(a, b)1{(−1,1)}(x) denota una distribución normal con media a y varianza b truncada al intervalo entre -1 y 1. Los parámetros α(·) y β(·) son los hiperparámetros de las distribuciones prior.
Dadas las distribuciones prior, las distribuciones posteriores condicionales para los parámetros del modelo son:
Dado que h captura toda la información acerca de (µ, φ, ση2), la función de verosimilitud p(y|h, µ, φ, ση2) es constante con respecto a los parámetros del modelo y puede ser omitida, es decir, aparece como un factor constante en el ejercicio de integración en la determinación de la distribución posterior. Condicionando sucesivamene se tiene que:
donde p(ht+1|ht, µ, φ, ση2) se especifica de acuerdo con la ecuación (28), y las priorpor las expresiones (31) a (33). De acuerdo con la expresión (37) las distribuciones condicionales posteriores pueden ser reformuladas como:
Los detalles de esta reformulación pueden encontrarse en [?], y los valores de los parámetros son:
Dadas estas expresiones es posible muestrear directamente de las condicionales posteriores, obteniendo un muestreador de Gibbs que divide la posterior conjunta p(Θ, h, y) en T + 3 condicionales posteriores univariadas.
Este algoritmo se resume en:
2.2. Algoritmo MCMC de múltiples movimientos para modelos SV
Cuando φ es cercano a 1 y ση 2 es pequeño, la volatilidad está altamente correlacionada y el algoritmo MCMC de un solo movimiento es ineficiente y puede converger muy lentamente. Kim, Shephard y Chib en 1995 proponen un muestreador de múltiples movimientos (actualiza múltiples variables a la vez) para la volatilidad no observada. Este simula h como un bloque más que componente a componente, basado en los métodos para la estimación de modelos espacio-estado de la forma:
donde εt* es una variable aleatoria log -χ2 y ht es la volatilidad latente.
2.2.1. Filtro de Kalman para modelos SV
Como lo que se busca es obtener estimadores de volatilidad no observada, ht, dada un muestra observada de valores de los retornos yt para t = 1, …, T, en cada instante de tiempo t se distingue entre dos estimadores de la volatilidad: El estimador de volatilidad filtrado que es obtenido usando solo los datos de retornos observados hasta el instante t. Este se denota por ht|t. El estimador de volatilidad suavizado está basado en la información que llega a estar disponible después de t. Este se denota por ht|s con s>t.
El filtro de Kalman es un procedimiento iterativo que permite obtener estima-dores filtrados de ht, y que consiste de dos etapas:
1. Etapa de predicción: basado en la información disponible hasta t − 1, el logaritmo de la volatilidad en el instante t, ht, es predicho y su varianza es calculada como sigue:
La predicción de yt es:
2. Etapa de actualización: en el instante t, con la información acerca de yt, es posible calcular el error de predicción y la varianza del error.
Las predicciones realizadas en t − 1 son actualizadas con la nueva información disponible, para obtener estimadores filtrados:
Donde,
3. Ilustración empírica
Se consideran para la ilustración los precios diarios ajustados de las acciones de Ecopetrol y Bancolombia desde enero de 2012 hasta mayo de 2014 (mayo 27), con lo cual se tienen 601 observaciones de precio y 600 de retornos logarítmicos.
La Figura 5 muestra los precios para las dos acciones y la Figura 6 muestra los retornos logarítmicos de cada una.
De la observación de las gráficas de los retornos, se puede intuir que estos no siguen una distribución normal, como lo sugiere el modelo clásico bsm. Si se observa el gráfico de los histogramas de los retornos, Figura 7, se corrobora esta impresión.
Con el fin de justificar el supuesto de no normalidad de los retornos de estasacciones, por lo menos desde un punto de vista gráfico, se presenta en la Figura 8, el gráfico cuantil-cuantil de cada serie de retornos contra los cuantiles de la distribución normal.
Al ver la Figura 8 se pueda observar que los retornos no siguen las distribución normal, lo cual los convierte en un ejemplo perfecto para la aplicación de los modelos de volatilidad estocástica.
Al aplicar el modelo estándar de volatilidad estocástica a los datos de retornos antes descritos, se tienen los siguientes resultados para el caso de Ecopetrol. Los valores estimados de los parámetros del modelo SV son: µ = −7,907, φ = 0,3986 y ση2 = 0,0141 para 5000 corridas considerando 500 de calentamiento. La gráfica de las serie de retornos y la de la volatilidad suavizada se muestra en la Figura 9.
Para el caso de la acción de Bancolombia los resultados son: µ = −8,2069, φ=0,2341 y ση2 = 0,0232 para 5000 corridas considerando 500 de calentamiento. La gráfica de las serie de retornos y la de la volatilidad suavizada se muestra en la Figura 10.
4. Conclusiones y extensiones
En este trabajo se revisaron algunos modelos de volatilidad estocástica y la forma como estos pueden ser estimados aplicando metodologías bayesianas. La aproximación a la estimación de este tipo de modelos mediante el uso de algoritmos MCMC es descrita, mostrando la importancia de incorporar las creencias en el modelo estadístico, llevando más lejos el modelo teórico estándar y aproximándose, de unamejor manera, a la modelación de datos provenientes del mercado.
También se presentó una breve descripción de como los algoritmos MCMC, aplicados a modelos SV, pueden ser mejorados mediante el uso de algoritmos como el filtro de Kalman, con el objeto de hacerlos más rápidos y menos sensibles a valores extremos de los parámetros.
Con relación a las acciones de Ecopetrol y Bancolombia se observa que los valores estimados de los parámetros en el proceso de volatilidad no observada son poco persistentes φ y de baja volatilidad ση.
Los modelos presentados e implementados pueden ser extendidos hacia la consideración de modelos SV con ruidos no gaussianos o a la consideración de saltos en los procesos de varianza y retorno, con distintas distribuciones.
Pie de página
1 Dada una función f(t, x) de tipo C1,2 y un proceso de Itô, cuya expresión diferencial es de la forma dXt = α(t, Xt)dt + β(t, Xt)dWt, se tiene que:
Referencias
Esperanza Ardila, Diego Luengas, and John Freddy Moreno Trujillo. Methodology and interpretation of hurts coefficient (metodología en interpretación del coeficiente de hurts). Odeon-Observatorio de Economía y Operaciones Numéricas, (5), 2010.
M Sanjeev Arulampalam, Simon Maskell, Neil Gordon, and Tim Clapp. A tutorial on particle filters for online nonlinear/non-gaussian bayesian tracking. Signal Processing, IEEE Transactions on, 50(2):174- 188, 2002.
Manabu Asai. Bayesian analysis of stochastic volatility models with mixture-of-normaldistributions. Mathematics and Computers in Simulation, 79(8):2579-2596, 2009.
David S Bates. Jumps and stochastic volatility: Exchange rate processes implicit in deutsche mark options. Review of financial studies, 9(1):69-107, 1996.
Fischer Black and Myron Scholes. The pricing of options and corporate liabilities. The journal of political economy, pages 637-654, 1973.
Bradley P Carlin, Nicholas G Polson, and David S Stoffer. A monte carlo approach to nonnormal and nonlinear state-space modeling. Journal of the American Statistical Association, 87(418):493-500, 1992.
Siddhartha Chib, Federico Nardari, and Neil Shephard. Markov chain monte carlo methodsfor stochastic volatility models. Journal of Econometrics, 108(2):281-316, 2002.
Jon Danielsson. Stochastic volatility in asset prices estimation with simulated maximum likelihood. Journal of Econometrics, 64(1):375-400, 1994.
Asma Graja Elabed and Afif Masmoudi. Bayesian estimation of non-gaussian stochastic volatility models. Journal of Mathematical Finance, 4:95, 2014.
Andrew Harvey, Esther Ruiz, and Neil Shephard. Multivariate stochastic variance models.The Review of Economic Studies, 61(2):247-264, 1994.
Nikolaus Hautsch and Yangguoyi Ou. Discrete-time stochastic volatility models and MCMC-based statistical inference. Technical report, SFB 649 discussion paper, 2008.
Steven L Heston. A closed-form solution for options with stochastic volatility with applications to bond and currency options. Review of financial studies, 6(2):327-343, 1993.
John Hull and Alan White. The pricing of options on assets with stochastic volatilities. The journal of finance, 42(2):281-300, 1987.
Eric Jacquier, Nicholas G Polson, and Peter E Rossi. Bayesian analysis of stochastic volatility models. Journal of Business & Economic Statistics, 20(1):69-87, 2002.
Eric Jacquier, Nicholas G Polson, and Peter E Rossi. Bayesian analysis of stochastic volatility models with fat-tails and correlated errors. Journal of Econometrics, 122(1):185-212, 2004.
Rudolph Emil Kalman. A new approach to linear filtering and prediction problems. Journal of Fluids Engineering, 82(1):35-45, 1960.
Roman Liesenfeld and Robert C Jung. Stochastic volatility models: conditional normality versus heavy-tailed distributions. Journal of applied Econometrics, 15(2):137-160, 2000.
John Freddy Moreno Trujillo. Estimación de parámetros en ecuaciones diferenciales estocásticas aplicadas a finanzas (parameter estimation in stochastic differential equations (SDES): Applications to financial modeling). Odeon-Observatorio de Economía y Operaciones Numéricas, (6), 2011.
John Freddy Moreno Trujillo. Opciones parisinas: Definición y valoración (parisian options: Definitions and pricing). Odeon-Observatorio de Economía y Operaciones Numéricas, (6), 2011.
John Freddy Moreno Trujillo. Valoración de opciones sobre el círculo unitario. la transformada rápida de fourier y el modelo binomial. Odeon-Observatorio de Economía y Operaciones Numéricas, (7), 2013.
Davide Raggi and Silvano Bordignon. Comparing stochastic volatility models through monte carlo simulations. Computational statistics & data analysis, 50(7):1678-1699, 2006.
Gleb Sandmann and Siem Jan Koopman. Estimation of stochastic volatility models viamonte carlo maximum likelihood. Journal of Econometrics, 87(2):271-301, 1998.
Elias M Stein and Jeremy C Stein. Stock price distributions with stochastic volatility: ananalytic approach. Review of financial Studies, 4(4):727-752, 1991.
Stephen John Taylor. Financial returns modelled by the product of two stochastic processes, a study of daily sugar prices. 2005.