10.18601/17941113.n17.04

Dinámica de portafolios y control óptimo estocástico

Portfolio dynamics and stochastic optimal control

John F. Moreno T.*

* Magíster en Matemática Aplicada. Universidad Externado de Colombia. Bogotá, Colombia. [jhon.moreno@uexternado.edu.co] [ORCID: 0000-0002-2772-6931].

Artículo recibido el 15 de octubre de 2019.
Aceptado el 13 de noviembre de 2019.

Para citar este artículo:
Moreno Trujillo, J. F. (2019). Dinámica de portafolios y control óptimo estocástico. ODEON, 17, pp. 89-106. DOI: https://doi.org/10.18601/17941113.n17.04


Resumen

Se presenta una introducción a la teoría de control óptimo estocástico y sus aplicaciones en el marco del problema de selección óptima de portafolios.

Palabras clave: optimización de portafolios; control óptimo estocástico; ecuación de Hamilton-Jacobi-Bellman.

Clasificación JEL: C02, C22, C61.


Abstract

An introduction to the stochastic optimal control theory and its applications is presented within the framework of the optimal portfolio selection problem.

Key words: portfolio optimización; stochastic optimal control; Hamilton-Jacobi-Bellman equation.

JEL classification: C02, C22, C61.


Introducción

En este documento se presenta un modelo para describir la dinámica de un portafolio autofinanciado conformado por diversos activos en tiempo continuo, junto con una introducción a la aplicación de la teoría de control óptimo estocástico para tratar el problema de su conformación.

Partimos de considerar un mercado financiero conformado por múltiples activos (riesgosos y no riesgosos). El intervalo de tiempo en consideración es [0,T], aunque la teoría se puede extender a [0, ∞). Este intervalo será dividido en periodos de longitud Δt y se asumirá que las negociaciones solo pueden tener lugar en los puntos del tiempo de la forma nΔt, con n = 0,1, 2,… Se denomina como periodo t al intervalo [t, t + Δt) donde t = nΔt para algún n, mientras que al momento de tiempo t lo denominamos instante t.

Se denotará como:

Con la notación anterior se tiene que:

Solo serán considerados portafolios y consumos autofinanciados, es decir, portafolios que no tienen entradas o salidas exógenas de capital distintas a las destinadas para consumo (el término c). Esto implica que los portafolios nuevos deben permitir el consumo, pero deben ser financiados solamente mediante cambios en las posiciones en los activos disponibles.

Para concretar la condición de autofinancimiento consideramos Vt, que denota la riqueza del agente al inicio del periodo t, y que está determinada por el valor en este instante del portafolio viejo del periodo t - Δt, es decir:

lo que implica que el valor de la riqueza del agente en el instante t es el resultado de vender su portafolio viejo a los precios observados en este instante.

En este mismo momento se procede a:

  1. Reinvertir en un nuevo portafolio ht.
  2. Seleccionar y consumir a un tasa ct durante el periodo t.

El costo de este nuevo portafolio ht está determinado por

mientras que el costo de consumir a un tasa ct es ctΔt. De esta forma, la condición de autofinanciamiento es:

Denotando como ΔXt = Xt - Xt-Δt, para cualquier proceso X, se tiene que:

htt • St = ht • St +ctΔt

ht• St - ht-Δt • St + ctΔt = 0

(ht - ht-Δt) • St + ctΔt = 0

Δht • St + ctΔt =0

A fin de tener diferenciales en el sentido de Itô (adelantadas), sumamos y restamos el término St-Δt • Δht en el lado izquierdo de la última ecuación considerada, con lo cual:

Δht • St - St-ΔtΔht + St-Δt • Δht + ctΔt = 0

Δht • (St - St-Δt)+ St-Δt • Δht + ctΔt = 0

Δht • ΔSt + St-Δt • Δht + ctΔt = 0

y considerando que Δt → 0 se tiene que:

Si se considera tambien que Δt → 0 en la ecuación (1) se tiene que:

y tomando el diferencial de Itô,

expresión que describe la dinámica del portafolio. De la ecuación (4) se tiene que:

dhtdSt = -Stdht - ctdt

y al reemplazar en (6) se tiene que:

ecuación que describe la dinámica del portafolio autofinanciado, y muestra que los cambios en su valor (dVt) están determinados por los cambios en los precios de los activos que lo conforman (dSt) y el gasto en consumo (ctdt).

1. Portafolios autofinanciados

A partir de las definiciones presentadas es posible concretar los siguientes conceptos:

1.1. Dividendos

Se define un proceso {Dt; t ≥ 0}, N-dimensional, donde Dit corresponde al valor del dividendo acumulado pagado al poseedor de una unidad del activo i durante el intervalo (0,t]. Se asume que:

para algún proceso deltat. En este caso, se asume que el activo i paga dividendos continuamente a una tasa δ.

Al considerar dividendos en el analisis de la dinámica del portafolio se tiene que:

2. Selección de portafolios y control óptimo

Para lo que sigue se considera una economía en el intervalo [0,T], de forma que en t = 0 cada agente está dotado de una riqueza inicial x0 y su problema es: seleccionar la mejor estrategia (h, c) de inversión y consumo sobre [0,T].

Como oportunidades de inversión se tiene:

Para realizar la inversión, el agente conforma un portafolio tomando posición en los dos activos anteriores, de forma que su portafolio relativo es:

Dado que las estrategias consideradas por el agente deben ser autofinanciadas, su riqueza en el instante t, denotada por Xt, satisface:

o de forma equivalente:

El objetivo del agente es maximizar:

donde F (t, ct) denota la utilidad por consumos entre 0 y T y Φ(XT ) denota la utilidad de llegar al instante T con riqueza. De está forma, el problema del agente es:

sujeto a:

En el planteamiento del problema se pueden identificar:

2.1. Ecuación de Hamilton-Jacobi-Bellman

Para la deducción de la ecuación de Hamilton-Jacobi-Bellman (HJB) se asume que:

Procedemos entonces a:

  1. Fijar un par (t,x) ∈ [0,T] x R, y un incremento de tiempo dt fijo, tal que t + dt < T.
  2. Se define un control aleatorio u* como:
  3. Se consideran dos estrategias posibles sobre el intervalo (t, T]:

  4. Las utilidades esperadas bajo cada estrategia son:

  5. Comparamos las utilidades esperadas de las dos estrategias:
  6. Aplicando la formula de Itô sobre V(t + dt, Xt+dt) se tiene1 :
  7. que en notación integral, considerando el diferencial entre t y t + dt es:

    y tomando el valor esperado en (19) con t y x fijos, se tiene:

    donde el valor esperado del último término es igual a 0 ya que este es una integral estocástica.

    De la ecuación (20) se concluye que:

    Al reemplazar (20) en (17) se tiene:

    de donde,

    Considerando que dt → 0 tenemos que:

    La igualdad en esta expresión solo se tiene si el control u es el óptimo û, entonces:

    con V (t, x) = Φ(x), esta es la ecuación diferencial parcial de HJB.

Considerando de nuevo el problema del agente se tiene que u0t + u1t = 1; luego, si se establece que u1 = w, entonces 1 - w = uo, con lo cual la evolución del proceso de riqueza del agente puede describirse como:

dXt = wt[µ, - rf ]Xtdt + [rf Xt - ct]dt + wtσXtdWt

y la correspondiente ecuación de HJB es:

En general, la mayor dificultad al enfrentar problemas de control óptimo está en la resolución de la ecuación de HJB; muestra de esto es el limitado número de problemas de este tipo que tiene una solución analítica. Una manera de tratar este problema es proponiendo una forma para la posible función solución de la ecuación, basada en la forma de las funciones de utilidad.

A pesar de lo anterior, es posible establecer una serie de pasos que facilitan la aproximación a la solución de la ecuación.

  1. Se establece la ecuación de HJB para V.

  2. Considerando un par (t, x) ∈ [0,T] x R fijos, se resuelve el problema de optimización estático:
  3. La solución óptima û encontrada depende de t, x, de la función V y sus derivadas parciales:
  4. û = û(t, x; V)

  5. Con la función û = û(t, x; V) como candidata para control óptimo, pero parcialmente definida porque no se conoce la función V, se sustituye û en la EDP para obtener:
  6. Consideremos un agente con una función de utilidad por consumos dada por:

    y una función de utilidad asociada a la riqueza dada por:

    para β > 0 y γ ∈ (0,1). Entonces, el problema del agente puede plantearse como:

    y el problema de optimización estático es:

    Las condiciones de primer orden asociadas a este problema son:

    1. Derivando respecto a c:
    2. Derivando respecto a w:

    Se propone, entonces, una forma plausible para la función V(t, x) a partir de las funciones de utilidad:

    de donde:

    luego,

    la ecuación de HJB queda expresada como:

    al distribuir exponentes, agrupar y factorizar

    de donde,

    Denotado por:

    se tiene,

    La última de las ecuaciones anteriores corresponde a una ecuación diferencial ordinaria tipo Bernulli, la cual puede resolverse aplicando la transformación , de donde:

    Dado que la ecuación (38) puede escribirse como:

    utilizando los resultados de la sustitucion se tiene que,

    El factor integrante en esta última ecuación diferencial lineal es:

    luego,

    Al integrar se tiene que:

    donde K es una constante de integración.

    Dado que g(t) = f (t)1/(1-γ), entonces:

    y como f (T) = 1, se tiene que , lo que resuelve completamente el problema.

3. Conclusiones

Este documento es una introducción a la teoría de control óptimo estocástico y sus aplicaciones. Busca introducir al lector en los rudimentos básicos necesarios para entender esta teoría en el marco del problema de selección óptima de portafolios.


Notas

1 Dada una ecuación diferencial estocástica de la forma:
dXt = µ(t, Xt)dt + σ(t, Xt)dWt
el operador infinitesimal, operador diferencial, operador de Dynkin, operador de Itô u operador atrasado de Kolmogorov de Xt, para una función h(t, x) ∈ C1,2 (R), se define como:


Referencias

Björk, T. (2009). Arbitrage theory in continuous time. Oxford: Oxford University Press.

Martínez, F. V. (2008). Riesgos financieros y economicos/financial and economical risks: Productos derivados y decisiones economicas bajo incertidumbre. Bogotá: Cengage Learning Editores.

Mikosch, T. (1998). Elementary stochastic calculus with finance in view. Singapur: World Scientific.

Moreno T., J. F. (2015). Modelos estocásticos en finanzas. Bogotá: Universiad Externado de Colombia.

Oksendal, B. (2013). Stochastic differential equations: an introduction with applications. Berlin: Springer Science & Business Media.

Peng, S. (1993). Backward stochastic differential equations and applications to optimal control. Applied Mathematics and Optimization, 27(2), 125-144.

Shreve, S. (2012). Stochastic calculus for finance 1: The binomial asset pricing model. Berlin: Springer Science & Business Media.

Shreve, S. E. (2004). Stochastic calculus for finance 2: Continuous-time models (Vol. 11). Berlin: Springer Science & Business Media.