Aplicación del modelo Contribución jerárquica de igual riesgo con ADR latinoamericanos

Application of the Hierarchical Equal Risk Contribution Model with Latin American ADRS

Daniel Aragón Urrego^*

^* Magíster en Finanzas y estudiante de doctorado en Ingeniería de Sistemas y Computación. Docente-Investigador, Observatorio de Economía y Operaciones Numéricas (ODEON), Universidad Externado de Colombia, Bogotá (Colombia). [daniel.aragon@uexternado.edu.co]. [ORCID ID: 0000-0001-7677-1379].

Artículo recibido: 12 de julio de 2023 Aceptado: 2 de octubre de 2023

Para citar este artículo: Aragón-Urrego, D. (2023). Aplicación del modelo Contribución jerárquica de igual riesgo con ADR latinoamericanos. Odeon, 25, 55-71.
DOI: https://doi.org/10.18601/17941113.n25.03

Resumen

Se presenta el modelo contribución jerárquica de igual riesgo (HERC-Hierarchical Equal Risk Contribution) propuesto por Raffinot que, al igual que el modelo propuesto por López de Prado, incorpora técnicas de machine learning para la optimización de portafolios de inversión, evitando algunas limitaciones del algoritmo CLA del modelo tradicional Media-Varianza de Markowitz (1952). Se realiza una aplicación del modelo HERC considerando métodos de enlazamiento Single y Ward para la agrupación jerárquica de un conjunto de activos que cotizan en el NYSE y cuyas empresas están ubicadas en países latinoamericanos. Los resultados muestran que, para el caso de este conjunto de activos, la agrupación y jerarquización con el método de agrupamiento Ward se caracteriza por ser intrapaís, y muestra un número de clústeres más compacto frente al método de agrupamiento Single, así como mejores resultados en términos de rendimiento, volatilidad y coeficiente de Sharpe.

Palabras clave: optimización de portafolios; paridad de riesgo; clustering.

Clasificación JEL: C61, G11.

Abstract

The Hierarchical Equal Risk Contribution (HERC) approach, as proposed by Raffinot (2017, 2018), is introduced here. Similar to the model proposed by López de Prado (2016), it incorporates machine learning techniques for portfolio optimization, addressing certain limitations of the Mean-Variance model by Markowitz (1952). An application of the HERC model is conducted, considering Single and Ward linkage methods for hierarchical clustering of a set of assets traded on the NYSE, with companies located in Latin American countries. The results indicate that, for this set of assets, the Ward clustering and hierarchy method is characterized by being intra-country, resulting in a more compact number of clusters compared to the Single clustering method. Additionally, it demonstrates better performance, lower volatility, and a higher Sharpe ratio.

Keywords: Portfolio optimization; risk parity; clustering.

JEL classification: C61, G11.

Introducción

El modelo tradicional Media-Varianza (MV), formulado por Markowitz (1952,1959), incorpora el algoritmo de línea crítica (CLA) que resuelve un problema de optimización cuadrática sujeta a restricciones de asignación y distribución relacionadas con los valores de las participaciones o pesos de los activos y la suma de estos, con lo cual es posible obtener un conjunto de portafolios óptimos que se representan en una frontera eficiente.

Sin embargo, las soluciones generadas por este algoritmo, que son dependientes de la matriz de covarianzas, tienden a ser concentradas e inestables (López de Prado, 2020), situación asociada a la propiedad que debe cumplir esta matriz, como lo es ser definida positiva para poder obtener su inversa. En la práctica, se ha señalado que cuando en un portafolio existe una alta correlación entre los rendimientos de los activos, la matriz de covarianzas presenta una alta condición número¹, lo que hace que los valores de su inversa exploten, lo cual tiene efectos en la determinación de los pesos debido a que en el proceso de optimización se requiere invertir la matriz de covarianzas.

Así, se han planteado diferentes caminos para enfrentar esta situación, algunos de ellos mediante la incorporación de información adicional (Black Litterman, 1992; Clarke et al., 2002) y otros enfocándose en el fortalecimiento de la estabilidad numérica de la matriz (Ledoit y Wolf 2004). Dentro de las diferentes propuestas para optimizar los portafolios de inversión sin requerir la inversa de la matriz de covarianzas, se encuentran dos modelos que incorporan técnicas de machine learning, estos son: Hierarchical Risk Parity (HRP) planteado por López de Prado (2016) y Hierarchical Equal Risk Contribution (HERC) propuesto por Raffinot (2017, 2018).

La propuesta de López de Prado (modelo HRP) consiste en las siguientes tres etapas: i) Agrupación de activos en árboles jerárquicos a partir de la información de la matriz de correlación, y de una matriz de enlazamiento (linkage). Esta estructura jerárquica se presenta a través de un dendrograma. ii) Seriación o cuasi-diagonalización, en donde se reordena la matriz de covarianzas de forma semejante al orden que tienen los activos dentro de la matriz linkage. iii) Bisección recursiva, consistente en la optimización de paridad de riesgo ingenua top-down (pesos proporcionales a la inversa del riesgo) a partir del orden de los activos dentro del dendograma. El resultado de este proceso es la obtención de los pesos óptimos para cada uno de los activos que conforman el portafolio.

Por su parte, la propuesta de Raffinot (modelo HERC) toma elementos del modelo HRP y adiciona la jerarquización de clústeres y la optimización de portafolios sobre las medidas de riesgo a la baja (por ejemplo, CVaR), buscando lograr mejores rendimientos ajustados al riesgo. De esta manera, el objetivo de las siguientes páginas será presentar e implementar esta novedosa propuesta de Raffinot (2018) para la construcción de un portafolio óptimo de inversión con activos latinoamericanos que tienen ADR listado en el New York Stock Exchange (NYSE).

Este artículo está conformado por dos apartados. El primero presenta el enfoque HERC, y el segundo su implementación en la construcción de un portafolio bajo esta propuesta. Para finalizar, se presentan las conclusiones.

1. Hierarchical Equal Risk Contribution (HERC)

El Hierarchical Equal Risk Contribution (HERC) es un enfoque para la optimización de la cartera, que tiene como objetivo diversificar la asignación de capital y la asignación de riesgos en función de una estructura jerárquica (Raffinot, 2018). Se basa en los principios de jerarquía y paridad de riesgo para determinar la asignación óptima de activos en una cartera.

El algoritmo HERC se puede desarrollar en las siguientes etapas (Raffinot, 2018).

1.1. Agrupación jerárquica

Con base en la matriz de correlación, y definiendo una métrica de distancia, se construye una matriz linkage o de enlazamiento, mediante la cual se crea una estructura jerárquica entre los activos que se representa a través de un dendograma.

Formalmente, se tiene una matriz de correlación definida por las siguientes entradas:

ρ = {ρ_ij = 1,...,N} (1)

En donde, ρ_ij = ρ [X_i, X_j], se procede a determinar una matriz de distancia (D) que viene dada por (Raffinot, 2017):

Aquí, siguiendo a Raffinot (2017), el enlazamiento de los clústeres puede realizarse aplicando métodos, entre ellos:

Single: la distancia entre dos clústeres corresponde a la distancia mínima entre 2 puntos en los clústeres. Este método es considerado uno de los más simples; sin embargo, se podrían presentar situaciones asociadas con encadenamiento (chaining), que consisten en que los grupos terminan siendo largos y desordenados.
Complete: la distancia entre dos clústeres corresponde a la distancia máxima entre 2 puntos en los clústeres. Los resultados tienden a reflejarse en clústeres compactos de tamaño similar.
Average: la distancia entre dos clústeres corresponde a la distancia promedio entre 2 puntos en los clústeres. Se considera un método robusto.
Ward: la distancia entre dos clústeres es el aumento del error al cuadrado que resulta cuando dos grupos se fusionan.

Como lo señala Raffinot (2018), tanto el método Single (mínima distancia entre las hojas) como Complete (máxima distancia entre las hojas) son sensibles a los valores atípicos. Por su parte, el método Ward es menos susceptible al ruido y a los valores atípicos, lo que hace que su uso sea más frecuente.

1.2. Número óptimo de clústeres y seriación

Para determinar el número óptimo de clústeres, Raffinot (2017, 2018) utiliza Gap statistic planteado por Tibshirani et al. (2001), mediante el cual se compara la dispersión dentro de cada clúster (dispersión intra-clúster) con la dispersión esperada en un conjunto de datos aleatorio sin estructura de clustering (dispersión intra-clúster en datos aleatorios). Cuanto mayor sea la diferencia entre estas dos dispersiones, mejor será la calidad del agrupamiento. El número óptimo de clústeres está determinado por el valor que maximiza esta diferencia (gap).

Una vez se identifique el número óptimo de clústeres, se realiza el reordenamiento de la matriz de correlación de forma semejante al orden que tienen los activos dentro de la matriz de linkage.

1.3. Asignación de pesos por clúster e intraclúster

Aquí se combinan las etapas 3 y 4 planteadas por Raffinot (2018), realizando la asignación óptima tanto intra como inter-clúster, lo cual implica la diversificación acorde con los diferentes niveles jerárquicos. Para ello, el capital debe ser distribuido por igual en cada nivel de clústeres (inter-clústeres), lo que lleva a que muchos activos correlacionados reciban el mismo peso que un activo no correlacionado. A nivel intra-clúster, se calcula un peso ponderado igual para cada activo.

2. Implementación

2.1. Datos

Se realizará una aplicación del modelo HERC, para lo cual se identificaron 69 acciones de compañías latinoamericanas que tienen ADR listado en el NYSE, con el objetivo de tomar acciones con liquidez en el mercado. De este grupo se filtraron aquellas que para el periodo de análisis presentaron coeficiente de Sharpe² positivo, con lo cual el grupo se redujo a 17. Los activos identificados pertenecen a compañías ubicadas en Argentina (2), Brasil (9), Chile (3) y México (3). La información corresponde al precio de cierre ajustado mensual para el periodo comprendido entre el primero de enero de 2016 al 30 de junio de 2022, con lo cual se obtuvieron 78 observaciones para cada activo. Finalmente, se utilizará la librería riskfolio-lib en Python para realizar la implementación.

La tabla 1 presenta información relacionada con algunos estadísticos de interés sobre los activos seleccionados.

Como se aprecia en la tabla 1, el conjunto de activos seleccionados ha estado sujeto a volatilidades anualizadas promedio de 45,61% y, en particular, tres activos brasileros (EBR, GGB Y SID) que registran cifras superiores al 60%. Sin embargo, las volatilidades relativamente altas no siempre han estado acompañadas de los más altos retornos promedio anualizados, destacando el caso de activos como VALE (Brasil) y SQM (Chile), cuyos retornos no están asociados con las más altas volatilidades.

Adicionalmente, se construyó la matriz de correlación con los retornos de los activos, destacando que los valores más bajos se presentan entre activos brasileros y chilenos. Por ejemplo, entre los activos EBR y ELP de Brasil con respecto a SUZ de Chile con 0,08 y 0,11, respectivamente; AMX de México y BCH de Chile (0,13). Por su parte, la mayor correlación se evidencia entre los activos mexicanos ASR y PAC, con 0,89, ambos pertenecientes al transporte industrial (figura 2).

Una vez se tiene la matriz de correlación se realiza la jerarquización de los activos, en donde utilizando la distancia Ward se crea la matriz linkage que permite organizar los activos en una estructura de árbol agrupado, la cual gráficamente se representa a través del siguiente dendrograma:

En la figura 3 se observan los clústeres formados siguiendo el método de agrupamiento Ward, en donde se aprecia que el agrupamiento parece responder en mayor medida al criterio país. En este sentido, se destaca el clúster chileno (BCH-BSAC-SQM), el clúster argentino-mexicano (PAC-ASR-AMX-TS-TX) y dos clústeres brasileros (BAK-LND) y (VALE-SID-GGB-PBR-ELP-EBR).

Por su parte, al emplear el método de agrupamiento Single (figura 4), siguiendo el proceso de abajo hacia arriba, se destaca que: i) los tres primeros clústeres que se conforman (BCH-BSAC), (SID-VALE) y (ASR-PAC) se caracterizan porque los activos pertenecen a un mismo país e industria, ejemplo de ello es la conformación de un clúster brasilero con 6 activos; ii) los activos argentinos no conforman un clúster, en el caso de TS se adhiere al clúster mexicano y TX al brasilero; iii) aunque hay agrupación por país, parece que la participación en los clústeres se asocia en mayor medida a pertenecer a la misma industria.

En la segunda etapa se calcula el número óptimo de clústeres y se reordena la matriz de correlación (figura 3, método Ward y figura 4, método Single). En este aspecto, se debe señalar que Riskfolio-Lib emplea Two difference gap statistic para obtener el número óptimo de clústeres debido a que el método original (Gap Statistic), utilizado por Raffinot, conlleva un alto costo computacional.

Finalmente, se realiza el proceso top-down acorde con la estructura jerárquica del árbol, en donde se obtiene el peso óptimo para cada clúster de acuerdo con su contribución al riesgo. Aquí, es importante señalar que al interior de cada clúster se deberían observar altas correlaciones entre los activos. La tercera etapa termina cuando al interior de cada clúster se define el peso para cada activo (tabla 2).

2.2. Análisis y comparación de resultados

Los resultados obtenidos tras la implementación del modelo HERC con enlazamiento Ward (HERCw) se compararán con el mismo modelo utilizando enlazamiento Single (HERCs).

Vale la pena señalar que los dos modelos presentan diferencias cuando se analizan los resultados por país o industria. Como ejemplo se tiene que el portafolio HERCw otorga mayor peso a los activos chilenos (45,46%), mientras que el portafolio HERCs se concentra en los activos brasileros (92,78%), debido a la alta participación que le concede al activo SUZ con el 74,42% y que contribuye con cerca del 30% del riesgo en el portafolio. Sin embargo, se observa similitud entre los portafolios por el menor peso que representan los activos argentinos (HERCw: 8,67% y HERCs: 1,21%). En el caso del agrupamiento por industria, la mayor participación la tienen los bancos en el portafolio HERCw con el 36,17%, mientras que en el portafolio HERCs corresponde a Forestry & Paper con una cifra cercana al 75%.

Así mismo, la tabla 3 muestra en términos anualizados, que tanto el retorno esperado como la volatilidad son superiores para el modelo Single; sin embargo, cuando se aprecia el coeficiente de Sharpe es superior para el modelo Ward. A su vez, se evidencia un mayor coeficiente de diversificación para el modelo Ward, lo cual indica mejor distribución de los pesos entre los activos que conforman el portafolio, situación que se evidenció previamente respecto del agrupamiento por industria y por país.

Con base en los dos portafolios optimizados (HERCw y HERCs), se realizó un ejercicio fuera de muestra tomando los precios de cierre ajustado mensual para el periodo 1 de julio de 2022 a 30 de junio de 2023, cuyos resultados se presentan a continuación (tabla 4):

En el ejercicio Out Sample, el portafolio HERCw presenta importantes diferencias en tres medidas con respecto al ejercicio In Sample, principalmente en el retorno esperado anualizado que aumenta al 15,30%, en una disminución de la volatilidad al nivel del 20,58%, lo cual se refleja en un mejor valor para el premio por unidad de riesgo (coeficiente de Sharpe: 0,7433). Por su parte, el portafolio HERCs no logra mejorar sus resultados, lo cual podría ser explicado por los efectos que causa la alta participación del activo SUZ (74,42%), cuyo comportamiento durante el periodo Out Sample estuvo caracterizado por un retorno promedio anualizado de 2,42%, mientras que en el periodo In Sample fue del 13,87%.

Así, la comparación de resultados Out Sample permitiría inferir que el mejor desempeño del portafolio HERCw puede atribuirse a la diversificación en activos de diferentes países e industrias, lo que permite compensar en el periodo Out Sample los retornos esperados anualizados de los activos de la industria química (-2,43%) con los retornos de los activos de la industria bancaria (9,05%) y del transporte (2,64%).

3. Conclusiones

En este documento se ha presentado la propuesta de Raffinot (2017, 2018), conocida como modelo HERC, considerando métodos de enlazamiento Single y Ward para la agrupación jerárquica, el cual busca responder a limitaciones identificadas en el modelo tradicional de Markowitz, como en la propuesta de López de Prado (2016, 2018), para la optimización de portafolios de inversión.

Los resultados muestran que, para el caso de este conjunto de activos, la agrupación y jerarquización con el método de agrupamiento Ward se caracteriza por ser intrapaís, mostrando un número de clústeres más compacto frente al método de agrupamiento Single.

La optimización de los activos seleccionados aplicando el método de agrupamiento Ward en un escenario Out Sample genera un portafolio que logra mejoras en términos del retorno esperado anualizado, así como de la volatilidad anualizada y del coeficiente de Sharpe frente al ejercicio In Sample. Por su parte, la optimización considerando el método de agrupamiento Single únicamente supera al modelo HERCw en términos del retorno esperado anualizado en el escenario In Sample; en el ejercicio Out Sample el desempeño del portafolio no mejora y esto podría atribuirse a la asignación del 74,42% del peso total al activo SUZ, con lo cual hace al portafolio dependiente de su comportamiento.

En este sentido, un siguiente ejercicio consistirá en realizar comparaciones con los resultados del enfoque HRP propuesto por López de Prado (2016, 2018, 2020) y del modelo tradicional Media-Varianza de Markowitz (1952), incorporando diferentes medidas de desempeño.

Notas

¹ Se conoce como condición número de una matriz al "valor absoluto de la relación entre sus valores propios máximos y mínimos (por módulos)" (López de Prado, 2016).
² Se consideró una tasa libre de riesgo de 0%.

Referencias

Bailey, D. y M. López de Prado (2012). The Sharpe Coeficiente Efficient Frontier. Journal of Risk, 15(2), 3-44. DOI: 10.21314/jor.2012.255.

Bechis, L. (2020). Machine learning portfolio optimization: hierarchical risk parity and modern portfolio theory (Tesis de maestría), Libera Università Internazionale degli Studi Sociali Guido Carli. http://tesi.luiss.it/28022/1/709261_BECHIS_LUCA.pdf

Black, F. y Litterman, R. (1992). Global portfolio optimization. Financial Analysts Journal, 48(5), 28-43. DOI: 10.2469/faj.v48.n5.28.

Clarke, R., De Silva, H. y Thorley, S. (2002). Portfolio constraints and the fundamental law of active management. Financial Analysts Journal, 58, 48-66. DOI: 10.2469/faj.v58.n5.2468.

Ledoit, O. y Wolf, M. (2004). A well-conditioned estimator for large-dimensional co-variance matrices. Journal of Multivariate Analysis, 88(2), 365-411. DOI: 10.1016/S0047-259X(03)00096-4.

León, D., Aragón, A., Sandoval, J., Hernández, G., Arévalo, A. y Niño, J. (2017). Clustering algorithms for risk-adjusted portfolio construction. Procedia Computer Science, 108, 1334-1343. DOI: 10.1016/j.procs.2017.05.185

López de Prado, M. (2016). Building diversified portfolios that outperform out of sample. The Journal of Portfolio Management, 42(4), 59-69. DOI: 10.3905/jpm.2016.42.4.059

López de Prado, M. (2018). Advances in financial machine learning. John Wiley y Sons.

López de Prado, M. (2020). Machine learning for asset managers. Cambridge University Press. DOI: 10.1017/9781108883658

Markowitz, H. (1952). Portfolio Selection. Journal of Finance, 7(1), 77-91.

Markowitz, H. (1959). Portfolio Selection: Efficient Diversification of Investments. Wiley.

Mercader, M. (2021). Hierarchical Risk Parity: portfolio optimization. Mathematics and Physics Engineering Final Project. Universitat Politécnica de Catalunya. https://upcommons.upc.edu/bitstream/handle/2117/350200/tfg.pdf?sequence=1&isAllowed=y

Michaud, R. O. y Michaud, R. (2007). Estimation error and portfolio optimization: A resampling solution. SSRN Electronic Journal. DOI:10.2139/ssrn.2658657

Raffinot, Th. (May 2017). Hierarchical clustering-based asset allocation. SSRN Electronic Journal. https://doi.org/10.3905/jpm.2018.442.089

Raffinot, Th. (August 23, 2018). The hierarchical equal risk contribution portfolio. SSRN Electronic Journal. http://dx.doi.org/10.2139/ssrn.3237540

Sharpe, W. (1964). Capital asset prices: A theory of market equilibrium under conditions of risk. journal of finance, 19(3), 425-442. DOI: 10.1111/j.1540-6261.1964.tb02865.x

Tatsat, H., Puri, S. y Lookabaugh, B. (2020). Machine Learning and Data Science Blueprints for Finance. O'Reilly Media.

Tibshirani, R., Guenther, W. t Hastie, T. (2001). Estimating the number of clusters in a data set via the gap statistic. Journal of the Royal Statistical Society, Series B, 63, 411-423. DOI: 10.1111/1467-9868.00293.