¿Qué son los Puntos IronIA?

Javier Riaño
29 dic 2020
11 min de lectura

Actualizado: 14 feb 2024

Nivel: Avanzado

El objetivo de esta entrada es explicar de una forma asequible qué son los Puntos IronIA con los que catalogamos a los fondos de inversión en la aplicación de IronIA así como la metodología seguida para su obtención.

He contado muchas veces que el objetivo de crear IronIA era dar acceso a todo el público que no quiere o no puede acceder a una Banca Privada al mayor universo de fondos disponibles en España y no limitarle a la interesada oferta que muchas veces hacen las entidades financieras tradicionales trufadas de conflictos de interés. La base de esta amplia oferta era que dentro de toda esta gama iba a poder elegir auténticos productos de calidad, pero para ello, el segundo pilar fundamental para el público no experto, era dotar de herramientas a la aplicación para que el no experto fuera capaz de identificar de forma fácil y rápida qué productos son buenos y cuales no. Hoy vamos a centrarnos en la principal herramienta de ayuda que no es otra que los Puntos IronIA, el sistema por el cual establecemos un ranking para todas las categorías de fondos de inversión.

¿Por qué es necesario un algoritmo cuantitativo para esto?

La razón es bastante sencilla e intuitiva: a día de hoy existen más de 65.000 fondos de inversión disponibles en España para su contratación. No es posible reunirse con todos los gestores de los fondos para realizar un análisis cualitativo y conocer al detalle su metodología, equipo, sistemas de selección, riesgos, etc, etc. que sería lo ideal.

Al mismo tiempo, y esto es un sesgo personal, cuando a lo largo de mi carrera profesional he ido conociendo a multitud de gestores creo que no hay ninguno que no me haya parecido estupendo. Todos demuestran gran profesionalidad y pasión por su trabajo y desde luego tienen gran capacidad de convicción; por no hablar de los equipos de ventas, que son auténticas máquinas de esgrimir argumentos a favor de los fondos que representan o encontrar ventanas temporales en las que sus fondos lo han hecho muy bien.

Por otro lado, también es muy habitual en la industria el uso de dos herramientas proporcionadas por Morningstar o Refinitiv (antiguo Thompson Reuters Lipper Eikon...) que o bien tienen un gran componente de caja negra o su cálculo es relativamente básico, muy variable en el tiempo y poco predictivo (porque no pretenden serlo).

Todo esto, y es una opinión personal, me llevaba a pensar que muchas veces en la industria el análisis que se hacía de los fondos era muy superfluo o poco riguroso y/o se acababan seleccionando fondos por lo bien o mal que te habían contado el producto cuando en realidad esto es irrelevante para descubrir si un gestor es bueno o no.

Por todo ello y ante la máxima de que lo que no son cuentas son cuentos, nos liamos la manta a la cabeza y desarrollamos nuestro propio algoritmo de identificación de talento. El hecho de que sea propio no quiere decir ni que sea mejor ni peor que otros, simplemente que al ser nuestro, sabemos de qué pie cojea, cuales son sus fortalezas y debilidades y sobre todo entendemos qué está haciendo.

Y lo llamo talento porque este ejercicio se trata precisamente de eso; si detrás de cada fondo de inversión hay una persona o un equipo o incluso un algoritmo programado por alguien, se trata de identificar quién es sobresaliente y quién no lo es tanto asumiendo otra máxima que es la de la distribución normal del talento. Es decir, de todo el universo de gestores hay unos pocos excepcionales, un número más amplio de personas normales y un porcentaje pequeño de gestores "menos afortunado".

¿En qué se basa nuestra metodología de ranking?

En este punto podríamos decir que cada maestrillo tiene su librillo y que hay tantas metodologías como personas que intentan esto, pero para ilustrar lo que queremos, por ejemplo el diario económico Expansión, mensualmente publica el listado de todos los fondos de inversión, por categoría, ordenados de mayor a menor rentabilidad obtenida por los fondos en los últimos 12 meses. Podríamos haber escogido por ejemplo este mismo criterio, el fondo de cada categoría más rentable en los últimos 12 meses es el que más puntos tiene y así sucesivamente hasta llegar al último.

¿Qué problema tiene esta metodología?

Que no es consistente. Si realizáramos el mismo ejercicio un mes después los resultados cambiarían significativamente con lo que no es un buen criterio de selección puesto que el resultado es tremendamente variable y si lo eligiéramos tenderíamos a ir con el pie cambiado. Seguro que todos hemos leído alguna vez el famoso disclaimer "rentabilidades pasadas no garantizan rentabilidades futuras". Es por este motivo por el que no es un buen sistema aunque a mi me gusta más explicarlo como diferencia entre causa y consecuencia. Y esto es tremendamente importante tenerlo siempre claro cuando hacemos cualquier análisis que busque dependencias o relaciones, qué es una causa y qué es una consecuencia. Y la rentabilidad, es clarísimamente una consecuencia de una serie de decisiones que llevaron a la consecución de esa rentabilidad, pero la rentabilidad en sí misma no puede ser nunca la causa de una rentabilidad futura. Lo que habría que ver es si esas decisiones que provocaron la rentabilidad "x" son repetibles, buscadas o son achacables a un comportamiento específico de un tipo de compañías etc.

Cuando decía que la rentabilidad en un punto es muy variable y que por tanto no es consistente para ser tomada en consideración como única medida en un modelo de ranking me refiero a esto:

Si tuviéramos estos que elegir entre estos dos productos, es fácil ver como si la medida de rentabilidad es tomada al final de la serie, el fondo A es mejor que el B, pero si el instante temporal en el que tomamos la foto es t1 el fondo B es mejor que el A y en t2 lo contrario. Es decir, entre estos dos fondos, tener en cuenta la rentabilidad para ordenarlos es un criterio que va a hacer que el resultado varíe enormemente en el tiempo y lo que es peor, si lo tomáramos como medida para invertir, siempre elegiríamos el fondo A en los peores momentos. Viendo este gráfico es sencillo intuir que hacen falta más medidas a parte de la propia rentabilidad en un único periodo. El modelo Expansión para seleccionar fondos de inversión NO funciona.

En nuestro modelo, en concreto, usamos 17 medidas del comportamiento histórico del producto que explicadas en lenguaje coloquial serían:

Retorno anualizado (rentabilidad): La ganancia o pérdida en términos porcentuales y anualizada obtenida por una inversión en un periodo determinado Volatilidad: Mide el tamaño de las desviaciones de la rentabilidad respecto a su media. Para contextualizar, la renta variable se mueve de media un 17% y la renta fija un 5% Sharpe: Mide la rentabilidad por cada unidad de riesgo (volatilidad) que se asume. Cifras a cercanas a 1 o superiores son muy buenas. Este ratio es MUY IMPORTANTE Omega: Mide si la probabilidad de obtener ganancias es mayor que la de obtener pérdidas. Lecturas por encima de 1 son muy positivas. Muy importante en fondos de retorno absoluto Mayor caída: Mide la mayor caída que haya tenido el fondo en el plazo que se considere expresado en porcentaje

Calmar: Variación sobre el ratio de sharpe que utiliza la mayor caída en lugar de la volatilidad como medida de riesgo. Mide la rentabilidad conseguida por cada unidad de riesgo máximo asumido. Cuanto mayor mejor Tiempo de recuperación: Mide el tiempo que ha tardado el inversor que compró el fondo en el peor momento (en un máximo) en recuperar su inversión Sortino: Variación del ratio de sharpe, utilizando como medida de riesgo solo las desviaciones negativas en lugar de la volatidad. Mide la rentabilidad conseguida por cada unidad de riesgo asumido en las caídas Downside risk: Mide las desviaciones del fondo respecto a la media pero solo cuando éstas son negativas Tracking error: Mide lo que se desvía el fondo respecto del índice de referencia para ver si se asume mucho riesgo relativo. Muy importante para ver si el fondo es de gestión activa o pasiva. Cuanto más cercano a 0, más pasivo Information ratio: Mide si las desviaciones respecto al índice que conforman el tracking error aportan o destruyen valor. Cuanto mayor mejor Correlación: Mide si las rentabilidades del fondo y el índice se mueven en la misma dirección. El mínimo es -1 que quiere decir que hacen lo opuesto y el máximo 1 que quiere decir que se mueven igual Beta: Mide cómo es la intensidad de movimientos del fondo respecto al índice. Por encima de 1 los amplifica y por debajo de 1 los mitiga Alpha: Mide la diferencia de rentabilidad entre el gestor y el índice. Muestra si el fondo aporta valor o no, respecto al índice Treynor: Mide la aportación de rentabilidad del gestor sobre el índice pero corregida por la beta. Es decir, a la hora de medir lo que se aporta, esto se corrige por el riesgo sistemático Bull beta: Mide como es la intensidad de movimientos del fondo respecto al índice pero solo cuando estos son positivos. Si es mayor que 1 quiere decir que el fondo sube más que el índice Bear beta: Mide como es la intensidad de movimientos del fondo respecto al índice pero solo cuando estos son negativos. Si es menor que 1 quiere decir que el fondo cae menos que el índice

Además, todas estas medidas las calculamos en varios periodos, 1, 2, 3, 4 y 5 últimos años. Es decir que para cada fondo en su categoría tendríamos 85 ratios o medias de comportamiento (17x5).

¿Cómo se calcula el ranking con toda esa información?

Antes de seguir avanzando, y teniendo ya claro que lo que vamos a tratar de hacer es establecer un ranking de productos por cada categoría para comparar peras con peras y manzanas con manzanas y que nuestra materia prima (la información de la que disponemos) son esos 85 ratios por cada fondo, suelo hacer un paralelismo que a mi juicio facilita bastante la comprensión del proceso.

Supongamos que tenemos alumnos de penúltimo curso de bachillerato (por decir algo) y nuestro objetivo es establecer un ranking de los mismos con la idea de seleccionar aquellos estudiantes que creemos obtendrán mejores calificaciones en el siguiente semestre. Para ello disponemos de todo el expediente académico de los alumnos de los últimos 5 años. Nosotros en lugar de alumnos tenemos fondos y en lugar de asignaturas, ratios, pero conceptualmente el problema es el mismo.

Podríamos pensar en seleccionar a ojo aquellas asignaturas que nos parecen más relevantes y darles más peso en el ranking pero si tenemos un número muy elevado como es nuestro caso, esto no resulta sencillo, además desde un punto de vista metodológico tenemos el problema de que muchas asignaturas o ratios están correlacionados, las matemáticas de primero con las de segundo, etc. o la rentabilidad del último año está incluida dentro de la de 3 ó 5 años. Para este ejercicio de discriminación, lo mejor sería tener pocas asignaturas o ratios pero que estos fueran ortogonalmente independientes.¿Qué quiere decir esto? Que tuviéramos una especie de agregadores de asignaturas o ratios que reflejaran la mayor parte de información que contiene nuestra muestra (la varianza) pero que fueran en número mucho menores. Con un ejemplo lo veremos más fácil. Si fuéramos preguntando a todos los alumnos sus calificaciones en Matemáticas y Física no saldría una nube de puntos de este estilo:

Donde lo que me interesa del gráfico es que se observa que ambas variables están correlacionadas positivamente, es decir, hay muchos alumnos que tienen calificaciones altas en ambas materias y bajas en ambas y es raro el alumno que es un portento en Matemáticas y obtiene pésimas calificaciones en Física. Seguro que a más de un lector le está viniendo a la cabeza el concepto de "Ciencias" y está intuyendo que esa correlación se debe a que estamos graficando dos asignaturas que pertenecen al campo de las ciencias. Pues con los ratios nos paso lo mismo, a pesar de tener 85 ratios (ejes o dimensiones), la mayor parte de información disponible en todos ellos (la famosa varianza) se puede expresar con un número mucho menor de los mismos. Para ello nosotros usamos un algoritmo de reducción de dimensionalidad llamado Análisis de Componentes Principales (PCA), que es más antiguo que la pana, aunque ahora forma parte de los algoritmos que se estudian dentro del archiconocido Machine Learning o Inteligencia Artificial.

En resumidas cuentas, lo que vamos a tratar de hacer es ver qué asignaturas o ratios tienen información de verdad para nuestro objetivo con la idea de dar más peso a aquellas asignaturas o ratios que separen mejor a los alumnos o fondos buenos de los malos. Estamos buscando precisamente aquellas asignaturas en las que hay más varianza, un porcentaje pequeño de notas altísimas, un porcentaje mayor de notas normales y un porcentaje bajo de notas muy malas. No nos sirven para hacer un ranking aquellas asignaturas que las han aprobado todos los alumnos con muy buena nota ni aquellos ratios en las que hay muy poca dispersión de resultados, queremos dar más peso aquellos en los que es más fácil identificar a los buenos.

Pues todo esto lo hace el PCA, y es muy chulo porque es objetivo, no establecemos ningún sesgo a priori, es adaptativo en tiempo y categoría, los pesos no son iguales para todas las facultades o para todas las categorías de fondos ni son iguales ahora que hace 10 años, si no que ratios que antes no eran importantes ahora sí pueden serlo y viceversa.

Con toda esta información, obtener nuestra nota para cada alumno o fondo y hacer un ranking en base a ella ya sería relativamente sencillo puesto que podemos ordenar los alumnos o fondos por cada asignatura y multiplicar su posición en el ranking de esa asignatura por el peso que el modelo PCA le da a cada asignatura o ratio, solo nos quedaría sumarlo y ya tendríamos el primer paso de nuestro ranking.

Si alguien sigo vivo a estas alturas se ha ganado que ponga algún gráfico que ilustre un poco qué estamos buscando y para ello me voy a basar en el gráfico que más me gusta para analizar el comportamiento pasado de un fondo, vamos por partes.

En el gráfico anterior vamos a reflejar una cosa muy tonta, en el eje horizontal vamos a representar la rentabilidad del índice, en este caso el MSCI Europe con dividendos porque vamos a centrarnos en fondos de Renta Variable Europea, y en el eje vertical, lo mismo, de tal forma que obtenemos una línea recta con pendiente 1, que quiere decir algo tan tonto, como: Si el índice sube un 14,65% y yo estoy invertido en el índice gano un 14,65% y si baja un -15,35% yo pierdo un -15,35%.

Esto que es muy tonto, es lo que tengo que mejorar o batir si decido invertir en un fondo de gestión activa, si el fondo en el que yo invierto no consigue mejorar esto es mejor que invierta en un fondo de gestión pasiva que va a tener un comportamiento prácticamente igual que el del índice y encima es más barato. En resumidas cuentas, lo que queremos es buscar fondos que tengan un comportamiento paralelo por encima, que quiere decir, que cuando suba el índice, suban más que él y si cae el índice caigan menos (sería ideal que no cayeran pero eso no sería muy normal).

Vamos ahora añadir los datos de un fondo sobre el mismo gráfico que teníamos:

Cada puntito verde representa ahora la rentabilidad en 12 meses que ha obtenido el fondo a cada rentabilidad del índice. Es decir, un punto verde será la rentabilidad desde 1 enero de 2018 a 1 de enero de 2019, otro punto será la rentabilidad desde 8 de enero a 8 de enero, y así con cada semana (a esto se le llama rolling semanal). En este gráfico por tanto estamos viendo rentabilidades 12 meses rolling semanal de los últimos 3 años del fondo contra el índice y lo que se ve es que no hay ningún periodo de 12 meses en que este fondo lo haya hecho peor que su índice, siempre lo bate y por mucho normalmente, es un fondo muy consistente a la hora de batir a su índice de referencia. Esto es lo que el modelo final va a premiar y sobre todo separarlo de fondos como el siguiente:

En este caso se aprecia fácilmente cómo el fondo siempre lo hace peor que su índice de referencia.

Creo que por esta entrada ya es suficiente, para la próxima dejo la explicación de las redes neuronales en las que metemos todos estos datos en la búsqueda de obtener un modelo predictivo que nos diga qué fondo es más probable que bata a su índice de referencia en el siguiente periodo.