viernes, 22 de septiembre de 2017

LA SIMULACIÓN MONTE CARLO DEL MODELO DUPONT

En esta oportunidad deseo centrarme en intentar modelar, a través del método de simulación de Monte Carlo, la incertidumbre alrededor de la rentabilidad financiera, que como lo he señalado en anteriores posts, está referida al rendimiento sobre el patrimonio (ROE) y que a diferencia de otras expresiones esta vez lo haré bajo una extensión ad hoc del modelo Dupont, que puede presentarse del siguiente modo para cualquier Institución de Microfinanzas (IMF):

                          ROE = (MFN/IF - GA/IF - OG/IF) * IF/A * A/P  

Donde:

IF     = Ingresos Financieros.
A      = Activos.
P      = Patrimonio.
MFN = Margen Financiero Neto.
GA   = Gastos Administrativos.
OG   = Otros Gastos.

La data que utilizaré es la que está disponible en el repositorio estadístico de la Superintendencia de Banca, Seguros y AFP (SBS) de Perú, en relación a los años 2012, 2013 y 2014 de la Caja Rural de Ahorro y Crédito Señor de Luren antes de su intervención en junio del 2015, el objetivo es doble; primero, satisfacer la curiosidad que debió reinar al interior de su directorio al cierre del 2014, sobre la probabilidad de seguir incurriendo en rendimientos negativos en el futuro inmediato, dado el performance de la institución, particularmente la del último año, un análisis semejante hubiera ayudado a discernir sobre las razones de la delicada situación financiera por la que atravesaba la IMF, y en segundo lugar, visualizar la importancia de utilizar este tipo de herramientas de análisis predictivo.

En principio, debemos aclarar que las cuentas del activo y el patrimonio de la ecuación de la ROE se presentan como promedios y las partidas que corresponden al estado de resultados se presentan de forma anualizada. Asimismo, para una mejor comprensión debemos sostener que el Margen Financiero Neto está constituido por los ingresos financieros menos los gastos financieros y las provisiones, por su parte la cuenta Otros Gastos, que se ha inferido de las estadísticas extraídas, agrupan todos aquellos, incluidos los impuestos, que están fuera de los Gastos Administrativos y de los demás ya descontados, en otras palabras, lo que está entre paréntesis no es más que la Utilidad Neta sobre los Ingresos Financieros o Margen de Utilidad, tal como lo señala el modelo Dupont, pero que en esta oportunidad se presenta desagregado.

Aquí viene lo más complicado, especificar la forma de las distribuciones de probabilidad de cada una de las variables del modelo de la ROE, lo primero que debemos saber es que hay que distinguir entre variables de suposición y variables de salida, para luego ejecutar el número de ensayos que uno juzgue conveniente aplicar al modelo, esta vez serán 80,000 las pruebas que se aplicarán a través de valores aleatorios tomados de las distribuciones de probabilidad de las variables de suposición, definitivamente esto solo es posible a través de un middleware, el cual permite enlazar sistemas colaborativos, esta vez se está utilizando un aplicativo basado en una hoja de cálculo que ayuda a elaborar modelos de previsión, simulación y optimización.

Las variables inciertas o de suposición son todas las que componen la fórmula de la ROE, que son las que están a la derecha de la ecuación, y la variable de salida o de resultado es la misma rentabilidad financiera o ROE. A continuación, se presenta la primera variable incierta, el Gasto de Administración por unidad de Ingreso Financiero (GA/IF), cuya distribución de probabilidad de Weibull fue ajustada para los datos históricos de los tres años según el estadístico Anderson-Darling (AD), tal como se presenta en la gráfica, este mismo tratamiento se seguirá con las siguientes variables de suposición. Ahora es el turno de la variable Otros Gastos por unidad de Ingreso Financiero (OG/IF), cuyos valores históricos se ajustan, según el estadístico AD, a una distribución logística con una media de 0.03, con +/- 1 desviación estándar, tal como se muestra en la segunda gráfica.

A continuación, se presentan las dos variables originales del modelo dupont, la rotación de los activos (IF/A) con una distribución Beta y el multiplicador del capital (A/P) con su respectiva distribución de probabilidad de Extremo mínimo, para el tiempo considerado y ajustadas por el estadístico AD, incluyendo sus medias y desviaciones estándar correspondientes, que como veremos en la matriz de correlación no tienen mayor relación con la rentabilidad financiera.



Se ha dejado al final como variable de suposición al Margen Financiero Neto por unidad de Ingreso Financiero (MFN/IF), porque la variable está fuertemente correlacionada con la rentabilidad financiera o ROE, debido a que ella refleja la gestión sobre las tasas activas y pasivas, además de las pérdidas previstas, que como sabemos representan el core business de cualquier IMF, puede observarse en la matriz que la correlación positiva existente de esta variable es de 0.89, también revisten importancia las correlaciones negativas de los Gastos de Administración con un -0.37 y de la variable Otros Gastos con un coeficiente de -0.19, las restantes correlaciones son prácticamente cero, lo que evidencia que no hay mayor relación entre las variables. Por otra parte, estos coeficientes de correlación no tienen mayor variación cualquiera fuese los dos escenarios que planteamos enseguida, sobre el valor más probable de la media de la distribución de probabilidad del MFN/IF.

Por tanto, dada la importancia del indicador del MFN se ha creído conveniente, a diferencia de las otras variables de suposición, cuyas distribuciones de probabilidad se ajustaron a los datos históricos, suponer una distribución de probabilidad triangular, en la que los valores mínimo y máximo corresponden al periodo analizado, sin embargo, para el valor más probable se ha supuesto dos escenarios; el primero de ellos como la media de los años 2013 y 2014 y el segundo escenario con la media del último año, supuestos válidos dado el desempeño histórico de la IMF antes de su intervención y en vista de que este valor recoge con más probabilidad de ocurrencia los valores aleatorios próximos a ella, más que los valores mínimo y máximo.

Lo expresado se observa en las distribuciones de probabilidad triangulares del gráfico anterior, correspondiendo a la de la izquierda un valor más probable de media de 0.35 y a la distribución del lado derecho un valor de media de 0.30, esta última muestra un sesgo a la derecha. Por último, mostradas las distribuciones de probabilidad de cada una de las variables de suposición del modelo dupont y planteados ambos escenarios, se presenta la distribución de probabilidad de la variable de salida o ROE para cada supuesto en el siguiente gráfico.

El gráfico de la variable de salida de la izquierda (ROE 1), con base en la información histórica y el supuesto de un valor de media más probable de 0.35, muestra una probabilidad o certeza del 62% de que la Caja Señor de Luren continuaría con un rendimiento financiero negativo, dicho de otro modo, existía solo un 38% de certeza de que la Caja tuviera una ROE o rentabilidad financiera positiva, peor aún, si consideramos como valor más probable una media de 0.30 del indicador de Margen Financiero Neto, la probabilidad de generar una rentabilidad positiva se reducía a 25%, o lo que es lo mismo, que la probabilidad de continuar con una rentabilidad financiera negativa sería ahora de 75% (ROE 2), por lo tanto, existían altas probabilidades de que la situación financiera de la empresa no mejoraría, por lo menos no en el muy corto plazo. Esta información debió estar a disposición de los miembros del directorio para que pudieran adoptar las acciones necesarias y suficientes para el cambio de tendencia, al parecer esto no fue lo que sucedió dado los resultados del primer trimestre del 2015, que terminaron por confirmar el panorama negativo de la IMF y su intervención por el regulador.

© Copyright, este artículo puede ser distribuido libremente, siempre y cuando, se cite al autor.

martes, 8 de agosto de 2017

LA ANALÍTICA DE DATOS Y SU IMPORTANCIA PARA LAS INSTITUCIONES DE MICROFINANZAS

Leía en relación a la estrategia de analítica predictiva una frase atribuida a Mark Twain: “La mayoría de la gente utiliza las estadísticas de la misma forma en que un borracho utilizaría un poste de la luz, más por el apoyo que por la iluminación”, en este sentido y para dilucidar la importancia de una adecuada gestión de datos estadísticos me referiré a la analítica de datos históricos en la determinación de relaciones y tendencias, que es la esencia de un modelo descriptivo, de la rentabilidad sobre el patrimonio (ROE), entendida como la utilidad neta anualizada sobre el patrimonio contable promedio de las Instituciones de Microfinanzas (IMFs) de Perú en los últimos 16 años, particularmente de las Cajas Municipales de Ahorro y Crédito (CMACs). Para esto utilizaré un software estadístico que me permitirá escudriñar en la data mensual de las IMFs, publicadas por la Superintendencia de Banca, Seguros y AFP (SBS) para los años 2001 al 2016, asimismo, para una mejor comprensión la acompañaré con el servicio de inteligencia artificial que me brinda una excelente y poderosa plataforma cloud de refinación, exploración, analítica predictiva y visualización inteligente de datos.


Empecemos, la figura de arriba es una secuencia anual de gráficos box plots o gráfico de caja y bigotes del subsector financiero de las CMACs, sepamos que cada caja contiene el 50% de los datos centrales entre el tercer cuartil (Q3) y el primer cuartil (Q1), cuya diferencia representa un indicador de dispersión estadístico denominado rango intercuartílico (RIC), por lo que la mayor o menor longitud de la caja muestra el grado de dispersión o concentración de la mitad de los datos, la caja también incluye la mediana o el segundo cuartil (Q2), que está representado por una linea horizontal al interior de la caja, al igual que la media, simbolizada por un circulo con una cruz. Por su parte, los bigotes son las lineas verticales que representan al 50% de los datos restantes y que salen de ambos extremos de la caja, algunas veces determinados por sus valores máximos y mínimos cuando los datos caen dentro de los límites superior e inferior, calculados estos por más o menos (+/-) una y media veces el RIC en relación al percentil 75 y 25 respectivamente, aún cuando otras veces los extremos de los bigotes son los valores más próximos o iguales a estos límites, debido a que sus mínimos o máximos son outliers, aquellos datos atípicos que se encuentran fuera de los límites y que distorsionan la media, en la figura hay uno solo de ellos, identificado por un asterisco en el año 2008.

Lo primero que observamos es un ascenso de las gráficas de cajas hasta el 2003, lo que denota un aumento de la mediana en esos tres primeros años, de más del 26% en el 2001 a un poco menos del 33% en el 2003, fíjese además que este crecimiento de la ROE estuvo acompañado por una menor dispersión del RIC, de 2.61 en el 2001 a 1.67 en el 2003, lo que quiere decir que las diferencias en las rentabilidades financieras, en un contexto de crecimiento promedio de todas las CMACs, fue reduciéndose. Sin embargo, al año siguiente, no solo aumentó la dispersión en relación a los tres años anteriores, el RIC aumentó a 3.32 en el 2004 el doble del experimentado en el 2003, sino que también la mediana se derrumbó en más de 5,5 pp con respecto al año anterior, más que la media que lo hizo en 4,8 pp, lo que aglutinó la distribución de las rentabilidades en los valores inferiores, es decir, el 25% de los datos que se encuentran entre Q1 y Q2 están más próximos entre si, que los datos de la misma proporción que se encuentran entre el Q2 y el Q3, sesgando la distribución hacia la derecha, además de que el bigote superior es más largo que el inferior, en concreto, en el 2004 las rentabilidades entre las CMACs además de caer, fueron mayormente diferentes entre ellas en relación a años anteriores.

El 2005 pareció confirmar que el descenso del 2004 fue un exabrupto estadístico, la mediana y la media se recuperaron alrededor del 30% y el RIC se redujo a 1.93, pero observe, ambos valores no recuperaron los niveles del 2003, a partir de allí es otra historia, hubo reducción acelerada de la rentabilidad hasta el 2013, en el que la mediana alcanzó su valor más bajo, 12.64%, una caída de casi 20 pp en relación al 2003, con un hipo el año anterior. A juzgar por los rendimientos de los años sucesivos, pareciera que el 2013 fue el piso de las rentabilidades de las CMACs y que desde el 2013 al 2016 se hubiese instaurado un patrón estacionario con una media de 13.5% y una dispersión, medida por el RIC, de igual o menor que la unidad, que podría indicar una madurez del mercado microfinanciero, dada la fuerte competencia a su interior, particularmente desde el 2002, año en que se permitió que todas las CMACs podían ingresar a cualquier ciudad a nivel nacional, hoy las más grandes Cajas Municipales están en casi todo el país.


Por otra parte, el descenso de la rentabilidad financiera no solo se experimentó en las CMACs, sino también en las otras IMFs, como son las Cajas Rurales (CRACs), Edpymes (EDPs) y Empresas Financieras (EFs), lo cual podemos comprobar en la segunda figura, donde se presenta los valores medios por año del 2001 al 2016 de la ROE para todas las IMFs reguladas y supervisadas por la SBS, a diferencia de la figura anterior de las gráficas box plots en la que se hacía referencia a la mediana y a su nivel de dispersión. Observe las barras de color celeste, que representan a las CMACs, tiene el mismo patrón de comportamiento descrito, pero ahora mire la media de la ROE de las otras IMFs, todas tiene igual patrón de descenso en sus rentabilidades financieras, por ejemplo, las CRACs tuvieron sus mejores años en el 2006 y el 2007, fíjese en la altura de cada barra de color verde, en las que sus rentabilidades fueron de 23.34% y 26.26% respectivamente, para a partir de allí descender hasta registrar valores negativos en crecimiento los últimos 3 años, de -3.02% en el 2014, -6.81% en el 2015 y -7.4% en el 2016. Comportamiento similar tuvieron las EDPs, la barra de color amarillo, cada vez con menor rendimiento hasta volverse negativo en el 2016 con -0.86%, por otro lado, de las EFs no podemos decir algo diferente, sus mejores años fueron 2005 y 2006 con rentabilidades de 41.15% y 47.43% respectivamente, aún cuando en los tres últimos años ha venido aumentando su rentabilidad hasta posicionarse con 14.88% en el 2016.

Entendamos algo más al respecto, en la figura que se presenta a continuación se observa para todo el periodo, la relación entre la rentabilidad financiera y el indicador del Margen Financiero Neto como proporción del ingreso financiero (MFN) por cada subsector de IMFs, la primera fila superior representa a las CMACs y las siguientes a las otras IMFs, puede verse en todos los casos que la intensidad del color verde representa la rentabilidad media, que va desde -7.4% hasta el 47.43%, tal como se mencionó antes, además de que el tamaño de cada recuadro representa el valor del ratio MFN, con valores que van desde 0.43 hasta 0.81, este indicador es importante porque nos puede dar una buena idea del manejo de las tasas de interés por la intermediación y de la gestión sobre las provisiones que también se incluye en el indicador.


Por ejemplo, en relación a las CMACs sus mejores años en materia de ROE fueron del 2001 al 2007, deben notarlo por la intensidad del color verde oscuro, para a partir de allí observar un color verde más claro que denota menor rentabilidad, correspondiendo el tono más bajo al año 2013, tal como lo muestra la gráfica de box plots, pero también vea que los años de mayor ratio del MFN le corresponde a los años 2003 y 2004, con un indicador de 0.71 y 0.69 respectivamente, lo curioso es el año 2004, que según el gráfico de cajas fue el año de menor ROE antes de empezar su descenso acelerado, porque registra la segunda razón del MFN más alta de los últimos 16 años, ratio que no se ha alcanzado a la fecha, aún cuando en el 2016 fue de 0.64, que por cierto viene creciendo desde el 2013, lo cual es bueno, por que hace suponer un adecuado manejo de tasas de interés, pero que esta acompañado con una rentabilidad financiera bastante menor que los primeros años, por lo menos hasta el 2009, quizás porque el índice de capital corriente o el de capital fijo aumentaron en el tiempo, lo cual podría indicar un uso cada vez menos eficiente del patrimonio contable por unidad monetaria de ingresos financieros, lo que podría suponer a su vez la existencia de un exceso de liquidez, que no se lograría intermediar por la rivalidad competitiva existente, aunque muchas veces es preferible tenerla a no contar con ella cuando se la necesita. Asimismo, en relación a las demás IMFs, definitivamente las EFs se llevan el galardón de los ratios más altos del MFN, pero solo los primeros años, con recuadros grandes, como el del año 2005 en el que registró un valor de 0.81, para después descender notoriamente hasta estar detrás de las CMACs en los últimos 3 años, pero vea el recuadro del 2016, si bien es más pequeño que el de las CMACs tiene un color más intenso, es decir, la ROE de las EFs de 14.88% fue mayor al 14.52% de las Cajas, con un ratio de MFN menor de 0.56 contra 0.64 respectivamente, lo que denotaría en última instancia un uso más eficiente de los recursos.

Por último, es básico comprender que una adecuada gestión de cualquier base de datos, tanto internos como externos, no debe recaer únicamente en la responsabilidad de las unidades tecnológicas, como la mayoría de las veces sucede, porque no basta con extraer, transformar y cargar los datos en un data marts, se requiere un involucramiento total de quienes tienen compromiso estratégico funcional - la alta dirección -, en la implementación de procesos analíticos y predictivos, aún cuando esto debería interiorizarse en la cultura de toda la organización, porque los datos dan visibilidad de patrones o tendencias que deben ser claramente identificas para una adecuada y oportuna toma de decisiones, como lo que acabamos de observar con la rentabilidad financiera, que debería conducir a preguntarse, entre otras cosas, si los niveles actuales de ROE están o no superando el costo del capital, que es lo que los inversionistas o propietarios deberían de exigir como mínimo, ya que la rentabilidad no se mide en términos de resultados monetarios, sino en proporción al rendimiento de cada unidad de patrimonio, y más aún en tasas reales y no nominales, pero ¿por qué convendría la analítica de datos en estos casos?, porque no habría otra manera de hacerles saber a las IMFs que deberían obligarse a reconfigurar sus cadenas de valor para lograr diferenciarse y crear valía a sus accionistas, el contexto es totalmente diferente al de hace 16 años, no basta contar con nuevos productos o nuevos canales de atención, que por cierto las nuevas tecnologías las facilitan mucho, sino que se vuelve fundamental, además de la vinculación formal, crear vínculos emocionales que perduren en el tiempo, pero para que esto ocurra debe personalizarse el tratamiento de la información de los clientes y los datos son esos conectores que deberían ayudar en ese propósito.

Recuerdo lo risible que le produjo a un Data Scientist cuando le preguntaron con cuantos cientos de miles, por no decir millones, de datos había trabajado, como si solo el volumen importara y no la velocidad, variedad, veracidad y valor de los datos, y tampoco las diferentes disciplinas que uno debe conocer para leer adecuadamente la información, para precisamente transformarla en ventaja competitiva a través de Data Mining, por eso es elemental entender que la analítica predictiva no es propiedad exclusiva de las unidades de TIC, después de todo bastaría con empezar con la Dark Data estructurada y no estructurada que toda organización almacena y que no explota y no le da valor. Quien no entienda que no se puede gestionar lo que no se sabe comprender y menos aún medir, parecerá un ferviente devoto de la utilización de un poste de luz solo como apoyo, quizás porque terminó de digerir otra frase de Mark Twain “Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas”.

© Copyright, este artículo puede ser distribuido libremente, siempre y cuando, se cite al autor.