martes, 8 de agosto de 2017

LA ANALÍTICA DE DATOS Y SU IMPORTANCIA PARA LAS INSTITUCIONES DE MICROFINANZAS

Leía en relación a la estrategia de analítica predictiva una frase atribuida a Mark Twain: “La mayoría de la gente utiliza las estadísticas de la misma forma en que un borracho utilizaría un poste de la luz, más por el apoyo que por la iluminación”, en este sentido y para dilucidar la importancia de una adecuada gestión de datos estadísticos me referiré a la analítica de datos históricos en la determinación de relaciones y tendencias, que es la esencia de un modelo descriptivo, de la rentabilidad sobre el patrimonio (ROE), entendida como la utilidad neta anualizada sobre el patrimonio contable promedio de las Instituciones de Microfinanzas (IMFs) de Perú en los últimos 16 años, particularmente de las Cajas Municipales de Ahorro y Crédito (CMACs). Para esto utilizaré un software estadístico que me permitirá escudriñar en la data mensual de las IMFs, publicadas por la Superintendencia de Banca, Seguros y AFP (SBS) para los años 2001 al 2016, asimismo, para una mejor comprensión la acompañaré con el servicio de inteligencia artificial que me brinda una excelente y poderosa plataforma cloud de refinación, exploración, analítica predictiva y visualización inteligente de datos.


Empecemos, la figura de arriba es una secuencia anual de gráficos box plots o gráfico de caja y bigotes del subsector financiero de las CMACs, sepamos que cada caja contiene el 50% de los datos centrales entre el tercer cuartil (Q3) y el primer cuartil (Q1), cuya diferencia representa un indicador de dispersión estadístico denominado rango intercuartílico (RIC), por lo que la mayor o menor longitud de la caja muestra el grado de dispersión o concentración de la mitad de los datos, la caja también incluye la mediana o el segundo cuartil (Q2), que está representado por una linea horizontal al interior de la caja, al igual que la media, simbolizada por un circulo con una cruz. Por su parte, los bigotes son las lineas verticales que representan al 50% de los datos restantes y que salen de ambos extremos de la caja, algunas veces determinados por sus valores máximos y mínimos cuando los datos caen dentro de los límites superior e inferior, calculados estos por más o menos (+/-) una y media veces el RIC en relación al percentil 75 y 25 respectivamente, aún cuando otras veces los extremos de los bigotes son los valores más próximos o iguales a estos límites, debido a que sus mínimos o máximos son outliers, aquellos datos atípicos que se encuentran fuera de los límites y que distorsionan la media, en la figura hay uno solo de ellos, identificado por un asterisco en el año 2008.

Lo primero que observamos es un ascenso de las gráficas de cajas hasta el 2003, lo que denota un aumento de la mediana en esos tres primeros años, de más del 26% en el 2001 a un poco menos del 33% en el 2003, fíjese además que este crecimiento de la ROE estuvo acompañado por una menor dispersión del RIC, de 2.61 en el 2001 a 1.67 en el 2003, lo que quiere decir que las diferencias en las rentabilidades financieras, en un contexto de crecimiento promedio de todas las CMACs, fue reduciéndose. Sin embargo, al año siguiente, no solo aumentó la dispersión en relación a los tres años anteriores, el RIC aumentó a 3.32 en el 2004 el doble del experimentado en el 2003, sino que también la mediana se derrumbó en más de 5,5 pp con respecto al año anterior, más que la media que lo hizo en 4,8 pp, lo que aglutinó la distribución de las rentabilidades en los valores inferiores, es decir, el 25% de los datos que se encuentran entre Q1 y Q2 están más próximos entre si, que los datos de la misma proporción que se encuentran entre el Q2 y el Q3, sesgando la distribución hacia la derecha, además de que el bigote superior es más largo que el inferior, en concreto, en el 2004 las rentabilidades entre las CMACs además de caer, fueron mayormente diferentes entre ellas en relación a años anteriores.

El 2005 pareció confirmar que el descenso del 2004 fue un exabrupto estadístico, la mediana y la media se recuperaron alrededor del 30% y el RIC se redujo a 1.93, pero observe, ambos valores no recuperaron los niveles del 2003, a partir de allí es otra historia, hubo reducción acelerada de la rentabilidad hasta el 2013, en el que la mediana alcanzó su valor más bajo, 12.64%, una caída de casi 20 pp en relación al 2003, con un hipo el año anterior. A juzgar por los rendimientos de los años sucesivos, pareciera que el 2013 fue el piso de las rentabilidades de las CMACs y que desde el 2013 al 2016 se hubiese instaurado un patrón estacionario con una media de 13.5% y una dispersión, medida por el RIC, de igual o menor que la unidad, que podría indicar una madurez del mercado microfinanciero, dada la fuerte competencia a su interior, particularmente desde el 2002, año en que se permitió que todas las CMACs podían ingresar a cualquier ciudad a nivel nacional, hoy las más grandes Cajas Municipales están en casi todo el país.


Por otra parte, el descenso de la rentabilidad financiera no solo se experimentó en las CMACs, sino también en las otras IMFs, como son las Cajas Rurales (CRACs), Edpymes (EDPs) y Empresas Financieras (EFs), lo cual podemos comprobar en la segunda figura, donde se presenta los valores medios por año del 2001 al 2016 de la ROE para todas las IMFs reguladas y supervisadas por la SBS, a diferencia de la figura anterior de las gráficas box plots en la que se hacía referencia a la mediana y a su nivel de dispersión. Observe las barras de color celeste, que representan a las CMACs, tiene el mismo patrón de comportamiento descrito, pero ahora mire la media de la ROE de las otras IMFs, todas tiene igual patrón de descenso en sus rentabilidades financieras, por ejemplo, las CRACs tuvieron sus mejores años en el 2006 y el 2007, fíjese en la altura de cada barra de color verde, en las que sus rentabilidades fueron de 23.34% y 26.26% respectivamente, para a partir de allí descender hasta registrar valores negativos en crecimiento los últimos 3 años, de -3.02% en el 2014, -6.81% en el 2015 y -7.4% en el 2016. Comportamiento similar tuvieron las EDPs, la barra de color amarillo, cada vez con menor rendimiento hasta volverse negativo en el 2016 con -0.86%, por otro lado, de las EFs no podemos decir algo diferente, sus mejores años fueron 2005 y 2006 con rentabilidades de 41.15% y 47.43% respectivamente, aún cuando en los tres últimos años ha venido aumentando su rentabilidad hasta posicionarse con 14.88% en el 2016.

Entendamos algo más al respecto, en la figura que se presenta a continuación se observa para todo el periodo, la relación entre la rentabilidad financiera y el indicador del Margen Financiero Neto como proporción del ingreso financiero (MFN) por cada subsector de IMFs, la primera fila superior representa a las CMACs y las siguientes a las otras IMFs, puede verse en todos los casos que la intensidad del color verde representa la rentabilidad media, que va desde -7.4% hasta el 47.43%, tal como se mencionó antes, además de que el tamaño de cada recuadro representa el valor del ratio MFN, con valores que van desde 0.43 hasta 0.81, este indicador es importante porque nos puede dar una buena idea del manejo de las tasas de interés por la intermediación y de la gestión sobre las provisiones que también se incluye en el indicador.


Por ejemplo, en relación a las CMACs sus mejores años en materia de ROE fueron del 2001 al 2007, deben notarlo por la intensidad del color verde oscuro, para a partir de allí observar un color verde más claro que denota menor rentabilidad, correspondiendo el tono más bajo al año 2013, tal como lo muestra la gráfica de box plots, pero también vea que los años de mayor ratio del MFN le corresponde a los años 2003 y 2004, con un indicador de 0.71 y 0.69 respectivamente, lo curioso es el año 2004, que según el gráfico de cajas fue el año de menor ROE antes de empezar su descenso acelerado, porque registra la segunda razón del MFN más alta de los últimos 16 años, ratio que no se ha alcanzado a la fecha, aún cuando en el 2016 fue de 0.64, que por cierto viene creciendo desde el 2013, lo cual es bueno, por que hace suponer un adecuado manejo de tasas de interés, pero que esta acompañado con una rentabilidad financiera bastante menor que los primeros años, por lo menos hasta el 2009, quizás porque el índice de capital corriente o el de capital fijo aumentaron en el tiempo, lo cual podría indicar un uso cada vez menos eficiente del patrimonio contable por unidad monetaria de ingresos financieros, lo que podría suponer a su vez la existencia de un exceso de liquidez, que no se lograría intermediar por la rivalidad competitiva existente, aunque muchas veces es preferible tenerla a no contar con ella cuando se la necesita. Asimismo, en relación a las demás IMFs, definitivamente las EFs se llevan el galardón de los ratios más altos del MFN, pero solo los primeros años, con recuadros grandes, como el del año 2005 en el que registró un valor de 0.81, para después descender notoriamente hasta estar detrás de las CMACs en los últimos 3 años, pero vea el recuadro del 2016, si bien es más pequeño que el de las CMACs tiene un color más intenso, es decir, la ROE de las EFs de 14.88% fue mayor al 14.52% de las Cajas, con un ratio de MFN menor de 0.56 contra 0.64 respectivamente, lo que denotaría en última instancia un uso más eficiente de los recursos.

Por último, es básico comprender que una adecuada gestión de cualquier base de datos, tanto internos como externos, no debe recaer únicamente en la responsabilidad de las unidades tecnológicas, como la mayoría de las veces sucede, porque no basta con extraer, transformar y cargar los datos en un data marts, se requiere un involucramiento total de quienes tienen compromiso estratégico funcional - la alta dirección -, en la implementación de procesos analíticos y predictivos, aún cuando esto debería interiorizarse en la cultura de toda la organización, porque los datos dan visibilidad de patrones o tendencias que deben ser claramente identificas para una adecuada y oportuna toma de decisiones, como lo que acabamos de observar con la rentabilidad financiera, que debería conducir a preguntarse, entre otras cosas, si los niveles actuales de ROE están o no superando el costo del capital, que es lo que los inversionistas o propietarios deberían de exigir como mínimo, ya que la rentabilidad no se mide en términos de resultados monetarios, sino en proporción al rendimiento de cada unidad de patrimonio, y más aún en tasas reales y no nominales, pero ¿por qué convendría la analítica de datos en estos casos?, porque no habría otra manera de hacerles saber a las IMFs que deberían obligarse a reconfigurar sus cadenas de valor para lograr diferenciarse y crear valía a sus accionistas, el contexto es totalmente diferente al de hace 16 años, no basta contar con nuevos productos o nuevos canales de atención, que por cierto las nuevas tecnologías las facilitan mucho, sino que se vuelve fundamental, además de la vinculación formal, crear vínculos emocionales que perduren en el tiempo, pero para que esto ocurra debe personalizarse el tratamiento de la información de los clientes y los datos son esos conectores que deberían ayudar en ese propósito.

Recuerdo lo risible que le produjo a un Data Scientist cuando le preguntaron con cuantos cientos de miles, por no decir millones, de datos había trabajado, como si solo el volumen importara y no la velocidad, variedad, veracidad y valor de los datos, y tampoco las diferentes disciplinas que uno debe conocer para leer adecuadamente la información, para precisamente transformarla en ventaja competitiva a través de Data Mining, por eso es elemental entender que la analítica predictiva no es propiedad exclusiva de las unidades de TIC, después de todo bastaría con empezar con la Dark Data estructurada y no estructurada que toda organización almacena y que no explota y no le da valor. Quien no entienda que no se puede gestionar lo que no se sabe comprender y menos aún medir, parecerá un ferviente devoto de la utilización de un poste de luz solo como apoyo, quizás porque terminó de digerir otra frase de Mark Twain “Hay tres clases de mentiras: las mentiras, las malditas mentiras y las estadísticas”.

© Copyright, este artículo puede ser distribuido libremente, siempre y cuando, se cite al autor.