Algunos principios de Data & Analytics en MACH (el cuarto te va a sorprender)

Marc Martinez de Albeniz
MACHticables
Published in
4 min readAug 3, 2022

En MACH usamos datos y analítica para tomar mejores decisiones: bajar el fraude, personalizar campañas comerciales o atender rápidamente a clientes. Estas decisiones se mejoran con el uso de algoritmos de machine learning.

Varios equipos en D&A abordan estos flujos de datos: Data Engineers, Machine Learning Engineers y Data Scientists. Un equipo motivado por lograr que los datos hablen y se utilicen para (casi) todo.

Además tenemos la suerte de ser nativos digitales y de tener una arquitectura de datos bastante limpia. Otros bancos incumbentes navegan la complejidad de evolucionar un modelo de negocio y tecnológico hacia prácticas modernas de forma gradual (¡arreglar un avión en pleno vuelo!). Eso sí que es complicado.

Arquitectura de datos de Alto nivel

Quería escribir algo sobre Data & Analytics, y se me ocurrió compartir algunos principios guía. Si no les gustan, tengo otros.

1. Autonomía.

Es clave tener equipos autónomos que trabajan con pocas dependencias, y lograr que toda la organización pueda autoatenderse con datos (kudos a Amplitude ahí). En MACH, los equipos de Data Scientists están acoplados a Data Engineers y otros roles multidisciplinarios en squads con foco en el cliente: ambos pueden llegar a producción con reglas claras y seguras. Los squads actúan como dueños y no pierden la vista punta a punta de la experiencia.

2. Sostenibilidad.

En MACH seguimos creciendo y eso impacta en el número de personas que ingresan al área. Necesitamos un diseño de procesos que soporte la incorporación de nuevas personas. Documentamos y cuando llega una persona nueva al equipo tiene que ser autosuficiente en 3 semanas. Si no, estamos fallando como equipo, y no seremos sostenibles en el tiempo. Y también necesitamos velocidad. La velocidad es lo más importante para competir en un entorno en disrupción: solo con velocidad puedes explorar y encontrar la dirección correcta, y no al revés. La capacidad de moverse rápido tiene además un efecto anti-intuitivo: reduce el riesgo. Hemos realizado 311 PR el último mes y más del 60% de nuestro equipo son talentos nuevos.

Repetición continua vs crecimiento compuesto — Visualize Value

3. Reutilización.

Operadores de airflow, modelos analíticos y artefactos son reutilizables entre squads. Arquitectura de datos vela por su consistencia y democratización. Por ejemplo, el feature store -repositorio de características de clientes- es reusado de forma centralizada por nuestros modelos y servicios de datos. Más de 700 variables productivas para llegar y usar.

4. Pragmatismo.

Evitamos la sobre-ingeniería. Las mejores soluciones son simples, y somos cuidadosos en introducir complejidad. También a nivel de metodología analítica, enfocamos las preguntas con concreción, con el negocio y el cliente en el centro. La clave está más en el enfoque y la integración de datos que en la técnica estadística. Estandarizamos: el 90% de modelos son XGBoost supervisados. El resto de aplicaciones son más adhoc, como los recomendadores que usamos para nuestros beneficios. Nos apalancamos de Sagemaker y peleamos contra la pulsión de usar el último framework disponible (¡no me maten por esto!). El mejor modelo es el que se usa.

El Meme del IQ aplicado a SQL

5. Experimentación.

Ya lo decían en los casinos Harrah’s en los 90: “te pueden despedir por 3 motivos: robar dinero, acoso sexual o hacer una campaña sin grupo de control”. Cuando los equipos de Growth quieren mejorar campañas comerciales, lanzan un experimento. Generalmente son experimentos A/B: separamos aleatoriamente los clientes en dos grupos, el A y el B y vemos los resultados en cada grupo, en métricas estándares: transacciones o visitas incrementales (se pueden analizar otras métricas según sea necesario). Además, mantenemos siempre un grupo de control general de clientes, que no puede ser impactado por ninguna acción, que se renueva cada 3 meses y que nos asegura poder medir el resultado global de todo. Solo así mejoramos (“lo que no se mide no se puede mejorar”- W.T. Kelvin). Solo así sabemos que el 13% de nuestras transacciones vienen de nuestra sistemática comercial. Como dato, el último mes hicimos 33 experimentos, que nos ayudaron a ver qué incentivo es mejor, a qué hora, durante cuánto tiempo, con qué mensaje, por qué canal, entre otros.

Éxito y fracaso, cuestión de perspectiva — Visualize Value

Aquí termina

Hay más ámbitos que nos ocupan en nuestro día a día, y mucho por hacer: Cómo modelamos problemas de negocio; casos de uso de mayor valor basados en datos; hacer productos de datos; servir datos y modelos analíticos con MLOps; gobierno de datos, ética y gestión de la seguridad de la información; datos en el contexto de openbanking; la importancia de herramientas como Airflow, Segment, Amplitude o Braze; cultura de skin in the game y la importancia del clima y de la colaboración (grande slack!) y muchos otros.

Si quieren conocer cómo trabajamos estos ámbitos los leo en los comentarios.

¡Espero que hayas aprendido algo nuevo! 🙌 Si te interesó lo que leíste y quieres ser parte de un ambiente colaborativo y 100% flexible, puedes postular acá 👀 y trabajar con nosotros.

MACH, de Bci para todos.

--

--

Marc Martinez de Albeniz
MACHticables

Chief Data Officer #MACH. Experienced in Data & Analytics on banking. I’m interested in creating value through data, especially with data products and growth.