Business Data Science 101: ¿Cómo transformar datos en valor de negocio?

Applied Intelligence Arg
Data & AI Accenture Argentina
12 min readAug 10, 2023

--

Autores: Nicolás García Aramouni y Manuel Durán

El potencial de los datos en el negocio

Cada vez más, se escucha hablar sobre el potencial de la inteligencia artificial y los datos, quienes han sido calificados como el petróleo del siglo XXI, tal como menciona Forbes[1]. Además, esto está evidenciado por el hecho de que la cantidad de datos disponible crece día a día. Por ejemplo, Statista estima que este año se producirán 120 zettabytes de datos, mientras que en 2019 este número llegaba a 41[2]. Adicionalmente, el nivel de inversión corporativa en inteligencia artificial también viene en alza: mientras que en 2017 este número llegaba a 59,39 mil millones de dólares, en 2022 creció hasta 175,54 mil millones de dólares, según el AI Index Report de 2023[3]. Por otro lado, es claro que viene en constante crecimiento la cantidad de empresas que mejoran y evolucionan sus procesos a partir de algoritmos y el aprovechamiento de la información que ya generan. Es más, también ha crecido la cantidad y la calidad de herramientas que podemos usar en nuestra vida profesional y personal para hacer nuestro trabajo más eficiente y rápido. Sin embargo, no hay que perder de vista que, a la hora de transformar un negocio existente los datos no suelen ser el qué, si no que son parte del cómo. Ahora, para poder obtener el verdadero valor oculto en los datos, es necesario entender qué se puede hacer con ellos, qué preguntas se pueden responder y qué problemas y oportunidades se pueden ayudar a abordar. Es decir, primero se debe identificar qué problema se va a intentar resolver a partir de analytics, y a partir de eso decidir la metodología de resolución.

Tipos de Business Analytics

La identificación de gaps en el proceso actual, o el diseño e implementación de soluciones analíticas no son tareas triviales. Es por eso que el equipo de Data & AI en Accenture fue concebido como una unidad especializada en el uso de la inteligencia artificial y la analítica avanzada para ayudar a las organizaciones a obtener información valiosa de sus datos y convertirla en acciones estratégicas y decisiones informadas. Ahora bien, queda por definir específicamente que casos de uso podemos resolver apalancándonos en los datos.

Para dar cuenta de los casos de uso, antes es bueno dar contexto de 3 conceptos (y hasta un 4to que aparece en el último tiempo) que permiten segmentar los casos de uso en distintas categorías. Estos conceptos son:

  • Análisis Descriptivo
  • Análisis Predictivo
  • Análisis Prescriptivo

Además, como un estadío superior, se enmarca lo relacionado a modelos de Generative AI.

En los próximos artículos publicados se estarán describiendo casos de uso del equipo para dar más detalle respecto a estos conceptos.

Análisis Descriptivo: En esta etapa se realiza una exploración exhaustiva de los datos para comprender mejor su estructura y características. Se utilizan técnicas estadísticas y herramientas de visualización para revelar patrones, tendencias y relaciones relevantes en los datos. El análisis descriptivo proporciona una visión retrospectiva de lo que ha sucedido, permitiendo a las organizaciones comprender mejor su estado actual y los factores que han influido en los resultados pasados. Este tipo de proceso involucra herramientas como Power BI, Tableau, SQL, etc. Combinadas con técnicas de coding, armado de dashboards y estadística descriptiva como medidas de tendencia central (media, mediana, moda), medidas de dispersión (varianza y desvío estándar) y medidas de asociación (correlación, covarianza). A partir del desarrollo de estos análisis, se puede transformar el dato en información y extraer valiosos insights de los datos, dando un mejor nivel de comprensión de lo que sucede en el negocio, apoyado en datos.

Análisis Predictivo: Una vez que se ha obtenido una comprensión sólida de los datos a través del análisis descriptivo, el equipo avanza hacia el análisis predictivo. En esta etapa, se desarrollan modelos de aprendizaje automático que pueden hacer predicciones sobre eventos futuros o resultados desconocidos. Es decir, a partir de datos del pasado, se busca encontrar patrones y tendencias subyacentes que permitan anticipar posibles futuros. Algunos ejemplos de casos de uso es utilizar datos de ventas pasadas, para entender elementos como tendencia, estacionalidad y relación con otras variables relevantes, lo cual será utilizado para desarrollar un modelo predictivo que ventas futuras. Por otro lado, también se puede utilizar modelos para encontrar patrones sobre potenciales clientes que se vayan a dar de baja de un servicio, de forma de encontrarlos a tiempo y poder retenerlos. Otro caso de uso común es la segmentación de clientes a partir de modelos de clustering. Además, se puede pensar en casos de uso que intenten hacer inferencias a partir de imágenes, texto, etc. En esta etapa se utilizan, además, herramientas de programación clásicas como Python o Pyspark en el caso que debamos procesar enormes volúmenes de datos.

Análisis Prescriptivo: Aquí, se utilizan técnicas de optimización y simulación para proporcionar recomendaciones y soluciones accionables que ayuden a tomar decisiones óptimas. Considerando alguna variable a optimizar, y teniendo en cuenta restricciones y objetivos comerciales, el análisis prescriptivo ayuda a identificar el mejor curso de acción posible para lograr los resultados deseados, ya sea mediante un modelo de optimización (maximización o minimización de alguna variable) o mediante simulación de escenarios posibles para evaluar el mejor caso. Un ejemplo de esto podría ser el armado de una planificación de trabajo de una fábrica de forma tal de minimizar el tiempo ocioso. Es decir, en este caso de uso la decisión a tomar es determinada directamente por el algoritmo, lo cual representa un grado de sofisticación mayor.

Como se mencionó anteriormente, en un nivel de sofisticación mayor se encuentra lo relativo a Generative AI, que permite a partir de entradas y prompts (indicaciones o solicitudes en formato texto) generar nuevo contenido. En este sentido, Generative AI se refiere a un conjunto de técnicas y modelos de aprendizaje automático que tienen la capacidad de crear contenido original, como imágenes, texto o incluso música, a partir de patrones y datos de entrada. Estos modelos utilizan redes neuronales para comprender y sintetizar información, lo que les permite generar resultados con aplicaciones que van desde la producción de arte generativo hasta la mejora de la eficiencia en la resolución de problemas complejos, lo cual abre nuestro abanico de posibilidades en lo que podemos llegar a realizar a partir de los datos.

De más está decir que estos tipos de analytics no son mutuamente excluyentes, sino todo lo contrario, ya que pueden complementarse perfectamente. El desarrollo de modelo predictivo aprovechará los insights de la parte descriptiva para evaluar que variables podrán ser utilizadas por el modelo. Por otro lado, también podemos pensar que los modelos prescriptivos pueden usar los outputs de la parte predictiva (por ejemplo, para optimizar el plan de producción de una fábrica podemos utilizar los pronósticos de ventas futuras).

El equipo de Data & AI utiliza la inteligencia artificial y técnicas de análisis avanzado para transformar datos en conocimiento y acciones, generando una solución data driven para el cliente. Comenzando con el análisis descriptivo para comprender los datos, pasando al análisis predictivo para hacer proyecciones futuras y finalmente el análisis prescriptivo para ofrecer recomendaciones estratégicas y tácticas, el equipo ayuda a las organizaciones a tomar decisiones más informadas y efectivas para impulsar el éxito y el crecimiento del negocio.

¿Con qué desafíos nos topamos diariamente?

Una vez que comprendemos que tipos de problemas podemos resolver, queda la incógnita de cómo podemos llegar a ese objetivo: cómo podemos organizar recursos, tiempos y expectativas de forma eficiente. Es verdad que actualmente, existe un gran interés por implementar proyectos de analytics exitosos. Sin embargo, existe un gran porcentaje que termina fracasando o quedando en la nada. Algunas de las causas de estos fracasos, que vienen de los desafíos a resolver actualmente, son:

· Datos: Calidad de datos. Interpretabilidad de los datos. Requiere grandes esfuerzos para poder sortear estos desafíos parcial o totalmente.

· Falta de skills: Los profesionales con skills en analytics son escasos, lo cual a veces dificulta el desarrollo o mantenimiento de las soluciones basadas en datos.

· Cultura: Muchas organizaciones están habituadas a decidir por procesos donde el dato no está en el centro. Confiar en las conclusiones de los datos requiere cambio cultural.

· Organización y Procesos: El diseño organizacional y de procesos no habilita las data-driven decisions.

· En qué invertir: · A nivel proyecto, el presupuesto es limitado y hay que tomar decisiones sobre en qué conviene invertir, si en más gente o en tecnología, tamaño y escala de los datalakes (repositorios para almacenar grandes cantidades de datos), plataformas, arquitectura de los ambientes de trabajo, etc.

Es por esto que es necesario diseñar cuidadosamente los proyectos para que den el resultado deseado. Para que los proyectos tengan el nivel de éxito esperado, desde Accenture consideramos que el armado de nuestro desarrollo tiene siempre en cuenta los siguientes tres pilares:

  1. El proyecto tiene que nacer de una necesidad del negocio identificada. Es decir, debemos reconocer qué vamos a impactar, y cómo imaginamos una solución apoyada en datos. Esto es crítico ya que, si no se piensa que existe un problema, va a ser más difícil mostrar que uno puede desarrollar una alternativa superadora. Por otro lado, es importante que todos los usuarios y stakeholders relacionados estén alineados sobre la existencia de este problema y que la utilización de datos y algoritmos es una opción superadora a la situación actual
  2. A partir de los datos comienza un círculo virtuoso de generación de acciones y aprendizajes apalancados en el uso de analytics. Por otro lado, para generar un impacto es crucial que los insights se transformen en acciones concretas que generen un cambio real en el negocio.
  3. En la gran mayoría de los casos, no vamos a buscar reemplazar la inteligencia humana con algoritmos, si no complementarla y empoderarla. Muchas veces, las personas perdemos mucho tiempo en tomar decisiones repetitivas, que son muy similares a situaciones que hemos vivido. En este contexto, podemos utilizar los algoritmos para automatizar decisiones fáciles, liberando una mayor cantidad de tiempo para que las personas puedan dedicar a tareas y acciones de una dificultad mayor, las cuales realmente necesitan un nivel de análisis mayor. Además, por más que no se automatice todo el proceso, a partir de analytics podemos ayudar a complementar y empoderar el proceso de decisión a partir de más y mejores datos e insights.

Especialidades y perfiles en el equipo

Dado el gran abanico de casos de uso o problemas que podemos llegar a resolver, necesitamos un equipo con skills diversos y complementarios, de forma de cubrir todas las aristas del problema. Es por eso, que dentro de nuestro equipo de Data & AI contamos con distintas especialidades:

  1. Insights: especializado en casos de uso de Analytics Descriptivo
  2. Business Data Science: especializados en casos de uso de Analytics Predictivo
  3. Simulación: especializados en casos de uso de Analytics Prescriptivo, a partir de técnicas de simulación
  4. Optimización: especializados en casos de uso de Analytics Prescriptivo, a partir de técnicas de modelado matemático
  5. UX: especializados en diseñar la solución final para el usuario/cliente. Su objetivo principal es diseñar interfaces y experiencias intuitivas, atractivas y funcionales que satisfagan las necesidades y expectativas de los usuarios finales.
  6. Solutions: especializados en el desarrollo de soluciones de datos. Su objetivo es crear aplicaciones que permitan a los usuarios finales interactuar fácilmente con los modelos desarrollados, seteando parámetros, analizando resultados y, si se desea, influenciando o modificando las decisiones y conclusiones finales. De esta forma, podemos darle una capa visual, interactiva y responsiva a nuestros modelos.

También, como perfiles complementarios a nuestro trabajo, necesitamos personas especializados en permitirnos armar soluciones robustas y escalables, con datos ordenados, estructurados y de alta calidad:

· Data Engineering: especializados en diseñar, construir y administrar sistemas y flujos de datos que permiten la recolección, transformación y almacenamiento eficiente de información crítica para la organización. Esto implica la creación de pipelines de datos que extraen, limpian y transforman datos desde diversas fuentes, optimizando su estructura y calidad para su posterior análisis y uso. También se encargan de implementar soluciones de almacenamiento y gestión de bases de datos, así como de asegurar la integridad, seguridad y escalabilidad de la infraestructura de datos.

· Machine Learning Engineering: especializados en diseñar, implementar y optimizar algoritmos de aprendizaje automático en entornos prácticos. Se encargan de llevar a cabo el despliegue de estos modelos en entornos de producción, asegurando su escalabilidad, eficiencia y correcto funcionamiento en tiempo real, y garantizando que la solución de machine learning genere resultados valiosos y confiables para la organización.

De más está decir que el conocimiento de nuestro equipo de Data & AI también puede complementarse y profundizarse a partir del know-how proveniente de los equipos funcionales y de industria que la Global Network de Accenture posee. Por otro lado, es importante remarcar que la composición de nuestros equipos de proyectos dependerá del caso de uso, el tipo de analytics a utilizar y cómo se quiere implementar la solución final (integrar a sistemas actuales, rediseñarlos, armar una nueva aplicación, etc), entre otros factores. Por otro lado, en todo el desarrollo del proyecto será importante involucrar a todos los stakeholders relevantes (por ejemplo, usuario final, negocio, equipo de analytics) del cliente, ya que siempre y en todo momento buscaremos co-crear e iterar la solución en conjunto. Como solemos decir, “la solución que sirve es la que se usa”, y para conseguir esto con el mayor grado de éxito y aceptación posible, será necesario complementarnos y apoyarnos en los equipos del cliente.

Etapas de un proyecto

Una vez que tenemos el caso de uso bien relevado y el equipo definido, solo queda planificar las tareas del proyecto. En este marco, nuestros proyectos completos suelen tener tres etapas:

  1. Movilización de recursos y desarrollo inicial

a) En esta etapa realizamos un entendimiento y análisis de datos

b) En ocasiones es posible que esta etapa inicial se desarrolle un Assessment, en el que a patir de una solución básica se realice una medición del potencial impacto y/o valor de la solución final

2. Desarrollo Solución Final

a) En esta etapa realizamos una experimentación e iteración constante para llegar a la solución final

b) Desarrollo de código

c) Iteración, validación y co-creación con el cliente

3. Puesta en Producción

a) Integración de la solución desarrollada en los sistemas y procesos del cliente. En este proceso se necesita de la participación de los Machine Learning Engineers para diseñar e implementar la herramienta en el entorno del cliente.

4. Mantener y Evolucionar

a) Una vez que el modelo queda en producción, empieza un proceso de evolución, en el cual se siguen encontrando formas de recalibrar, mejorar, actualizar y re-optimizar los modelos desarrollados

Como puede verse, desarrollar un proyecto de analytics no es una tarea fácil o instantánea. Sin embargo, esta característica es una ventaja, ya que estas etapas permiten iterar e ir mejorando la solución final. Por otro lado, también permiten una adaptación e integración más pausada y ordenada, lo cual contribuyen al éxito del proyecto.

Por último, es importante señalar las etapas que los científicos de datos tienen en su día a día en los que se involucran múltiples equipos, todos de ellos relevantes a la hora de diseñar e implementar una solución robusta. De esta forma, se busca entender los datos, generar un análisis suficiente que permita desarrollar modelos que no solo tengan una buena performance, sino que también que incorporen todos los conocimientos y variables relevantes para el negocio. Una vez que tengamos el modelo final, podremos ponerlos en producción, integrándolos a los sistemas y ecosistemas existentes:

Conclusiones

En estos párrafos hemos repasado varios conceptos importantes sobre el desarrollo de proyectos de analytics en Accenture Data & AI

· Tipos de analytics

· Casos de uso a resolver

· Pilares a la hora de diseñar un proyecto

· Perfiles usados a la hora de armar un equipo

· Timeline de un proyecto

Todos estos elementos son claves a la hora de diseñar y desarrollar soluciones que sean utilizadas de forma exitosa. En próximos posts mostraremos casos de uso reales sobre cómo hemos ayudado a rediseñar, optimizar y mejorar procesos de negocio a partir del uso de analytics.

— — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — — —

Referencias:

[1] Murillo, Javier; Los datos son el nuevo petróleo. Forbes México (2021). Publicado el 6 de septiembre de 2021. Consultado el 9 de agosto de 2023 en el siguiente link: https://www.forbes.com.mx/red-forbes-los-datos-son-el-nuevo-petroleo/

[2] Volume of data/information created, captured, copied, and consumed worldwide from 2010 to 2020, with forecasts from 2021 to 2025. Statista. Publicado el 8 de septiembre de 2022. Consultado el 9 de agosto de 2023 en el siguiente link: https://www.statista.com/statistics/871513/worldwide-data-created/

[3] Artificial intelligence has advanced despite having few resources dedicated to its development — now investments have increased substantially. Our World in Data. Publicado el 29 de marzo de 2023. Consultado el 9 de agosto de 2023 en https://ourworldindata.org/ai-investments

--

--