Impulsando la Inteligencia Artificial: Data Cloud y MuleSoft como motores de cambio

Florencia Cattelani
Another Integration Blog
6 min readMay 6, 2024

Cuando hablamos de inteligencia artificial, más conocida como IA, nos referimos a la capacidad que tienen las máquinas o sistemas informáticos para realizar tareas que normalmente requerirían la intervención humana, como el reconocimiento de patrones, la resolución de problemas, la toma de decisiones y la comprensión del lenguaje natural. ¿Cómo lo hacen? A través de algoritmos y modelos matemáticos complejos que permiten a las máquinas procesar grandes cantidades de datos y aprender de ellos para mejorar su rendimiento en diversas tareas. Desde asistentes virtuales hasta diagnósticos médicos, la IA está cada vez más presente en prácticamente todas las áreas de nuestra vida cotidiana. En este proceso, los datos desempeñan un papel fundamental. Me gusta pensar en los datos como el “combustible” que impulsa el aprendizaje y el funcionamiento de los sistemas de inteligencia artificial. Algunos de sus principales usos incluyen:

  1. Entrenamiento de modelos: en muchos enfoques de IA, se utilizan algoritmos de aprendizaje automático que requieren grandes cantidades de datos para entrenar modelos. Estos modelos aprenden patrones y relaciones en los datos mediante el análisis de ejemplos etiquetados o no etiquetados. Cuantos más datos de calidad se utilicen para entrenar el modelo, generalmente mejor será su rendimiento.
  2. Validación y evaluación: los datos también se utilizan para validar y evaluar la precisión y eficacia de los modelos de IA entrenados. Los conjuntos de datos de prueba se utilizan para medir cómo se desempeña un modelo entrenado en datos no vistos previamente.
  3. Mejora continua: Una vez que un modelo de IA está en producción, los datos recopilados en tiempo real pueden usarse para retroalimentar el modelo y mejorar su rendimiento con el tiempo. Este proceso se conoce como aprendizaje en línea o aprendizaje activo.
  4. Detección de sesgo y limpieza de datos: los datos pueden contener sesgos inherentes que pueden afectar negativamente el rendimiento y la equidad de los modelos de IA. Es importante realizar análisis exhaustivos de los datos para detectar y mitigar cualquier sesgo, así como para limpiar los datos para garantizar su calidad y relevancia.
  5. Personalización y recomendaciones*: los datos de comportamiento del usuario pueden utilizarse para personalizar experiencias y ofrecer recomendaciones relevantes. Esto se ve comúnmente en sistemas de recomendación de películas, música, productos, etc.

Los datos son esenciales para el desarrollo, entrenamiento, evaluación y mejora continua de los sistemas de inteligencia artificial. La calidad, cantidad y diversidad de los datos influyen significativamente en la capacidad de un sistema de IA para realizar tareas de manera efectiva y precisa.

Hicimos tanto foco en datos, recopilarlos, tomar decisiones basados en ellos, pero… ¿cómo los gestionamos? Este último tiempo, la cantidad de datos generados ha crecido exponencialmente.

(*) Fuente: https://www.domo.com/learn/infographic/data-never-sleeps-11

Hoy el foco no está en la recopilación de datos, sino en cómo los consolidamos para hacer uso de los mismos.

El problema de la consolidación de datos se refiere a la tarea de combinar y organizar datos dispersos y posiblemente heterogéneos de múltiples fuentes en una sola fuente de datos coherente y unificada. Este proceso es crucial en muchos contextos, especialmente en el ámbito empresarial, donde las organizaciones suelen tener datos almacenados en diferentes sistemas, bases de datos o incluso en formatos diversos.

Algunos de los desafíos asociados con la consolidación de datos incluyen:

  1. Integración de datos: las fuentes de datos pueden utilizar diferentes esquemas de datos, formatos y convenciones de nomenclatura. La integración de estos datos requiere mapear y transformar los datos de manera que sean coherentes y compatibles entre sí.
  2. Calidad de datos: los datos de diferentes fuentes pueden tener inconsistencias, errores o duplicados. Es importante realizar un proceso de limpieza de datos para garantizar que la información consolidada sea precisa y confiable.
  3. Seguridad y privacidad: al consolidar datos de múltiples fuentes, es crucial garantizar la seguridad y la privacidad de la información, especialmente si se trata de datos sensibles o confidenciales.
  4. Volumen y escalabilidad: manejar grandes volúmenes de datos y garantizar la escalabilidad del sistema son desafíos importantes en la consolidación de datos, especialmente a medida que las organizaciones crecen y generan más información.
  5. Actualización continua: los datos son dinámicos y están sujetos a cambios con el tiempo. Es importante tener en cuenta la necesidad de actualizar y mantener los datos consolidados de manera continua para reflejar cambios en las fuentes de datos originales.

Para abordar estos desafíos, las organizaciones suelen emplear herramientas y técnicas especializadas, como sistemas de integración de datos, almacenes de datos, técnicas de minería de datos y técnicas de inteligencia artificial, como el aprendizaje automático, para automatizar y mejorar el proceso de consolidación de datos.

Hasta acá entonces podemos decir que la inteligencia artificial será tan buena como sea la calidad de datos en la que esté basada, pero ¿cómo podemos ayudar a las compañías a organizar, clasificar y limpiar sus datos para que sean un buen input en sus sistemas de inteligencia artificial?

Salesforce creó la nube de Data para este fin. Data Cloud está profundamente integrada con todo en Salesforce. Por lo tanto, no es necesario organizar todos los datos en un solo lugar y luego descubrir cómo utilizarlos para interactuar con los clientes. Data Cloud facilita en gran medida la tarea de reunir todos los datos de Salesforce, ya sea de múltiples nubes o de múltiples orgs. Y todos esos datos están unificados y armonizados en un único espacio al que todas las aplicaciones pueden acceder.

Data Cloud unifica todos los datos de todos los sistemas diferentes y dispares, no sólo de las distintas nubes de Salesforce. De hecho, el 75% de los datos en Data Cloud provienen de fuera de Salesforce en la actualidad. Esto significa datos de sitios web, datos de telemetría y datos estructurados o no estructurados. Se pueden obtener fácilmente datos con conectores y conectarnos con proveedores de big data de manera segura y cumpliendo con las regulaciones desde plataformas de datos externas como Snowflake, Google, AWS y Databricks para compartir datos y entrenar modelos de IA.

Pero si hablamos de integración, es natural también hablar de MuleSoft. MuleSoft sigue siendo una pieza fundamental para la integración y aceleración del uso de la inteligencia artificial.

La complejidad que se presenta en la actualidad sigue en aumento. Las compañías tienen en promedio alrededor de 1000 aplicaciones distintas y se encuentran en una carrera por diferenciarse de sus competidores. Están cada vez más obligadas a brindar experiencias digitales de alta calidad y además deben volverse más eficientes para poder estar a la altura.

Los números son esclarecedores, el 49% de la población mundial ya tuvo algún tipo de interacción con la inteligencia artificial y el 86% de los líderes de IT ven a la IA como una necesidad para el futuro cercano**.

Está claro que la inteligencia artificial está pisando fuerte, pero aún existen ciertas barreras para su uso masivo dentro de las organizaciones. Las tres más destacadas son integración, seguridad y privacidad.

Como mencioné anteriormente, la IA es tan poderosa como lo sean sus datos. La integración de los mismos es una pieza clave para lograr el éxito.

La integración sigue siendo una prioridad absoluta para implementar una estrategia de transformación digital mientras surgen nuevas tecnologías y crean mayores desafíos.

Se debe trabajar fuertemente en integrar sistemas y datos para allanar el camino hacia la inteligencia artificial. De lo contrario, esta deficiencia impedirá sacarle el mayor provecho a la IA, mejorando significativamente la vida diaria de los colaboradores y de los clientes.

Además de la integración, la automatización es otra de las tecnologías que resuena fuerte en esta era. Un reporte reciente muestra que la automatización está ahorrando un promedio de 1.9 horas a la semana***. Además de la eficiencia, podemos enfocar a nuestros equipos a tareas más estratégicas, dejando lo rutinario en manos de los llamados bots.

Si bien MuleSoft sigue siendo sinónimo de integración, vale la pena destacar que es mucho más que eso. MuleSoft posee una serie de herramientas que pueden abarcar distintos casos de uso, facilitando la integración, la gestión de APIs, ofreciendo capacidades de RPA (Automatización de Procesos Robóticos, por sus siglas en inglés) y siendo una pieza clave en la implementación de AI.

Independientemente de cuál sea la herramienta elegida, hoy nos vemos obligados a que el tratamiento de datos y su consolidación/integración forme parte de las prioridades para los equipos de IT. Quien no haga uso inteligente de sus datos quedará en una desventaja competitiva respecto del resto. En la actualidad, hemos visto cómo el poder se fue moviendo desde la oferta hacia la demanda. Los consumidores son cada vez más exigentes y tenemos que estar a la altura.

(**) Fuente: “2024 Connectivity Benchmark Report.”, MuleSoft, 2024

(***) Fuente: “Automation: Trends, Challenges and Best Practices,” IDC Info Brief sponsored by Salesforce, March 2023. IDC #US50410923.

--

--

Florencia Cattelani
Another Integration Blog

Computer Engineer — Mg. Project Evaluation — Pet’s lover — Curious and continuous learner — Integration Architect - CloudGaia’s Chief Operations Officer