Datos y APIs: Cómo van a propulsar los nuevos sistemas económicos

En los dos artículos anteriores de esta serie educativa, hablamos sobre las blockchains, los contratos inteligentes y el papel que van a desempeñar como infraestructura para transferir y almacenar activos con valor. Igual que los ordenadores sin Internet, los contratos inteligentes en la blockchain tienen un valor inherente por sí mismos, como crear e intercambiar tokens. Sin embargo, se vuelven mucho más útiles cuando pueden conectarse a la economía basada en datos y APIs que se está consolidando fuera del ecosistema de la blockchain (lo que comúnmente se conoce como “off-chain”).

Si los mercados aprovechan la inmensa cantidad de datos generados por los proveedores de datos, las APIs web, los sistemas empresariales, los proveedores de servicios en la nube, los dispositivos de IoT (Internet de las cosas), los sistemas de pago y otras blockchains, los contratos inteligentes empezarán a ser el tipo de contrato predominante.

En este artículo profundizaremos en los datos y en las APIs, específicamente:

  • ¿Qué son los datos y cómo impulsan una economía basada en los datos?
  • ¿Cómo se producen los datos?
  • ¿Cómo se intercambian los datos a través de las APIs?
  • ¿En qué consisten las analíticas de Big Data?

Comprender el alcance de la economía basada en datos off-chain nos ayuda a sentar las bases para el siguiente artículo, en el que exploraremos cómo conectar los contratos inteligentes de forma segura y fiable a esos recursos usando ese software llamado “oráculo”.

Los datos y la economía basada en datos

Datos

Los datos son características o información obtenida a partir de la observación: como cuando se mide la temperatura, se calcula la posición de un coche por GPS o se registra la interacción de un usuario con una aplicación online. Por sí mismos, los datos a secas no son especialmente útiles ni fiables; sino que requieren de otros datos que nos ayuden a contextualizarlos y adecuarlos a un estándar para asegurar su validez y veracidad.

Metadatos

Los metadados son “datos sobre otros datos”, que consisten principalmente en información básica para que resulta más sencillo rastrear o trabajar con datos. Por ejemplo, la hora a la que se envió un mensaje, la localización geográfica de una medición de temperatura o la duración de una llamada telefónica son ejemplos de metadatos que ayudan a indexar y darles significado a los datos.

Depuración de datos

Además, los datos necesitan ser procesados y depurados para que sean lo suficientemente fiables como para que haya aplicaciones que puedan usarlos. El proceso de depuración requiere la eliminación de los valores erráticos (aquellos que se alejan demasiado de la media y son estadísticamente poco frecuentes), y descartar la información irrelevante. Por ejemplo: comparar la temperatura actual con los datos históricos de la temperatura para encontrar y prevenir los valores erráticos.

Economía basada en datos

La economía basada en datos consiste en un ecosistema económico en el que se recopilan todo tipo de datos, se refinan y se intercambian de tal modo que aporten información valiosa. Dicha información puede usarse para repercutir positivamente en la sociedad. Por ejemplo: una base de datos sanitaria compartida para almacenar ensayos clínicos a fin de comprender mejor el estado de salud de un paciente o una empresa privada que haga un seguimiento de sus operaciones internas para identificar y mejorar las deficiencias.

La economía basada en datos está abriendo todo un mundo de posibilidades en torno a la automatización en la que los datos son los responsables de desencadenar acciones económicas sin que haya intermediarios humanos. Por ejemplo, se podría crear una aplicación que tras un pedido realice pagos automáticamente en cuanto se confirmen tres datos: el pedido ha llegado (datos GPS), están en buen estado (datos IoT) y han pasado las aduanas (API web).

Producción de datos

Los datos son un producto derivado de un proceso o evento. Necesitan que se genere un input (acción), una técnica de extracción para registrarlos (medición), y una técnica de agregación (análisis) para darles significado. Puesto que el acceso a determinados inputs y técnicas de extracción y agregación puede estar restringido, no todos los datos se crean igual ni todo el mundo puede generar datos con la misma calidad.

Algunas de los métodos más comunes para capturar datos nuevos y originales son los siguientes:

  • Formularios (Input manual) — los datos se obtienen manualmente cuando los usuarios rellenan un formulario, como una encuesta, la firma de un documento y la participación en foros.
  • Aplicaciones/Páginas web (Consentimiento de uso) — los datos se obtienen cuando los usuarios aceptan los términos y condiciones de una aplicación o una página web, que por lo general otorga consentimiento legal para rastrear ciertos datos como la actividad dentro de una aplicación, los hábitos de navegación, y a veces incluso información general del perfil del usuario (género, edad…etc).
  • Internet de las cosas (IoT) (Monitorización en tiempo real) — los datos se obtienen mediante dispositivos equipados con sensores que transmiten los datos a través de Internet, incluyendo smartphones, aparatos de hogares inteligentes, dispositivos wearables, bienes rastreables mediante etiquetas RFID…etc.
  • Procesos patentados / Experiencias individuales (propiedad) — los datos se obtienen o a través de la propiedad sobre un proceso de negocio (tener una patente o ser el líder del mercado) o a través de la experiencia única y personal.
  • Investigación y análisis (Combinación e interpretación) — los datos se obtienen cogiendo datos que ya existían y aportando una nueva interpretación: cruce de datos históricos, referencias cruzadas con otros datos, nuevos filtros y técnicas de cálculo… etc.

También existen los comerciantes de datos, que compran datos por lotes a los agregadores de datos o a compañías y después los revenden. Aunque son más caros, los comerciantes de datos procesan previamente los datos para que encajen con filtros personalizados o distintos formatos.

Intercambio de datos

Si los datos se convierten en la base de las aplicaciones de nueva generación, las industrias necesitarán mercados para comprar y vender datos en vez de depender exclusivamente de producirlos por ellos mismos. Comprar datos puede ser mucho más barato que producirlos. Por ejemplo, crear un algoritmo de un coche con sistema de conducción autónoma requiere una enorme cantidad de datos de detección de objetos, clasificación de objetos, localización de objetos y movimientos predictivos. Para obtener todos esos datos, un desarrollador tendría dos opciones: podría producirlos por su cuenta conduciendo millones de kilómetros o simplemente comprarlos a través de una API.

Una Interfaz de Programación de Aplicaciones (“API” por sus siglas en inglés) es un conjunto de instrucciones que detallan la forma en la que una aplicación externa puede acceder a datos específicos o a servicios dentro de tu sistema. Las APIs son el método estándar a la hora de comprar y vender datos y servicios hoy en día. La conocida app de viajes compartidos Uber usa una API de GPS para los datos de ubicación (MapBox), una API de SMS para datos de mensajería (Twilio), y una API de pagos (Braintree) para los datos de pago. Estas APIs son esenciales a la hora de gestionar las funciones básicas de la app, y resulta mucho más sencillo que crear todos esos datos desde cero.

(La economía API no ha parado de crecer desde sus inicios, con muchas innovaciones que introducen nuevas APIs y proporcionan métodos mejores para gestionar las APIs. Fuente: Software Development Company Informatica)

Normalmente las APIs se monetizan mediante planes de suscripción en los que los usuarios pagan según cuánto las usen (medido), por suscripciones mensuales (licencias), o acuerdan algún otro tipo de sistema de facturación. Esto genera incentivos monetarios para que los proveedores de datos produzcan datos, mientras que los usuarios los consumen sin tener que crear su propia infraestructura. Mediante este sistema, también se establece un contrato legal vinculante entre el proveedor de datos API y sus clientes para prevenir actividad maliciosa como podría ser la piratería de datos y la reventa sin autorización. Además, gracias a ese contrato, el proveedor de datos tiene que rendir cuentas ante sus clientes en cuanto a estándares de calidad se refiere.

Existe una amplia variedad de datos APIs que son abiertos y gratuitos para todo el mundo, incluido el Open Weather Map (“Mapa Meteorológico Abierto”) para la obtención de datos climáticos, datos del status de vuelos a través de Skyscanner, y GDELT para rastrear la conducta y las creencias humanas a nivel global. Además, cada vez hay más datos disponibles gracias al hecho de que gobiernos de todo el mundo están facilitando APIs abiertas como parte de sus iniciativas de transparencia.

Sin embargo, las APIs abiertas no son tan fiables como las APIs de pago porque carecen de incentivos financieros y de contratos legales vinculados al control de calidad y a la latencia. La mayoría de datos de alta calidad se obtienen a través de APIs que, por lo general, tienen acceso a la fuente original de los datos, poseen la infraestructura al completo, emplean a equipos a jornada completa para monitorizar que todo funcione de forma correcta e innovan constantemente para competir con otros proveedores de datos para acaparar una mayor cuota de mercado.

Infraestructura de Big Data y analíticas

Los humanos sienten predilección por programar sistemas que les permitan aprender y mejorar. Se aprende haciendo, obteniendo un resultado, comparándolo con los datos históricos, y extrayendo conclusiones sobre cómo mejorar el rendimiento en el futuro para lograr una objetivo. Por tanto, hay una mega-tendencia al alza que consiste en construir infraestructuras que puedan manejar ingentes cantidades de datos, filtrarlos, clasificarlos y obtener información valiosa de los resultados.

Facebook, Google y Amazon en Occidente junto con Alibaba, Tencent y Baidu en Oriente se han convertido en gigantes tecnológicos debido a que sus aplicaciones de Internet se usan a gran escala y sus usuarios producen enormes reservas de datos. Estos datos son una parte esencial de los mejores sistemas de analíticas de datos del mundo, en concreto la inteligencia artificial (AI) y el software de machine-learning (ML). Estas tecnologías aportan una amplia visión del comportamiento de los consumidores, las tendencias sociales y las prácticas de mercado.

Al mismo tiempo, el software de gestión empresarial ayuda a que las empresas comprendan mejor sus propias operaciones. Compañías como SAP, Salesforce y Oracle han construido Sistemas de Planificación de Recursos Empresariales (ERP), Gestión de Relaciones con el Cliente (CRM) y software de Gestión de Nubes que ayudan a que estas compañías gestionen sus procesos de negocios internos recopilando todos esos datos y sistemas para generar información valiosa.

La computación y el almacenamiento en la nube también están aumentando su popularidad en los últimos tiempos como método para obtener un mayor y mejor acceso a las infraestructuras digitales. La computación en la nube permite que muchos usuarios compartan infraestructuras almacenando y procesando datos, haciendo innecesario que usen sus propios sistemas. Ha mejorado los procesos backend de las aplicaciones, ha aumentado la cantidad de cosas que comparten distintos sistemas y ha reducido los costes de acceder a software AI/ML. Por ejemplo, los usuarios de Google Cloud pueden aprovechar BigQuery, un Software como Servicio (SaaS), para realizar análisis de petabytes de datos con funciones de machine-learning incorporadas.

Adentrándonos en la Cuarta Revolución Industrial

Cuando combinamos AI/ML, software de gestión empresarial e infraestructura en la nube, el resultado es herramientas para mejorar la información obtenida a partir de los datos. A estas tendencias se suman el Edge Computing, las redes de telecomunicaciones 5G y la biotecnología, que abren cada vez más entornos de datos conectados en tiempo real y biológicamente. Gracias a ello, los sistemas económicos se están transformando, cada vez más rápido, en sistemas en los que predomina la toma de decisiones en tiempo real con apenas intervención humana, sobre todo porque los datos se producen y se comparten de manera mucho más fluida y rápida. De hecho, mucha gente llama a esta mega-tendencia “La Cuarta Revolución Industrial

Para saber más

Descubre más cosas interesantes leyendo el próximo artículo de esta serie educativa que tratará sobre el «problema del oráculo». Síguenos en Twitter para recibir una notificación cuando publiquemos el próximo artículo y únete a nuestro Telegram para estar al día de las últimos noticias de Chainlink.

--

--

Comunidad de Chainlink en español
Chainlink Community

Unofficial Chainlink Medium in Spanish. This account is not managed by the official team. Lowering the language barrier to entry to becoming part of Chainlink.