Big Data

La cantidad de información que actualmente compartimos, generamos, y guardamos ha crecido de manera exponencial, de la misma forma esta ha evolucionando siendo cada vez específica.

Actualmente generamos una estela de información nunca antes vista. Por ejemplo, en cualquier interacción que tenemos con redes sociales, celulares, internet, computadoras en general, cámaras de video vigilancia, etc. Cada uno de estos medios graba de una forma u otra la manera en que interactuamos con ellos.

De la misma forma tenemos otra corriente de recolección de datos, que son los distintos sensores o servicios que llevan al mundo digital información que anteriormente existía solamente en el mundo físico. Por ejemplo, el Fitbit, Nest, o incluso 23&Me. (Cada produto está explicado en los anexos)

Este tipo de productos lo que buscan, es generar valor por medio de facilitar tareas que hacemos diariamente o tareas que de lo contrario no realizaríamos. Todos apuestan a ahorrar tiempo, ahorrar costos, o a ser herramientas de monitoreo con datos históricos. Cada una de estas innovaciones utiliza la información que su usuario crea para hacerle la vida mejor a la persona que lo utiliza.

¿Qué es Big Data?

Tres cosas fundamentales han cambiado a lo largo de los años para que lográramos generar y almacenar tantos datos:

Generamos mucha información

En la actualidad generamos 2.5 Exabytes de información cada día según una estimación hecha por IBM. Pero la pregunta es ¿Cuánto es eso? Es el equivalente a llenar 48,828,125 computadoras con un disco duro de 512 Gigabytes diariamente.

Puedo listar la información que genere el día de hoy para que logremos comprender en un día típico que información creamos en el mundo.

1. Usé la tarjeta de RFID para ingresar al parqueo (entradas y salidas del parqueo)

2. Usé mi huella digital para entrar al edificio (entradas y salidas de la oficina)

3. Usé Facebook para hablar con un amigo y hacer un post (TODA la actividad en la red social)

4. Estuve usando YouTube para buscar información de Big Data (TODA la actividad en la red social)

5. Usé Google para buscar contenido (todo lo que he buscado, busqué en ese momento y buscaré en el futuro)

6. Tuve que salir a comprar unos componentes por lo que usé Waze (ubicación exacta GPS, viajes realizados)

7. Se me cerró Word y me pidió que compartiera la información del error para que todos nos beneficiáramos de la reparación (toda la información de la computadora)

8. Compré unos componentes en Amazon (historial de búsquedas e historial de compras)

Estas son algunas de las cosas que hacemos diariamente que generan información a empresas que nos dan sus servicios. Muchas veces estos servicios son gratuitos y la empresa comercializa los datos.

Guardamos mucha más información

Antes el problema era ¿Cómo podemos generar más información para tomar mejores decisiones? Ahora el problema es ¿En este mar de información, cómo le damos sentido a todo?

La principal razón por la cual es posible que tengamos tanta información es la constante reducción de costos por GB de almacenamiento que hemos experimentado. Esta tendencia es tan marcada que según un estudio de KPCB, un fondo de inversión para lanzamiento de empresas en Estados Unidos, el costo de almacenamiento de 1GB de información ha pasado de $ 569.00 en 1992 a $ 0.02 en 2013.

De la misma manera se ha reducido el costo de 1 millón de transistores. Estos transistores son la parte fundamental de cualquier microchip, el cual hace procesamiento de datos. Este costo ha bajado en la misma medida pasando de $ 527.00 en 1992 a $ 0.05 en 2013.

Estos dos factores han generado que sea posible almacenar y analizar toda la información que se genera. Sin embargo, el cerebro humano no está hecho para procesar, ni comprender la cantidad de datos que en la actualidad generamos. Tendremos que darle sentido con herramientas de inteligencia artificial.

La información viaja a mayor velocidad

Si pensamos en cómo eran las cosas hace 2,000 años nos damos cuenta que como sociedad hemos logrado cosas que para nuestros antepasados hubieran estado más allá de su imaginación. En aquel entonces, muy poca gente podía leer y escribir por lo que la mayoría de mensajes se transmitían de persona en persona de manera verbal. Estos mensajes podían tardar meses dependiendo de la distancia que tenía que recorrer el mensajero para entregar su contenido.

Todos los avances más importantes para la humanidad han tenido que ver con la comunicación. Por enumerar algunos de estos avances podríamos decir que el lenguaje, la escritura, la imprenta, el internet han sido avances que nos han ayudado a compartir información con otros seres humanos. Lo que ha impulsado dichos avances es la velocidad. La pregunta que nos ha llevado a buscar nuevas maneras de comunicarnos como especie siempre ha sido ¿Cómo puedo hacer que este mensaje llegue a la persona?

En la Actualidad la información puede viajar a la velocidad de la luz gracias al internet y la revolución digital. Es por esta razón que puedo compartir este artículo, que logré escuchar música en Deezer y pude saber qué estaba pasando del otro lado del mundo.

El valor de la información

Al final la información se utiliza para tomar decisiones, de nada nos sirve la información si no podemos entenderla y analizarla y es por esto que todos los avances tecnológicos que marcaran la próxima ola de innovación estarán ligadas al Big Data. Las empresas más valiosas del mundo de la tecnología se han formado usando información Google, Facebook, Amazon entre otros utilizan distintos tipos de información para empoderarnos y que logremos hacer cosas que en 1984 parecían imposibles.

En Flatbox desarrollamos sistemas de internet de las cosas para empresas. Nuestro enfoque está en desarrollar sensores de medición específicos. Algunas de las aplicaciones que tenemos son: conteo de personas, consumo eléctrico, consumo de agua, temperatura, humedad etc. Este tipo de sensores generan una cantidad inmensa de datos del mundo real, y lo envian al mundo digital es por esto que sabemos que es Big Data.

Anexos

FITBIT

Fitbit es una empresa que vende pulseras conectadas a tu celular para llevar un control de tu actividad física. Sus productos van desde una banda que mide los pasos, hasta una banda que monitorea el ritmo cardiaco. Toda esta información de movimiento se almacena y se utiliza para analizar la condición física del usuario.

Este es un ejemplo claro de información que hace 15 años no hubiera existido. Actualmente la empresa tiene una base de usuarios activos de 10 millones de personas las cuales están generando información diariamente con el solo hecho de caminar.

NEST

Nest es un sistema de termostato inteligente que está conectado a internet. El aparato cuenta con conexión a los sistemas de aire acondicionado y calefacción de un inmueble y también tiene sensores de movimiento. Entonces, ¿Cómo funciona? El sistema controla la temperatura de la casa y va “aprendiendo” los hábitos de la persona dentro de su residencia, las dos cosas que identifica Nest son qué días de la semana está la persona en su casa y a qué horas. Con esta información el termostato modifica la temperatura de manera automática. Si hay calor y hay personas dentro de la casa, Nest prende el aire acondicionado. Si hay frío, prende la calefacción. Nest también puede aprender a qué hora su usuario llega a la casa y recibir comandos usando un app en el celular para tener la casa a la temperatura perfecta cuando su dueño llegue.

Internamente el aparato se vuelve “inteligente” siguiendo muchas funciones condicionales que va mejorando con la data que genera y almacena el dispositivo. La acción de apagar el aire acondicionado no es algo que no podamos hacer. Sin embargo, Nest lo hace de una forma en que ningún ser humano podría. Muchas personas olvidan de vez en cuando apagar un ventilador o una televisión o incluso en casos extremos, la estufa de la casa. Yo estoy seguro, que estos errores se eliminarán en un futuro, en donde la mayoría de aparatos estarán conectados a internet generando datos de todo lo que hacemos diariamente.

Con esta ola de aparatos conectados, cada vez más aspectos de nuestras vidas estarán pasando del mundo real al mundo digital generando una cantidad masiva de datos. Estos datos serán de diversas categorías, fuentes y aparatos; y harán que tengamos una huella digital inmensa.

23&ME

Es una empresa que por $ 149.00 mapea la procedencia del ADN de cualquier persona. Con esto básicamente lo que hace el servicio es enviar un sobre para que el cliente coloque una muestra de saliva luego se envía nuevamente a la empresa la cual hace un estudio de ADN y brinda información sobre la etnicidad, que tan propensos somos a enfermedades, y las características únicas de cada persona. Esto lo hacen utilizando una pagina web como medio para ingresar a la información.

Básicamente lo que estamos haciendo al utilizar su servicio es digitalizar nuestro ADN y tener nuestra información en su base de datos. Ya que la única manera de ver los resultados es a través de una página web no existe una manera al día de hoy (25 de Abril 2016) de ver los resultados en un reporte descargable.

Kenneth Cukier: Big data is better data

Philip Evans: How data will transform business

Big data From Wikipedia, the free encyclopedia