Tres proyectos blockchain de almacenamiento distribuido de datos

Los datos se han convertido en el activo más valioso en la era de la información.

Juan F. Bolaños
10 min readMar 18, 2019

Muchas de las grandes compañías tecnológicas han construido sus exitosos modelos de negocios precisamente del análisis de la inconmensurable cantidad de datos que generan sus usuarios, poniendo en riesgo constante su seguridad y privacidad. No hace falta comentar los frecuentes casos de ataques y filtraciones de información de los que son víctimas los sistemas centralizados. En este sentido, el ámbito de la gestión y almacenamiento de datos no ha podido permanecer ajeno al fenómeno de la cadena de bloques el cual ofrece interesantes características de seguridad, integridad y privacidad.

El almacenamiento distribuido de datos no es un concepto nuevo. A partir de mediados de la década de 1990 e inicios de la de 2000, vimos el surgimiento de plataformas descentralizadas de descargas de archivos digitales como BitTorrent y LimeWire. En lugar de que los usuarios descarguen la información de servidores centralizados, estas plataformas entre iguales — P2P, por sus siglas en inglés — , permiten que un archivo sea alojado o «sembrado» en una sola computadora para luego ser dividido en fragmentos, y estos luego distribuirse a través de una red ordenadores.

Imagen: Joshua Coleman — Unsplash

Esto permite que cada nodo de la red descargue de sus compañeros fragmentos del archivo, mientras que, al mismo tiempo, también carga otros fragmentos del archivo a otros pares. Como nada es perfecto, este modelo tiene algunas limitaciones, por ejemplo:

  1. En el caso de que un nodo termine de descargar un archivo antes que los otros nodos, el propietario del primer nodo podría apagarlo al finalizar la descarga, haciendo que otros usuarios de la red nunca reciban una copia completa del archivo.
  2. No existen incentivos para sembrar archivos menos populares, haciendo que la descarga sea menos confiable y lenta. Teniendo en cuenta que la siembra ocupa ancho de banda, tampoco hay incentivos para continuar alojando dichos archivos.

La solución es incentivar a los nodos para que alojen datos sin importar si estos son más o menos populares.

Como es de conocimiento generalizado, la escalabilidad no deja de ser una preocupación en el mundo de las cadenas de bloques. Actualmente, se están empleando dos técnicas específicas para enfrentar este importante desafío:

  • Fragmentación o sharding: es una técnica para dividir lógicamente los datos en una base de datos. Estos datos se dividen en fragmentos que forman la base de datos original cuando se reconstruyen.
  • Enjambre o swarming: es un proceso que almacena colectivamente fragmentos en un gran grupo de nodos — un enjambre — dentro de una red entre iguales. Los dispositivos conectados a esta red pueden recuperar los datos de los nodos más cercanos, lo que reduce la latencia, aumenta la confiabilidad y la escalabilidad.

La gestión descentralizada de datos garantiza que si un nodo falla y se desconecta de la red, los nodos restantes aún tienen la capacidad de restituir los archivos de los fragmentos distribuidos por toda la red. Para aumentar la seguridad, los archivos se encuentran cifrados, evitando que los nodos puedan conocer lo que contienen. Para recuperar un archivo se utiliza una tabla de hashes distribuida que es una lista con las claves y los valores asociados que apuntan hacia la ubicación de cada uno de los fragmentos de los datos. La red emplea estos fragmentos para reconstruir el archivo antes de que su propietario use su clave privada para decodificarlo y usarlo.

Ventajas de blockchain para el almacenamiento de archivos

  1. Es más difícil de intervenir un servicio centralizado en la nube — AWS, Dropbox, Google Drive, OneDrive, etcétera — porque posee un punto único de falla y ataque. La naturaleza descentralizada del almacenamiento, junto con procesos como la fragmentación y la codificación, significa que los hackers que logran comprometer un nodo solo podrán acceder a una pequeña porción cifrada de sus datos. Luego tendrían que ubicar y descifrar todos los demás fragmentos en los otros nodos para poder darles algún sentido.
  2. El almacenamiento de archivos descentralizado es más económico que las soluciones de almacenamiento centralizado en la nube o el mantenimiento de servidores in situ. Por ejemplo, en promedio, el almacenamiento descentralizado que ofrece la plataforma Sia cuesta un 90 por ciento menos que los servicios ofrecidos por los proveedores de soluciones en la nube centralizadas. Almacenar 1 TB de datos en Sia cuesta alrededor de dos dólares por mes, en contraste con los 23 dólares que cuesta el servicio S3 de Amazon Web Services.
  3. El sistema de incentivos significa que si una persona tiene espacio de almacenamiento adicional, puede aportarlo a la red y ganar dinero a cambio. Es de esperar que si estos servicios descentralizados de almacenamiento llegan a sumar una cantidad interesante de usuarios, el valor del token debería apreciarse considerablemente.

El día de hoy vamos a analizar tres proyectos blockchain de almacenamiento distribuido de datos que podrían convertirse en el punto de quiebre del modelo centralizado que actualmente acapara el mercado, dando origen a un nuevo modelo descentralizado basado en los incentivos económicos, dicho de otro modo, los participantes son recompensados con tokens o criptoactivos por la capacidad de almacenamiento que aportan a la red. Estos retornos monetarios harían que los participantes permanezcan conectados a la red y no apaguen sus nodos.

Storj

Esta plataforma se lanzó en 2014 y fue inicialmente un token desarrollado en la plataforma Counterparty construida en Bitcoin, posteriomente, en el verano de 2017, migró a Ethereum y se convirtió en un token ERC20. Al mismo tiempo, se completó exitosamente una nueva ICO que recaudó 30 millones de dólares.

Imagen: Todaysgazette.com

El objetivo fundamental de Storj es ofrecer una alternativa al modelo tradicional y centralizado de almacenamiento de datos a través del empleo de su token nativo para incentivar a los usuarios — conocidos como granjeros — a alojar datos en la capacidad de almacenamiento ociosa de sus dispositivos. Los archivos de los usuarios de la plataforma se codifican, fragmentan y se envían a través de la red a los granjeros para su almacenamiento. Este proceso ocurre a través de la ejecución de contratos inteligentes de almacenamiento P2P que establecen los términos y condiciones del servicio entre pares.

Storj emplea tablas de hashes distribuidas — DHT, por sus siglas en inglés — . A través de esta tecnología los nodos de la red pueden transferir datos, verificar su integridad y disponibilidad y pagar a los nodos que contribuyen con su capacidad de almacenamiento a la red. Existe una herramienta llamada Storj Share que permite a los usuarios convertirse en granjeros, en otras palabras, alquilar su capacidad de almacenamiento a la red. Como recompensa los granjeros reciben la criptomoneda STORJ.

Desafíos

Actualmente, tanto los nuevos usuarios como los nuevos granjeros se encuentran en una lista de espera. Esta situación se debe principalmente a las limitaciones de escalabilidad que han surgido desde que la red alcanzó los 100 millones de GB de datos almacenados. A pesar de que esta capacidad de almacenamiento es considerable para el mundo de las cadenas de bloques, continúa siendo despreciable si la comparamos con las cifras de servicios centralizados como AWS. El equipo de desarrollo de Storj tiene como objetivo alcanzar una capacidad de 1 EB — 10¹⁸ bytes — , para esto está trabajando en la actualización denominada V3 que permitirá la transmisión de vídeos en búfer y integración con AWS. Al momento de escribir este artículo todavía no se ha anunciado una fecha de lanzamiento de V3.

Es importante mencionar que Storj no opera su propia cadena de bloques, sino que funciona como una aplicación descentralizada — DApp, por sus siglás en inglés — de Ethereum. Storj es el proyecto blockchain de almacenamiento más antiguo y más utilizado en términos de cantidad de datos almacenados.

Sia

Por el momento, Sia es la opción de almacenamiento descentralizado preferida por el mercado. Su funcionamiento es muy similar al de Storj con la diferencia de que Sia opera su propia cadena de bloques. Esto no solo permite que el proceso de almacenamiento de datos de descentralice, sino que también la ejecución de los contratos inteligentes entre usuarios y granjeros que permiten, entre otras cosas, acordar la capacidad de almacenamiento y el valor a pagar en siacoins (SC) — criptodivisa nativa de la blockchain de Sia — que interviene en los contratos de almacenamiento descentralizado. Los tokens del usuario representan el pago a los granjeros una vez que se cumple el contrato; los tokens del granjero actúan como colateral en el caso de que este no provee el alojamiento según lo acordado en el contrato. Esta garantía se puede perder si los granjeros se desconectan de la red.

Imagen: Hackernoon.com

La cadena de bloques se emplea para almacenar el contrato y hacerlo público y auditable en tiempo real. También actúa como un servicio de depósito en garantía para ambas partes. Al finalizar el contrato, el granjero proporciona una prueba a la cadena de bloques de que el archivo se encuentra almacenado, luego la garantía es devuelta y el pago del usuario se transfiere al granjero. Tanto los usuarios como los granjeros utilizan siacoin para comprar y vender espacio de almacenamiento y, por lo tanto, tiene un precio flotante determinado por un mercado. Este criptoactivo también se utiliza para pagar a los mineros que efectúan la Prueba de Trabajo — PoW, por sus siglas en inglés — mecanismo empleado para validar los bloques de la cadena.

Aplicaciones de Sia

En 2018 se lanzó la plataforma Goobox que es un servicio descentralizado de transferencia de archivos que opera en la cadena de bloques de Sia. Permite cargar y transferir sin costo archivos de hasta 4 GB protegidos con contraseña y codificación punto a punto.

Goobox es la alternativa descentralizada basada en blockchain del popular servicio WeTransfer. En la primavera de 2019 se prevé lanzar la versión Pro de la plataforma — actualmente se encuentra en alfa — , y en verano del mismo año, la API que permitirá implementaciones e integraciones fáciles y económicas en Sia.

Desafíos

Actualmente, hay muchos usuarios que están interesados en intercambiar la criptomoneda siacoin, pero no tantos interesados en utilizar el servicio de almacenamiento. El incremento sostenido de su base de usuarios es el desafío más importante que debe superar esta plataforma. El crecimiento de usuarios está limitado por un par de situaciones clave. Primero, el software no es fácil de usar, requiere de algunas horas de configuración. Segundo, los nodos que forman parte de la red solo pueden almacenar hasta 5 TB de datos, lo que excluye del servicio a usuarios corporativos, por ejemplo.

Filecoin

En 2017, el ICO de Filecoin se convirtió en uno de los que más fondos ha recibido con 257 millones de dólares, manteniéndose fácilmente entre los diez primeros de mayor recaudación. Filecoin es desarrollado por Protocol Labs, se basa en el Sistema de Archivos Interplanetario — IPFS, por sus siglas en inglés — que es un protocolo de código abierto y una red diseñados para crear un método de almacenamiento y uso compartido de hipermedia en un sistema de archivos distribuido P2P. IPFS pretende transformar la manera en la que los datos se transmiten en el Internet. Tiene la asombrosa y fabulosa ambición de reemplazar al anacrónico protocolo HTTP. Esta tecnología ya ha sido adoptada por servicios de generación y distribución de contenido como Busy y DTube.

Imagen: CryptoCoreMedia.com

Además de IPFS, Filecoin agrega su token para crear un mercado que incentiva a los granjeros a almacenar archivos para los usuarios. Los mineros ganan la criptomoneda filecoin (FIL) al proporcionar espacio de almacenamiento ocioso a la red; los usuarios gastan filecoin al pagar por el almacenamiento de sus archivos en la red descentralizada.

La red de Filecoin está compuesta por dos tipos de nodos:

1. Nodos de almacenamiento: similares a los granjeros de Storj que pueden alquilar sus discos duros para alojar datos.
2. Nodos de recuperación: localizan y recuperan los archivos de los usuarios. Estos nodos reciben una recompensa en filecoin en función de la rapidez con la que encuentran los archivos.

Al igual que Sia, pero a diferencia de Storj, Filecoin operará en su propia cadena de bloques, lo que significa que procesos como la negociación de contratos y los pagos también pueden descentralizarse. Una capa será para el almacenamiento de archivos distribuidos mediante IPFS, y otra capa independiente mantendrá los contratos. En lugar de PoW, Filecoin emplea un nuevo algoritmo de consenso llamado Prueba de Almacenamiento — Proof of Storage, en inglés — que implica dos componentes separados:

1. Prueba de Replicación — PoRep — : permite que el anfitrión — host — demuestre a los usuarios que sus datos se han replicado en un almacenamiento físico determinado.
2. Prueba de Espacio y Tiempo — PoST — : proporciona una verificación de marca o sello de tiempo que indica de forma fehaciente que el anfitrión está alojando los datos

Desafíos

Filecoin aún se encuentra en etapa de desarrollo, por lo pronto, no existen actualizaciones más que una demo. Existe una creciente preocupación por parte de los inversionistas porque no conocen una fecha exacta del lanzamiento de la plataforma. Sin embargo, el proyecto ha recibido el respaldo de grandes nombres del capital de riesgo, incluyendo Andreessen Horowitz y Winklevoss Capital. Esto haría, sin duda alguna, que Filecoin se convierta en un importante jugador del ecosistema del almacenamiento descentralizado de datos.

Este artículo fue publicado originalmente en Busy.org el 18 de marzo de 2019.

Juan Francisco Bolaños
@criptoEstratega

Referencias:

  • Bolaños, J. F. (31 octubre 2018). Explicación fácil del protocolo IPFS, la web distribuida. Recuperado de http://bit.ly/2F67U5m
  • Chan, J. (5 septiembre 2018). Blockchain and Data Storage: A Perfect Match? Recuperado de http://bit.ly/2TNhTab
  • Chan, J. (11 septiembre 2018). Blockchain and Data Storage: 3 Promising Projects. Recuperado de http://bit.ly/2TJS9ex

--

--

Juan F. Bolaños

Consultor, asesor, capacitador y desarrollador de negocios blockchain | Autor del libro Criptoeconomía | Conferencista TEDx y LaBitConf | AcademiaBlockchain.com