infoPlayas e infoEsquí, dos experimentos de “periodismo-robot” para los lectores

Vocento Media Lab
9 min readMar 27, 2017

--

Los copos de nieve caídos en Madrid hace unos días nos han servido en Vocento para hacer la transición del desarrollo de información automatizada sobre nieve, infoEsquí, hacia la nueva versión del canal sobre el estado de las playas, infoPlayas 3.0. Ambos desarrollos representan materializaciones concretas del proyecto de tratamiento y reaprovechamiento periodístico de bases de datos que impulsamos desde el Vocento Media Lab. El llamado “proyecto Medusa” tiene el objetivo de experimentar con modelos de periodismo-robot para generar de forma automatizada contenidos que sean de interés para los lectores de nuestros medios, y que ayuden además a los equipos técnicos de Vocento a innovar en este campo.

InfoPlayas e infoEsquí ofrecen respectivamente información de servicio de forma completamente automatizada de unas 800 playas españolas y de todas las estaciones de esquí de España, Andorra y del Pirineo francés. La arquitectura técnica del proyecto está basada en “crawlers” (arañas) que extraen datos de diferentes fuentes de internet que normalizamos y guardamos en una base de datos sobre la que lanzamos consultas mediante un API market. Esta sería una representación funcional… de trazo muy grueso.

Arquitectura de los desarrollos del “proyecto Medusa”

El resultado es un producto multi-cabecera de información de servicio orquestado por un API de playas y montañas, que es consumido por distintos “clientes”: un front-end en forma de web “mobile-first”, bots que tuitean automáticamente datos de última hora o ciertos eventos (por ejemplo, detectada presencia de medusas en la playa X), y chatbots -o bots conversacionales- de Telegram (por ahora) a los que puedes preguntar por el estado de la nieva en una estación de esquí determinada.

“El llamado “proyecto Medusa” tiene el objetivo de experimentar con modelos de periodismo-robot para generar de forma automatizada contenidos que sean de interés para los lectores de nuestros periódicos”

“Cada vez hay más fuentes de datos en internet, y cada vez es por tanto más complicado para el usuario saber qué información le aporta valor, cuál tiene más calidad y si realmente le ofrece lo que necesita”, explica Borja Bergareche, director de Innovación de Vocento. Con este producto resolvemos ese problema “crawleando” varias fuentes de datos abiertos y normalizando esos datos para tenerlos ordenados, igualados y “aseados” en una base de datos de MongoDB. Así, de un simple vistazo el usuario puede ver todo lo que necesita y ahorrar tiempo en la consulta: la temperatura, estado del mar y bandera en el caso de las playas en verano, o el tipo de nieve, los kilómetros esquiables y el parte de tiempo para los esquiadores.

Pongamos un caso de uso muy simple: un esquiador tiene pensado subir el fin de semana a una estación de esquí pero tiene dudas sobre cuál es la estación que tiene mejores condiciones en cuanto a la calidad de nieve, al parte de climatología, el número de pistas abiertas o los servicios disponibles (como guardería, o parking). Para sacar toda esta información tendría que visitar diferentes fuentes, como la página oficial de la estación, el estado de las carreteras, un servicio del tiempo etc., y repetir el proceso con el resto estaciones de esquí que esté considerando. Un proyecto como infoEsquí pretende recopilar toda esa información automáticamente, sin intervención de un periodista o especialista de la redacción, y ofrecer al usuario una ficha o “noticia” con estos datos normalizados y disponibles de un simple vistazo en una web, webapp, red social o incluso en una aplicación de mensajería.

Un API market para varios productos

El “proyecto Medusa” ha terminado por generar un API market con diferentes servicios, entre los que están (por ahora, porque ya estamos pensando en los siguientes servicios) los diferentes listados de playas o de estaciones de esquí, y las fichas de cada playa o estación con todos los campos de información definidos. Con la siguiente captura se entiende más fácil.

Captura parcial del API market del “proyecto Medusa”

infoPlayas

Tras una primera prueba de concepto en el verano de 2015, el verano pasado desplegamos infoPlayas 2.0 como un desarrollo “mobile-first” para los medios regionales de Vocento (a excepción en este caso de El Correo y el Diario Vasco) en el que damos información del estado de más de 600 playas de las costas españolas. Entre las variables que ofrecemos figuran el tiempo, la temperatura, la sensación térmica, el estado del mar, la posible presencia de medusas olas banderas de Cruz Roja, además de información específica para el surf en aquellas playas donde se practica este deporte.

Así definíamos infoPlayas en la breve nota metodológica que acompaña a cada ficha de playa, como esta de San Vicente de la Barquera en Cantabria.

Esta previsión del estado de la playa ha sido elaborada de forma automática por un algoritmo que hemos bautizado como “infoPlayas”, a partir de la información que publican periódicamente la Agencia Estatal de Meteorología y la Cruz Roja. Si has notado que faltan playas, se debe a que estas dos fuentes oficiales no publican información sobre ellas. En algunos casos, verás que una misma playa aparece numerada con distintos nombres: la razón es que la Cruz Roja recoge información por cada uno de los puestos de socorro que tenga la playa. En cualquier caso, os pedimos disculpas por adelantado por cualquier error que pueda generar nuestro “robot” de playas. Este desarrollo es un proyecto experimental de <medio> y los equipos de innovación y tecnología del Vocento Media Lab.

Para infoPlayas desarrollamos este front-end, que consume la API beach para que los lectores pueden consultar el listado de playas de su comunidad o las más cercanas y el estado de las mismas. Este gif muestra la actual versión 2.0, que estamos ya revisando de cara a evolucionar alcance, diseño y funcionalidades en una versión 3.0.

infoPlayas de El Diario Montañés

Acompañando al producto web de infoPlayas, tenemos un bot configurado para publicar tuits de forma automática desde la cuenta del medio y avisar a nuestros lectores del estado de las playas en general, o de ciertos eventos como la presencia de medusas, banderas rojas, y más información que genera la Cruz Roja. Con esta parte del desarrollo cumplimos el hito de dejar que sea un robot quien publica, con todas las debidas garantías y mecanismos de control, directamente desde nuestros perfiles en Twitter, la red que más posibilidades permite a estos efectos. Este sería un ejemplo de tuit:

Tuit Automático #infoPlayas

infoEsquí

Con los aprendizajes adquiridos en nuestras incursiones playeras, preparamos para la temporada de nieve que ahora termina la primera versión de infoEsquí, otro desarrollo “mobile-first” que en este caso desarrollamos para los doce diarios regionales de Vocento (El Correo, El Diario Vasco, Diario Montañés, el Comercio de Gijón, Norte de Castilla, diario La Rioja, Las Provincias, La Verdad de Murcia, Hoy de Badajoz, Ideal, Sur de Málaga y León Noticias) y también ABC.es.

Este infoEsquí 1.0 es el primer desarrollo de la familia “Medusa” que lanzamos para todas las cabeceras de diarios del grupo, con el reto añadido que implica de asegurar un correcto funcionamiento de la multi-cabecera y proteger la identidad y especificad de cada medio. Además, otro hito en los objetivos propuestas ha sido el patrocinio del desarrollo con anunciantes como Turismo de Aragón o El Corte Inglés.

Captura del detalle de la estación de Sierra Nevada en hoy.es

Esta primera versión de infoEsquí, con un diseño algo más avanzado que el desarrollo de playas, recoge información de todas las estaciones de España, Andorra y de los Pirineos, con información actualizada del tiempo, estado de las pistas, calidad de nieve y servicios de la estación de esquí. Así se describe en la nota metodológica:

Esta información sobre el estado de las estaciones de esquí de España, Andorra y los pirineos franceses ha sido elaborada de forma automática por un desarrollo que hemos bautizado como “infoEsquí”, a partir de la información que publican periódicamente ATUDEM (Asociación Turística De Estaciones de Esquí y Montaña de España), Les Pyrénées (Observatorio Pirenaico de Turismo-Confederación Pirenaica de Turismo de Francia) y las páginas web oficiales de cada estación de esquí. Además mostramos información meteorológica proporcionada por las empresas Weather2 y Meteobit. Si faltan estaciones o los datos son incompletos, se debe probablemente a que estas fuentes oficiales no lo incluyen. En cualquier caso, os pedimos disculpas por adelantado por cualquier error que pueda generar nuestro “robot” de estaciones de esquí. Si tenéis alguna sugerencia, queja o comentario, podéis escribirnos a lab@vocento.com.

De nuevo, hemos desarrollado un frontal que consume la API mountain para que los lectores puedan consultar el listado y detalle de las estaciones de cualquier región de España, Andorra y Pirineos Franceses, como se puede ver en el siguiente vídeo.

infoEsquí en su versión para desktop

Para infoEsquí, y con el objetivo de explorar mecanismos de auto-distribución de este tipo de desarrollos, hemos lanzado también dos bots conversacionales en Telegram para el Correo y el Diario Vasco con los que el usuario puede interactuar preguntando por el estado de una estación en particular o por alguna región de esquí. El bot responderá visualizando parte de la información en la aplicación de Telegram, que viene acompañada de un enlace al medio para que se pueda ver el detalle completo de la estación.

Bot Telegram.

Podéis poner a prueba nuestros bots a través de estos enlaces a Telegram en:

Al igual que en el desarrollo de playas, acompañando al producto web de infoEsquí tenemos otro bot configurado para publicar tuits de forma automática. Cada medio tuvo la oportunidad de definir la frecuencia, contenido y pautas de publicación de los tuits más adecuadas a los intereses de sus lectores, a los que se informa también por esta vía “one-to-one” del estado de las pistas de esquí para que puedan planificar sus vacaciones, o consultar las estaciones más cercanas.

Para estos tuits, hemos configurado en el producto las twitter cards para conseguir mayor engagement de los usuarios y mejorar la experiencia.

Tuit Automático #infoEsquí de Ideal

Esquema ágil de desarrollo (scrum)

En el desarrollo de estos productos hemos trabajado con metodologías agile, concretamente scrum, involucrando a diferentes equipos técnicos de Vocento, además de los del Lab y los responsables editoriales de ABC y de nuestros medios regionales: diseño, UX, maquetación, desarrollo front-end, desarrollo back-end, y los equipos de sistemas e infraestructuras para la evolución del producto con herramientas de integración continua.

El equipo de infoEsquí 1.0 (de izda. a dcha.): Miguel (product manager), Isabel (maqueta), Rebeca (diseño), Borja (innovación), Carlos (becario de #periodismodatos), Esther (desarrollo front) y Sergio (desarrollo) [nos falta Alejandro, desarrollo back y domador de nuestra familia de “arañas” y bots]

Gracias a la transparencia que exige el scrum y al ritmo de reuniones semanal que requieren los sprines de 2–3 semanas, hemos conseguidos resultados rápidos en la evolución del producto.

Pizarra scrum (JIRA)

Además, con las herramientas de integración continua empleadas en el área de Tecnología hemos podido realizar despliegues periódicos cada poco tiempo, al finalizar cada sprint y guiados por los requerimientos del negocio, comprobando tras cada subida a producción cómo aumentaba la funcionalidad del producto y consiguiendo así reducir sensiblemente el time-to-market.

Por Miguel Angel Villar Gutiérrez, Product Manager de Vocento Media Lab

--

--

Vocento Media Lab

We´re the Media Lab for Spain´s largest press group / Laboratorio de innovación y experimentación de Vocento, el grupo de prensa con mayor difusión en España