¿Quieres saber qué implica el auge de los robots para los medios? El #periodismo en la era de la inteligencia artificial (Vol. I)

La creciente aplicación de la inteligencia artificial al periodismo ha sido uno de los grandes temas en congresos recientes como el Global Editors Network (GEN, 21–23 de junio en Viena), el International Journalism Festival (IJF, 5–9 de abril en Perugia) o el International Symposium on Online Journalism (ISOJ, 21–22 de abril en Austin). En esta serie recopilamos los principales casos de uso que hemos recopilado hasta ahora (vol. 1) y analizamos en profundidad las implicaciones (vol. 2). Llegan los robots a las redacciones… y no les tenemos miedo.

16 min readJun 23, 2017

De la transmisión de noticias de forma oral a las gacetas venecianas. De éstas, a periódicos impresos con multitud de secciones. Luego, el siglo de oro: la llegada de la radio, la posterior entrada de la televisión y, por último, la aparición de Internet y el nacimiento de medios nativos digitales. La evolución (también periodística) no se detiene. El momento actual no es una excepción: el periodismo se encuentra en la era de la inteligencia artificial.

La inteligencia artificial (IA, a partir de ahora) se entiende como la inteligencia exhibida por máquinas, o computadoras, a la hora de realizar una serie de operaciones determinadas que se consideran propias de la inteligencia humana. Y dentro de la IA, uno de sus pilares básicos son los algoritmos. En el artículo de investigación ‘Algorithmic Accountability’, el profesor de la Universidad de Maryland (EEUU) Nicholas Diakopoulos los define así: “Son los pasos definidos y tomados para resolver un problema particular o para ejecutar algo predefinido”.

Aplicada al periodismo, la IA se encuentra en su infancia. Aunque su poder se aplica ya a numerosos procesos de toma de decisiones -en priorización, clasificación, asociación o filtrado de información, por ejemplo-, no es una tecnología madura. El objetivo -ambicioso, pero real- es hacer del periodismo una profesión cada vez más automatizada… en aquello que se vaya a beneficiar de la automatización, para llegar al “periodismo aumentado” que definen los profesionales de Associated Press (AP) en su último informe, “¿Cómo la inteligencia artificial impactará al periodismo? Una guía para redacciones en la era de las máquinas inteligentes” (5 de abril de 2017).

“This new wave of automation in the business now incorporates many forms of what is commonly referred to as ‘artificial intelligence’, or if you want to get even more geeky than that, ‘cognitive technologies’. The upshot is that the machine is in the news garden, and it’s doing some thinking on its own. And that thinking, or intelligent processing, is aiding both the inputs and the outputs of journalism” (informe de Associated Press sobre periodismo e inteligencia artificial)

Tras asistir este semestre a apasionantes debates al respecto en Viena durante el Global Editors Network (GEN), en Perugia por el International Journalism Festival (IJF) y en Austin con motivo del International Symposium on Online Journalism (ISOJ), y aprovechando la publicación del apasionante informe de AP ‘A Guide for Newsrooms in the Age of Smart Machines’, en el Vocento Media Lab hemos querido detenernos a analizar las tecnologías de la IA aplicadas al periodismo, junto a una serie de ejemplos (Volumen I). Pero también a revisar los riesgos actuales y los desafíos venideros a los que nos enfrentamos en esta nueva era (Volumen II).

1. Tecnologías de IA que ya están cambiando el periodismo

Las nuevas tecnologías están cambiando la forma de ejercer la profesión. Y para muchos, la están mejorando. “[La IA] puede permitir a los periodistas analizar datos; identificar patrones, tendencias e ideas de múltiples fuentes; ver cosas que el ojo humano no puede ver; convertir datos y palabras dichas de forma oral en texto; convertir textos en audios y vídeos; comprender los sentimientos y analizar escenas a partir de objetos”, asegura el informe de AP, en el que enumeran una serie de tecnologías que ya están “aumentando” el periodismo.

1.1 Machine learning (o aprendizaje automático)

El aprendizaje automático (o machine learning) es una tecnología de la IA que proporciona a los ordenadores la habilidad de aprender sin ser programados de forma explícita. Según AP, “se basa en un proceso conocido como aprendizaje profundo (o deep learning), un método que permite descomponer una idea compleja en una serie de tareas más pequeñas y accesibles”.

O también: “Un programa que trata de reconocer datos y patrones de forma automática”, señalaba Walter Frick, editor asociado de la revista Harvard Business Review, en una conferencia. Para Frick, las ventajas son “obvias” puesto que permite a los periodistas ser “más eficientes y efectivos”.

*El robot Wall-E delante de un teclado de ordenador./ Fuente: Wikimedia Commons*

En este sentido, las fortalezas del machine learning en su aplicación periodística las expuso el periodista Andreas Graefe durante la charla ‘Guide to Automated Journalism’, durante el festival de Perugia:

Extracción o recopilación automática de datos;
Identificación de eventos/patrones/datos interesantes dentro del corpus de datos;
Visualización automática de los mismos.

1.2 Lenguajes naturales

Los lenguajes naturales son aquellos lenguajes hablados o escritos por seres humanos con el propósito de comunicarse. Y según Robbie Allen, fundador y CEO de la empresa pionera en su aplicación al periodismo, Automated Insights, la generación automática de estos lenguajes es una rama de la IA con un potencial inmenso para los medios: “Emparejando humanos y software juntos puedes producir algo que es mucho mejor de lo que puedan hacer cada uno por su cuenta”.

“Emparejando humanos y software juntos puedes producir algo que es mucho mejor de lo que puedan hacer cada uno por su cuenta”, Robbie Allen, fundador de Automated Insights

En referencia a su uso periodístico, destacan dos: la generación de lenguajes naturales (GLN) y el procesamiento de lenguajes naturales (PLN). ¿Las diferencias más evidentes entre ambos? Según AP, el primero “escribe” y el segundo, “lee”. Pero hay más. El primero -GLN- trabaja recopilando datos, estructurándolos y convirtiéndolos en una narrativa escrita (tras otorgar al algoritmo una serie de patrones de actuación). Un ejemplo es el Quakebot de Los Angeles Times.

*Captura de pantalla de la aplicación de terremotos de LA Times / Fuente: LA Times*

El segundo -PLN- lee un texto, trata de entenderlo y ofrece una contextualización, un resumen del mismo. De hecho, los resúmenes destacados del informe de AP -en recuadros de colores- se han elaborado a partir de esta tecnología desarrollada por la empresa Apolo. Igualmente, puede ayudar como servicio de traducción de textos.

1.3 Discursos

Las interfaces conversacionales están en el día a día de las redacciones. Hablamos de los artículos, de la realización de entrevistas o de la transcripción de las mismas, por ejemplo. Desde AP destacan dos funcionalidades en esta rama tecnológica. En primer lugar, el paso del texto al discurso. Este sistema -que utilizan los asistentes personales de voz como Siri de Apple o Alexa de Amazon, o The Washington Post en sus apps- trabaja analizando un texto para posteriormente difundirlo mediante una voz sintética.

A este respecto, existen muchas dudas de que esta tecnología haya logrado exhibir su máximo potencia y, sobre todo, de que vaya a ser capaz de sustituir algún día el savoir faire editorial del ser humano periodista. Martin Belam, editor de Social & New Formats en The Guardian, lo explicaba así en este artículo: “Por el momento, no estoy seguro de que la IA vaya a ser capaz de escribir una pieza de opinión de 800 palabras con mi estilo personal. Mi colega Alex Hern [reportero de Tecnología en The Guardian] ha experimentado en este área en uno de nuestros hackdays y los resultados no parecían muy prometedores”.

En segundo lugar, las tecnologías para ir del discurso al texto funcionarían al revés: convierten un discurso oral (una entrevista, por ejemplo) en un texto, lo que permite reducir una cantidad destacable de tiempo a la hora de la transcripción de entrevistas o discursos. ¿Qué periodista no ha soñado con un asistente virtual que le “pique” las entrevistas almacenadas en la grabadora o el smartphone?

1.4 Visión computacional

La visión computacional es un sistema inteligente que sirve para llegar a lugares a los que el ojo humano es incapaz de llegar de un vistazo. La importancia de esta tecnología reside en su capacidad de apoyo en numerosas tareas periodísticas. Destacamos tres de las que ofrece AP:

Ayudar a editores a clasificar y organizar una larga compilación de imágenes y vídeos de forma rápida. Esto, para los proyectos de investigación, es una bendición. Si no, que se lo digan a AP, que ganó el premio Pulitzer al Servicio Público de 2016 utilizando esta tecnología -de la empresa Digital Globe- mientras investigaba los abusos de la industria pesquera en el sur de Asia;
Tareas ‘mundanas’, como por ejemplo ofrecer información descriptiva de imágenes y vídeos de forma automática a través del reconocimiento de personas, lugares, cosas o localizaciones, y configurar así de forma automatizada esos valiosos metadatos que enriquecen las bases de datos, mejoran la recomendación inteligente de nuestros contenidos, y facilitan los sistemas de buscadores;
Análisis de eventos en directo. Hablamos de identificar movimientos de la gente durante las manifestaciones o, también, de las expresiones faciales de una persona durante un discurso, por ejemplo.

*Imágenes aéreas de un barco en el sur de Asia/ Fuente: Digital Globe y elaboración propia a partir de un trabajo de Associated Press*

1.5 Robótica

Aunque el titular de este apartado pueda llevar a confusión, no hablamos de robots como los imaginaba Isaac Asimov. Nos referimos al uso de cámaras robóticas y drones. Según los periodistas de AP, “pueden proporcionar a los periodistas un acceso visual sin precedentes, los sensores robotizados pueden medir respuestas humanas en eventos en directo y medir sucesos naturales”. Además, esta tecnología permite llegar a áreas “físicamente inaccesibles”, añaden. Un ejemplo reciente fueron las imágenes obtenidas por un dron del dramático incendio en la zona de Pedrogao Grande en Portugal, recogido aquí por Euronews.

Imágenes obtenidas por Euronews mediante un dron del incendio en Pedrogao Grande (Portugal)

2. Usos de la IA para la generación automatizada de contenidos (más o menos) periodísticos

Las tecnologías que acabamos de exponer ya se han aplicado, en mayor o menor medida, en la profesión periodística. En este apartado analizamos el recurso de la inteligencia artificial a la generación de contenidos. Al igual que hizo el editor de automatización de contenidos de AP, Justin Myers, en su intervención durante la charla ‘Guide to Automated Journalism’, en Perugia (Italia), dividimos los contenidos automatizados en dos partes:

Primero, los contenidos y/o productos generados de forma interna para uso y disfrute de los periodistas,
Y segundo, los contenidos generados de forma externa para el lector.

Producción interna

2.1 El dúo del WaPO. Poco a poco (y siguiendo fielmente las tres leyes de la robótica de Isaac Asimov), The Washington Post (WP) se ha convertido en un medio de referencia en el uso de la IA, tanto a nivel de producción interna como externa.

Durante su intervención en el ISOJ de este 2017, el director de contenidos del periódico, Joey Marburger, expuso las claves del uso de algoritmos del WP (en este enlace podéis leer un resumen en inglés del apasionante panel sobre bots en ISOJ con responsables de producto de Vox, Washington Post, Quartz, New York Times y Condé Nast, y en este otro enlace la transcripción editada que hizo Nieman Lab de la presentación de Marburger). Con respecto a la producción interna habló de dos tecnologías, que hemos apodado como el dúo del WaPo:

Virality Oracle: Con esta herramienta, los periodistas del WP son capaces de conocer qué historias se están haciendo virales (en sus primeros 30 minutos de publicación) y de predecir cuántas visitas potenciales tendrá dicha publicación. Otras empresas del mercado ofrecen soluciones similares muy avanzadas en este campo. La vía de comunicación utilizada por el WP es la aplicación Slack;
MartyBot: Si la anterior era una tecnología que te sacaba una sonrisa (si tu historia era potencialmente viral), ésta te puede llegar a desquiciar: el bot del jefe (el director del diario, Marty Baron) te alerta, también vía Slack, cuando se acerca la hora de cierre o, peor, si se ha pasado el deadline para la entrega de tu pieza.

*Diapositiva de The Washington Post sobre su ‘MartyBot’ durante el ISOJ de 2017 / Fuente: The Washington Post*

2.2 El dúo del NYT. La ‘dama gris’ del periodismo no se queda atrás en el desarrollo de tecnologías de la IA.

En los últimos años hemos podido observar que, al menos, dos herramientas automatizadas han ayudado a los periodistas del diario neoyorquino a ser más eficientes:

Blossom: Esta herramienta es similar a Virality Oracle. La diferencia es que Blossom sugiere qué publicaciones deberían publicarse en redes sociales y en qué momento, además de predecir qué historias tienen mayor potencial viral;
Editor: El The New York Times Research and Development Lab desarrolló en 2015 un algoritmo que permitía reconocer personas, localizaciones, organizaciones o conceptos mientras el periodista escribía el artículo [ver vídeo]. “Las posibilidades son enormes. Imagina estar citando una historia anterior y que la tecnología te ayude a verificar o vincular a esa fuente”, se afirma en este artículo en Poynter. Aun así, la herramienta no estaba exenta de posibles errores, según reconocían los responsables del experimento.

2.3 BBC Juicer. En el mismo artículo de Poynter se cita otro agregador similar al Editor del NYT: Juicer, de la BBC. Funciona desde 2012 y permite categorizar contenidos por personas, lugares y organizaciones (aunque no lo puede hacer en tiempo real), a modo de “exprimidora” del potencial que ofrece la relación y categorización inteligente de contenidos.

2.4 AP y la ayuda a reporteros. Associated Press, quizás el gran profeta de los usos periodísticos de la IA, predica con el ejemplo con una herramienta muy útil para sus periodistas. Según Myers, cuando un departamento público sube a su página web una serie de datos, el algoritmo de AP los analiza para, posteriormente, enviar un correo electrónico de alerta -con datos detallados- a periodistas especializados en el ámbito en cuestión, periodistas de investigación e, incluso, editores del medio.

Estos programas “chivatos” han sido probados también en España para detectar la publicación de contenidos nuevos o relevantes en el BOE, por ejemplo, por la Fundación Civio, o en las webs de los partidos políticos y en los perfiles de sus dirigentes, como nos mostró el periodista especializado en Antonio Delgado en las sesiones de formación de periodismo de datos en Vocento.

*Captura de pantalla de una diapositiva del periodista Justin Myers durante su intervención en Perugia./ Fuente: AP y elaboración propia*

Contenidos externos (además del citado de Digital Globe)

2.5 El dúo (externo) del WaPo: Marburger no sólo habló, en su intervención en el ISOJ, de prácticas o pruebas de automatización en la producción interna de The Washington Post. El responsable de producto del diario de Bezos destacó cómo generan contenidos externos de forma automática a partir de los Feels Bots y de Heliograf.

Heliograf: Este “agente inteligente” es capaz de: i) generar historias de forma automática en el mismo momento que se publican los datos sobre los que trabaja, ii) distribuir las historias por canales específicos y iii) personalizar historias para los lectores. Esta herramienta la ha utilizado el WP para hablar sobre los resultados de los Juegos Olímpicos de 2016 y las pasadas elecciones estadounidenses;

Feels Bot: Son bots conversacionales sobre Facebook Messenger con un toque especial: con Feels, el diario pregunta a sus lectores por sus sentimientos sobre las (pasadas) elecciones. Nos encantó cómo visualizaron luego los resultados obtenidos (con emojis, claro) en la web del periódico. Según indicó Marburger, tuvieron un bajo impacto en cuanto a número de usuarios. No obstante, entre los que sí siguieron al bot hubo un algo ratio de engagement (más de un 65% de los usuarios respondía al robot).

*Diapositiva de The Washington Post sobre su ‘Heliograf’ durante el ISOJ de 2017./ Fuente: The Washington Post*

2.6 Cómo ‘aumenta’ AP: Los profesionales de AP se han servido de la IA para “aumentar” sus capacidades periodísticas gracias a robots en varios proyectos:

JJOO y refugiados: AP se sirvió de tecnología robótica para contarnos qué ocurría en los Juegos Olímpicos de Río de Janeiro de 2016 y durante la crisis de refugiados en Oriente Medio. Para el primero, utilizó 11 cámaras robotizadas y 16 remotas con el objetivo de llegar “a áreas físicamente inaccesibles”, según exponen en su informe, ya mencionado. Para mejorar su cobertura de la crisis de refugiados, se sirvieron de drones para poder contar -mediante imágenes aéreas (que puedes ver en este enlace)- los desplazamientos de iraquíes en localidades difícilmente accesibles como Dibaga, al sureste de Mosul (Iraq).
Finanzas y béisbol: Uniendo tecnologías de machine learning y generación de lenguajes naturales (GNL), AP ha incrementado y mejorado su cobertura de información financiera periódica, como los resultados trimestrales de empresas: pasaron de publicar 300 noticias hechas “a mano” por redactores a 3.700 piezas, gracias al papel de los “robots”. Lo mismo han hecho con ligas menores de béisbol, muy populares en EE.UU., y que ahora cubren cada semana gracias a la generación automática de crónicas de partido a partir de las estadísticas y resultados oficiales, fruto de su asociación con la compañía Automated Insights.

2.7 El proyecto ‘Medusa’ de Vocento: Desde Vocento Media Lab intentamos aportar nuestro grano de arena con dos experimentos, infoPlayas e infoEsquí, pertenecientes al que llamamos “Proyecto Medusa”, y del que ya hemos resumido todas las claves en este artículo.

Captura de la nueva versión de infoPlayas, el desarrollo automatizado de estado de las playas de los diarios regionales de Vocento

Ambas aplicaciones de información de servicio automatizada son los primeros productos testados que hemos desarrollado sobre la plataforma de reaprovechamiento de bases de datos que hemos construido. Con ella, utilizando tecnologías como la generación de lenguajes naturales (GLN) a partir del ‘crawleo’ de diferentes bases de datos (del tiempo o del estado de playas o pistas de esquí, por ejemplo), normalizamos la información en una base de datos de MongoDB y “pintamos” vía API los resultados deseados en nuestras páginas web o cuentas de Twitter, sin que esté de por medio la mano del ser humano (bueno, sí, para decirle al algoritmo qué tiene que hacer).

*Captura de pantalla de la página de Sierra Nevada, en infoEsquí./ Fuente: Vocento Media Lab y elaboración propia.*

2.8 Sondeos electorales en El Mundo: Los compañeros de El Mundo Data han aplicado parte de la IA en su agregador de todos los sondeos electorales que se realizan en España. Si bien la elaboración de la base de datos se realiza de forma manual, la visualización se actualiza de forma automática cuando la base de datos sufre modificaciones.

*Captura de pantalla de la visualización de sondeos electorales elaborada por El Mundo Data / Fuente: El Mundo*

2.9 Quartz: qué dicen las expresiones de Trump. El portal Quartz utilizó las tecnologías de machine learning y visión computacional durante los discursos de aceptación (8 de noviembre de 2016) e inaugural (20 de enero de 2017) de Donald Trump como presidente de Estados Unidos. A partir de un algoritmo desarrollado por Amir Imani, científico de datos en la Universidad de Columbia, en Quartz analizaron las expresiones faciales de Trump con el objetivo de conocer cuáles eran sus sentimientos mientras hablaba a la ciudadanía estadounidense.

*Captura de pantalla de los gráficos que ‘pintan’ los sentimientos de Donald Trump durante sus discursos de aceptación e inaugural./ Fuente: Quartz*

2.10 Futboleros en Der Spiegel: Durante la conferencia ‘Collaborating with algorithms’, en Perugia, la periodista Christina Elmer, del diario alemán Der Spiegel, expuso dos proyectos -de cobertura futbolística- en los que el semanario alemán ha realizado algunas pruebas de automatización. En primer lugar, describió un sistema que recoge estadísticas básicas y datos de jugadores de la Bundesliga -la Primera División del fútbol alemán- a partir de puntuaciones de los futbolistas en los partidos, basadas en hasta 50 factores diferentes. El “robot” pondera de forma distinta a los futbolistas en función de su posición en el terreno de juego.

Según destacó Elmer, esta información otorgaba un valor más “objetivo” a la hora de valorar la actuación de los jugadores (un colega de Der Spiegel nos ha confirmado para este artículo que hicieron la prueba y no han continuado con el experimento). En segundo lugar, Elmer presentó una herramienta de visualización interactiva que recoge los movimientos tácticos realizados por cada equipo durante los partidos, y que los periodistas deportivos de Der Spiegel pueden embeber en sus propios artículos como contexto visual al análisis del partido.

2.11 Terremotos y homicidios en LA Times: Se considera que el rotativo californiano fue el primero en introducir el “periodismo-robot” en los medios de comunicación. Lo hizo, como es conocido, con la publicación automática de una noticia cada vez que se produce un terremoto de más de 3 grados en las escala Richter, a partir de losdatos del United States Geological Survey (USGS). Tiempo después, comenzaron a registrar (y publicar) con un bot los homicidios que se cometían en Los Ángeles en The Homicide Report.

*Captura de pantalla de la aplicación sobre homicidios en LA Times./ Fuente: LA Times.*

2.12 Elecciones francesas en Le Monde: En las elecciones departamentales de Francia de 2015, Le Monde se sirvió de un algoritmo -generado por Data2Content- para generar noticias automáticas con los resultados electorales en función del territorio seleccionado. En este artículo de Vocento Media Lab ya recogimos las declaraciones del director adjunto de Le Monde, Luc Bronner: “El uso de robots abre nuevas perspectivas y ofrece nuevos servicios a nuestros lectores. En ningún caso reemplaza en nada al periodismo. Los periodistas de Le Monde no habrían tenido la capacidad de producir 30.000 artículos para los 30.000 municipios en una noche. Estos textos no pretenden ser ni análisis […] ni reportajes”.

2.13 Reuters y Graphiq: En agosto de 2016, Reuters anunció un acuerdo de colaboración con la empresa Graphiq. Dicho acuerdo permitía a la agencia periodística acceder a la extensa base de datos de visualizaciones interactivas de Graphiq, que construye y actualiza todas las visualizaciones en tiempo real.

*Captura de pantalla de Graphiq, donde explica cómo son sus visualizaciones / Fuente: Graphiq*

2.14 United Robots: A través de su robot Rosalinda, esta empresa tecnológica sueca transforma datos de partidos de fútbol, hockey, balonmano, baloncesto y hockey sobre hielo en artículos “para su publicación inmediata y automática”, afirman en su página web. Esto lo hacen a partir de las tecnologías de machine learning y de generación de lenguajes naturales (NLG), y lo hemos incluido en este censo por su potencial interés para el “periodismo aumentado” del que hablan los expertos de Associated Press.

Este artículo ha sido elaborado por Carlos Muñoz a su paso por el Vocento Media Lab como becario de periodismo de datos y editado por Miguel Ángel Villar, product manager del Vocento Media Lab, y Borja Bergareche, director de Innovación Digital de Vocento.

ANEXOS
En la segunda parte de esta serie, analizamos las implicaciones éticas y profesionales que esta era del algoritmo tiene para el periodismo.
En este otro artículo analizábamos en julio de 2016 los primeros bots conversacionales o chatbots. Lo incluimos aquí para entender lo rápido que han evolucionado las aplicaciones periodísticas de la inteligencia artificial.