Los superdialectos del español global

Francisco Moreno-Fernández
5 min readDec 10, 2014

La noticia corrió como pólvora digital desde que apareció en MIT Technology Review: «Twitter revela la existencia de dos superdialectos del español». Bruno Gonçalves y David Sánchez, físicos de las universidades de Toulon y de las Islas Baleares respectivamente, acababan de publicar, el 26 de julio de 2014, los primeros resultados de un estudio dialectal realizado sobre el léxico de 50 millones de tuits geolocalizados y enviados desde todo el mundo a lo largo de dos años. El estudio se titulaba «Crowdsourcing Dialect Characterization through Twitter» y concluía que el léxico de los mensajes analizados venía a ordenarse, a escala global, en dos grandes grupos, denominados «superdialectos» y localizados, el primero, en las grandes ciudades hispanohablantes y, el segundo, en las áreas rurales. Dentro de este último, el algoritmo aplicado distinguía tres subagrupaciones léxicas, localizadas en España, en el Cono Sur y, finalmente, en México, Centroamérica y el Caribe, junto a los Estados Unidos. La noticia llamaba la atención por muchos motivos, pero entre ellos destacaba, sin duda, la implicatura de que podríamos estar ante el germen de un español internacional, que se habría fraguado en las grandes urbes hispánicas y que podría derivar en la creación de un globañol, paralelo a lo que Jean-Paul Nerrière llamó Globish para el inglés. La disputa protagonizada por Juan Valera y Rufino José Cuervo, entre 1899 y 1903, sobre la posible fragmentación lingüístico-cultural del mundo hispánico parecería dirimirse en contra de las tesis disgregacionistas de Cuervo.

La metodología de esta investigación dialectológica, diseñada por expertos en sistemas complejos, se presenta como una innovación que ha permitido pasar de los pocos centenares de informantes manejados por la dialectología tradicional, generalmente para la confección de atlas lingüísticos, a los mensajes emitidos por miles de hablantes, a través de la red social Twitter. Los datos que se recuentan son las variantes léxicas utilizadas en los tuits para referirse a 43 conceptos u objetos: por ejemplo, carro, coche, auto, automóvil, …; gafas, lentes, espejuelos, anteojos, …; palomitas, pipocas, popcorn, cotufas, rositas, … Los investigadores hallaron 750.000 mensajes en los que aparecían esas variantes, con su localización de origen, que hizo posible cartografiar las respuestas mayoritarias correspondientes a cada concepto. Así, uno de los mapas obtenidos muestra el uso mayoritario de la palabra nevera en España, parte de las Antillas, Venezuela y norte de Colombia, mientras que refrigerador predomina en México, Centroamérica y la costa Pacífica de Suramérica, y heladera en el resto del Cono Sur. Con todo, es muy importante aclarar que la relación de variantes rastreadas fue la establecida por el proyecto internacional Varilex, coordinado por el hispanista japonés Hiroto Ueda, que utilizó un sistema de cuestionarios aplicados a cuatro hablantes de un centenar de ciudades hispánicas para la recogida de léxico moderno. Finalmente, Gonçalves y Sánchez sometieron todas las variantes léxicas a un análisis de componentes principales que sirvió para conocer su variabilidad y descubrir la existencia de los dos superdialectos mencionados.

La verdad es que la incorporación de saberes procedentes de disciplinas científicas sobre un objeto de estudio tan «humanístico» como la lengua es algo digno de celebrarse. La geografía lingüística, que nunca ha sido reacia a las innovaciones técnicas, ha de enriquecerse con la incorporación de los análisis de sistemas complejos y con la atención a las manifestaciones multimodales de la lengua. Pero eso no exime de responsabilidades a los lingüistas, que conservan una excelente posición para verificar si los descubrimientos tienen sentido geolingüístico. No puede olvidarse, por ejemplo, que la aplicación de esta nueva metodología ha sido posible gracias al trabajo previo de Ueda, hecho con cuestionarios e informantes, al viejo estilo, que estableció una lista fiable de variantes léxicas para cada concepto, lo que habría sido imposible a partir del simple registro de los tuits. De igual modo, es imprescindible detenerse en los pormenores cualitativos del análisis porque, según los autores, el superdialecto urbano se caracteriza por reunir la mayoría de las variantes, de las que solamente cinco son exclusivas de él: acera, parabrisas, calzoncillos, sandalias y refrigerador. El problema está en que esas palabras no se utilizan no ya en todas, sino en la mayoría de las capitales hispanohablantes: refrigerador es mayoritaria solamente en seis países, calzoncillos en ocho, sandalias en seis. Siendo así, lo que parece unir realmente a las ciudades es su diversidad léxica -lógica, si se piensa en la multiplicidad de procedencias de sus integrantes- y no tanto el uso exclusivo de unas pocas formas que no son reconocidas como mayoritarias. Menos importancia tiene el hecho de que la noción de «superdialecto» ya fuera propuesta en 1982 por el colombiano Montes Giraldo para referirse a dos grandes variedades del español: la de fonética innovadora y la de fonética conservadora, localizadas ambas en España y en América.

La existencia de un superdialecto rural, ramificado en tres grandes áreas, no hace más que ratificar en el uso de Twitter lo que la geografía lingüística «convencional» ha explicado con muchos más detalles. España, donde funcionan tres grandes normas cultas -la castellana, la andaluza y la canaria- se comporta de manera más homogénea cuando se trata de léxico referido a objetos de la vida moderna cotidiana. En América, la distinción de las áreas mexicano-centroamericana, caribeña, andina, rioplatense y chilena es bien conocida, aunque entre ellas pueden producirse coincidencias dependiendo de los elementos lingüísticos que se consideren, porque no es lo mismo analizar unas decenas de palabras contemporáneas, que el léxico patrimonial o los extranjerismos, por no hablar de otros niveles, como el gramatical, el fónico o el discursivo. En el estudio de Gonçalves y Sánchez, no obstante, resulta llamativo que se afirme, a partir de un léxico limitado, que las regiones identificadas «reflejan los patrones de asentamiento y de la administración colonial española», no porque no existieran tales «patrones», como demuestra la bibliografía hispánica que los autores no han manejado, sino porque no deja de ser curioso que esos patrones puedan deducirse analizando las formas de llamar a los ordenadores, los lavaplatos, los parabrisas las farolas o el papel de aluminio, cuyo uso no pudo ser más escaso durante el periodo de la colonización.

Más allá de las debilidades metodológicas de la investigación dialectal que nos ocupa, dos conclusiones merecen resaltarse. En cuanto a la lengua, que las grandes ciudades hispánicas, sea por su diversidad intrínseca, sea por la convergencia de modos de vida, constituyen un caldo de cultivo idóneo para la globalización paulatina del léxico contemporáneo, favoreciendo de este modo la cohesión interna de la lengua. Y, en cuanto al análisis en sí, que la aplicación de métodos y técnicas procedentes de la física sobre materiales lingüísticos producidos en las redes sociales es un aporte que enriquece los estudios dialectales de naturaleza filológica e histórica. Pero esta realidad no debería ser excepcional. De hecho, Steven A. Pinker comentó recientemente en la Universidad de Harvard que la integración de las ciencias y las humanidades es un imperativo de la vida intelectual contemporánea, y los estudios de redes complejas están demostrando su capacidad para abordar los más diversos asuntos, desde las epidemias a las redes eléctricas; y desde el genoma humano al lenguaje, incluida la identificación de superdialectos.

--

--