El regreso a MS-DOS

MS-DOS era una interfaz de texto con la que podíamos interactuar con el sistema a través de comandos simples para ver los archivos y carpetas en una ubicación (C:\>dir) o cambiar de ubicación (C:\> cd), entre muchas otras operaciones y estoy seguro que pronto regresaremos a utilizarlo.

Pantalla de MS-DOS
“… centralizar todo en un sólo lugar a través de comandos de texto que me permiten por ejemplo crear un nuevo servidor, revisar el status de un sitio web, y hasta checar o mandar un tweet.”

Durante los últimos tres años he transicionado de utilizar interfaces gráficas (GUIs) para hacer mi trabajo diario a realizar casi todas mis actividades laborales a través de interfaces de comando de línea (CLIs). Al inicio, tras casi 15 años de utilizar interfaces gráficas, la transición fue muy compleja, dejar de utilizar Sublime Text y moverme con el mouse a utilizar Vim y trabajar con comandos como h, h, k, l, v, V, :q era imposible. Hoy, este tipo de flujo de trabajo me ha permitido aumentar mi productividad y centralizar todo en un sólo lugar a través de comandos de texto que me permiten por ejemplo crear un nuevo servidor, revisar el status de un sitio web y hasta checar o mandar un tweet.

La interfaz de línea de comandos o interfaz de línea de órdenes (en inglés, command-line interface, CLI) es un método que permite a los usuarios dar instrucciones a algún programa informático por medio de una línea de texto simple.

En un punto al finalizar esta compleja transición me di cuenta de la increíble capacidad que yace en la línea de comando, la posibilidad de controlar todo en un sólo lugar con unos pocos comandos.

Vista de un directorio utilizando Alfred

Lamentablemente para mi no todo se podía controlar a través de esta interfaz, ahí fue cuando comencé a utilizar Alfred. Una aplicación para macOS que permite realizar acciones similares a la línea de comando utilizando una interfaz de texto.

El problema con todo lo bueno es que uno siempre quiere más, una vez controlada mi estación de trabajo la siguiente parada era mi celular. En mediados 2014 cuando todo esto inició Siri aún no podía manejar todas las aplicaciones ni mandar un simple mensaje de WhatsApp y lo más cercano a lo que buscaba eran aplicaciones como Workflow que permiten crear flujos de trabajo con un sólo click. Pero no era suficiente para mi, así que decidí crear un servidor en DigitalOcean, pasar todo mi flujo de trabajo ahí y conectarme utilizando Prompt, una terminal SSH que se conecta con mi servidor.

TL;DR. Demasiada historia ¿Por qué dices que regresaremos a MS-DOS?

Si no se han dado cuenta aún, toda la descripción que he dado: controlar todo en un sólo lugar a través de algunos comandos escritos es demasiado similar a esta descripción:

Amazon Echo is a hands-free speaker you control with your voice. Echo connects to the Alexa Voice Service to play music, provide information, news, sports scores, weather, and more — instantly. All you have to do is ask.

“Amazon Echo es una bocina manos libres que controlas con tu voz. Echo se conecta al servicio de voz Alexa para reproducir música, proporcionar información, noticias, resultados deportivos, tiempo y más, al instante. Todo lo que tienes que hacer es preguntar.”

Una interfaz unificada que da instrucciones a algún programa informático por medio de una interfaz de voz simple. La definición anterior es idéntica a la definición de la línea de comando únicamente sustituyendo “línea de texto” con “interfaz de voz”.

Una interfaz unificada que da instrucciones a algún programa informático por medio de una interfaz de voz simple.

WTF. Pero Siri, Cortana o Alexa no funcionan tan bien ¿Por qué crees que se harán tan universales como MS-DOS lo fue alguna vez?

Día con día los procesadores de voz mejoran. Recientemente he trabajado con el procesador de voz de IBM, Watson, y aunque tiene muchos problemas al momento de trabajar en un ambiente ruidoso, en un ambiente silencioso los problemas son muchos menores y en un ambiente complejo el reconocimiento de palabras clave sigue siendo muy útil. Y estoy hablando del procesador en español, la versión en inglés es aún mejor.

Además, distintos servicios web y aplicaciones se preparan día a día para esta transición, ofreciendo APIs que puedan trabajar a través de comandos de voz o texto (chatbots).

En conclusión, poco a poco regresaremos a MS-DOS, interfaces que a través de comandos dan instrucciones a algún programa informático para escribir una carta, leer correos y hasta pedir una pizza.

Y aunque parezca que hay un mundo de diferencia entres las interfaces de voz y las de texto que ofrece el comando de línea ya que estas son más naturales, lo que es cierto es que las interfaces de voz únicamente son una capa más de abstracción sobre los programas que se ejecutan de una manera similar o idéntica a los utilizados en línea de comando.

No estoy diciendo que todos los casos de uso o flujos de trabajo serán sustituidos, mucho menos en el caso de programación, edición de video o fotografía, o casos de uso “profesionales”, pero si muchos flujos cotidianos como revisar correos, leer las noticias, prender y apagar un foco, o cambiar la temperatura del cuarto serán sustituidos y quizá veamos un futuro como esté:

Trailer: Her