¿Empezando con Inteligencia Artificial? ¡Empieza aquí!

Todo lo que necesitas saber para zambullirte en tu proyecto

Cassie Kozyrkov
Ciencia y Datos
19 min readApr 30, 2019

--

Traducido por Carlos Secada del original por Cassie Kozyrkov (editado por Felipe Chiriboga)

Muchos equipos intentan iniciar un proyecto de inteligencia artificial aplicando algoritmos y datos, antes de definir los resultados y objetivos deseados. Desafortunadamente, eso es como criar a un cachorro de pastor alemán en un apartamento de la ciudad de Nueva York durante varios años, y luego sorprenderse por que no es capaz de arrear ovejas.

No puedes esperar obtener algo útil pidiéndole a un mago que rocíe magia de Machine Learning sobre tu negocio, sin un esfuerzo de tu parte primero.

En cambio, el primer paso debe ser dado por el propietario, — ¡ese eres tú! — para obtener una visión clara de lo que quieres de tu perro (o de tu sistema de Machine Learning o Inteligencia Artificial — ML/IA) y para saber si lo has entrenado exitosamente o no.

Mi artículo anterior discutió el por qué, ahora es el momento de profundizar en el cómo dar este primer paso de ML/IA, con todos sus pequeños sub-pasos.

Esta guía tiene una gran cantidad de contenido y es larga, así que siéntete libre de hacer un curso intensivo de dos minutos sólo mirando los encabezados y el texto en negrita, o también puedes dirigirte directamente a la versión resumen estilo lista de verificación. Aquí te presento el índice de contenidos:

  • Averigua quién está a cargo
  • Identifica el caso de uso
  • Haz algunas validaciones versus la realidad
  • Crea una métrica de desempeño eficiente
  • Establece criterios de las prueba, para evitar los sesgos humanos

Los Actores de Reparto : son el responsable de la toma de decisiones, de control de ética, ingeniero de ML/IA, analista, experto cualitativo, economista, psicólogo, ingeniero de confiabilidad, investigador de IA, experto en negocio, especialista en UX, estadístico, teórico de control de IA.

Asegúrate de que se le asigne el primer paso en Machine Learning e IA a la persona adecuada. Más información aquí y aquí.

Averigua quién está a cargo.

Las tareas que estamos por abordar son responsabilidad del responsable del proyecto. Ese, es el que toma las decisiones. Si se selecciona a un investigador con PhD para este rol, debe ser debido a las habilidades de decisión de esa persona y al profundo conocimiento de tu negocio. Si estás a punto de asignarlo a este rol para luego re-evaluarlo más tarde, has elegido a la persona equivocada. La entidad a la que llamamos El-Tomador-de-Decisiones (podría ser una persona o comité) es la que se supone tiene la última palabra. Elige sabiamente a tu dictador benevolente.

Si el que toma la decisión es alguien sobre quien planeas tener una segunda opinión más adelante, lo estás haciendo mal.

Si el que toma las decisiones no está bien versado en el arte y la ciencia de la toma de decisiones, hay una solución: júntalo con un experto cualitativo. Pero si la persona a cargo no entiende tu negocio, puede que en este momento simplemente estés malgastando el dinero.

Identifica el caso de uso

Enfoque en los resultados

La clave es saber que ML/IA no es magia y no resuelve todos los problemas. Es un etiquetador de cosas y depende de ti averiguar lo que necesita ser etiquetado.

Etiquetar cosas no solo significa clasificación: “¿Es esta la foto de un gato o no?” Eso no es pensar en grande. Por etiqueta me refiero al resultado o salida. Podría ser una categoría, un número, una oración, una forma de onda, una identificación de grupo, una sola acción, un movimiento del joystick, una secuencia de acciones, Si/No sobre si algo es una anomalía… ¡ hay tantas posibilidades!

No contrates a ese gurú con PhD antes de confirmar que lo necesitas. Céntrate primero en tus resultados deseados.

Si leíste mi reciente artículo sobre cómo funcionan los algoritmos, habrás notado que el artículo dio por sentado que vale la pena etiquetar las botellas de vino con “le gustó” o “no le gusto” a Cassie. ¿Quién quiso perder el tiempo con ese estúpido caso de uso? ¿Cómo eso ayuda el negocio? ¿Debería ese clasificador siquiera existir? Suponiendo que se pueda hacer funcionar, ¿vale la pena construirlo?

Este tipo de preguntas son el tipo de trabajo que debes estar haciendo ahora, mi amigo. Este es el primer trabajo.

Sólo porque puedas hacer algo, no significa que sea un buen uso del tiempo de alguien.

Imagina que tu sistema de ML/IA está operativo y pregúntate si estás contento de haber invertido los recursos de la empresa para desarrollarlo. ¿No? Sigue entonces con la lluvia de ideas. Es mejor descubrir que nadie necesita tu aplicación antes de que varios PhDs inviertan su vida entera en ella.

Hacer esto puede ser difícil porque hay muchas opciones, así que acomódate en un sofá cómodo y medita. Prueba los ejercicios de mi isla de borrachos si necesitas un poco de ayuda para hacer una lluvia de ideas.

Ahora no es el momento para entradas

Algunas de las personas que toman decisiones son tremendamente hábiles con los datos. Pueden hablar de entradas (inputs) y resultados (outputs) a la vez… y comprenden la diferencia. Mi consejo puede sorprenderte: resiste la tentación! Simplemente no hables de entradas todavía. En serio. Sé que puedes, pero no lo hagas. Aquí te doy dos de muchas razones.

Razón 1: oportunidades perdidas

Esto es obvio. Algunos de tus grupos de interés no son tan hábiles como tú y se confunden fácilmente. En los primeros días, es posible que les estés presentando tu idea con la esperanza de obtener recursos para tu proyecto y realmente no quieres que no lleguen a entender por qué vale la pena tener un sistema de ML/IA. ¡No los confundas! Mantente enfocado. Diles lo que hace, no cómo lo hace.

Pregúntate: “¿Es este el fin o los medios?” Si son los medios, no hables de ello por ahora.

El problema con mucha gente hábil es que piensan que todos comparten su habilidad. Algunas personas absolutamente brillantes en tecnología me han sorprendido al no tener esta capacidad, así que ahora sé que no debo darla por sentada.

Para algunas personas, los datos son datos. Todo es lo mismo. (Estimado lector, si no estás seguro de si dominas este tema, mejor has una pausa. Continúa preguntándote: “¿Es este el fin o los medios?” Asegúrate por ahora de concentrarte en los extremos). Es posible que las partes interesadas simplemente no puedan seguir el hilo de tu conversación, lo que significa que tu discurso se lo llevará el viento y perderás la oportunidad de hacer que el mundo sea más espectacular con IA.

Algunas personas tienen problemas para determinar qué variable es entrada y cuál es la salida/resultado… todo se ve como un gran bulto confuso para ellos y necesitan tu enfoque para apreciar por qué vale la pena lograr los resultados/salidas.

Razón 2: acuerdo tácito

Como ingeniero que ha estado rodeado de ingenieros durante mucho tiempo, y he notado que a nuestra especie nos encanta aferrarnos a los detalles. Olvídate de ver las cosas en grande, es más divertido perder el tiempo en cada detalle, ¡especialmente cuando alguien está equivocado en algo! Nos encanta estar técnicamente correctos.

Yo, por mi parte, tengo que estar atento para no quedar atrapado en la corrección técnica de minucias. Es una broma: Técnicamente correcto es el mejor tipo de corrección. Tautológicamente correcto es un tipo de corrección.

Así que aquí está la tragicomedia: cuando has pasado las últimas 6 horas discutiendo con tus amigos sobre si la variable x (¿en crudo, estandarizada o normalizada?) es una buena entrada con capacidad adecuada para predecir la salida y, tú has normalizado la idea de que vale la pena calcular y. Y empiezas por dejar de cuestionar el sentido de trabajar en “y” y terminas construyendo cosas que no necesitan ser construidas.

Se trata de abundantes multitudes

Imaginemos que el caso de uso que estás buscando automatizar es el etiquetado Si/No de las botellas de vino. (Si prefieres el café al vino, aquí está la versión sin alcohol de este texto).

Asegúrate de no estar pensando en etiquetar solo una o dos botellas. ML/IA tiene sentido para automatizar muchas decisiones que se repiten. No es para usarlo una sola vez.

ML/IA no es para usarlo una sola vez, así que asegúrate de que tu empresa necesite una cantidad impresionante de artículos etiquetados.

¿Estás imaginando el etiquetado de al menos unos pocos miles de ellos? ¿Y cuándo esto esté en vivo, estás seguro de que no puedes simplemente buscar las respuestas, en lugar de predecirlas? Bueno. Continuemos.

Toma un bolígrafo, escribe las etiquetas que aceptarás (el Si/No binario en este ejercicio es fácil de escribir, pero podrías haber elegido hacerlo más exótico si hubieses necesitado ser más creativo). Escribe cómo sabrás si la respuesta es correcta para cada uno de ellos. Anota cómo se verán los errores. ¡Espera tener errores en Machine Learning! Si esperas algo impecable, lo mejor es retroceder en silencio antes de que la decepción destroce tu alma.

Es posible que no estés listo para Machine Learning

¿Aún tienes dificultades para encontrar un caso de uso? Considera la posibilidad de poner en pausa por un tiempo ML/IA en favor de la analítica. El objetivo de la analítica es generar inspiración para quienes toman las decisiones. Una vez que estés inspirado, puedes volver a ML/IA y comenzar de nuevo. Analítica (también conocido como minería de datos) es una gran idea para todo proyecto, mientras que ML/IA es solo para proyectos en los que el objetivo es utilizar datos para automatizar el etiquetado de objetos. Aunque las matemáticas subyacentes son a menudo las mismas, los procesos son muy diferentes. La minería de datos trata de maximizar la velocidad de descubrimiento, mientras que ML/IA tiene que ver con el rendimiento en la automatización. En la minería de datos, solo hay un error que tu equipo puede cometer, mientras que ML/AI tiene una lista impresionante de posibles metidas de pata. Embárcate en esos dolores de cabeza sólo cuando tengas un caso de uso que valga la pena.

¿Para quién? ¡Piensa en tus usuarios!

¿Para quién es tu deslumbrante invento? ¿Quién se beneficia? Este es un buen momento para consultar con un especialista en Experiencia de Usuario (UX) y mapear los usuarios previstos de tu aplicación.

Idear nuevas tecnologías comienza a menudo con el qué, pero es importante discutir el quién antes de pasar al cómo.

Algo que aprendí al pasar tiempo con los diseñadores de UX es que mi descripción general de quiénes son mis usuarios… suele ser bastante ingenua. ¿Has pensado en la facilidad de uso para los beneficiarios indirectos, para la sociedad en general, para otras empresas, para los sistemas de máquinas que utilizan los resultados como entrada, para los ingenieros dedicados a la depuración, etc.? Para evitar un diseño UX de mala calidad, tómate el tiempo para pensar en todas las innumerables categorías de tus usuarios antes de continuar. Usuario, en el sentido más obvio, no solo significa cliente o usuario final.

¿Es ético proceder?

¿Qué pasa si tu idea no es uniformemente beneficiosa para todos? Mientras estableces tus casos de uso ideales, considera quienes podrían verse perjudicados por la existencia de tu sistema. No me refiero a los competidores en tu industria. ¿Puede algún humano ser afectado por tu aplicación? Esto es especialmente importante si tu tecnología escala o alcanza millones o billones.

¡Piensa en los humanos que tu creación impacta! ¿Quién se beneficia y quién puede ser perjudicado?

Si te interesa desarrollar la tecnología de manera ética y responsable, es tu deber pensar en todas las personas a las que tu creación podría afectar. Pensar en ellos después de construirla es irresponsable. ¡El momento para eso es ahora! Un especialista en ética puede ayudarte a asumir parte de la carga. Traerlos como asesores es una gran idea si tu proyecto tiene el potencial de afectar fuertemente el bienestar humano. Junto con tu especialista en UX, su participación en el proyecto te ayudará a garantizar que los grupos afectados por tu creación tengan voz.

Realiza algunas verificaciones de la realidad

Una vez que puedas definir claramente qué etiquetas estás buscando, es hora de realizar una comprobación rápida de la realidad: ¿tienes datos para este problema de negocio?

No tener acceso a los datos significa que no tiene sentido continuar. Sin embargo, es posible que puedas obtener lo que necesitas on-line: hay una tendencia creciente a hacer que los datos estén disponibles de forma gratuita (por ejemplo, aquí).

Sin embargo, tienen aún que ser relevantes. Los datos inútiles claramente no cuentan. Aún no tienes que analizar los datos (que se deberá hacer más adelante en el proyecto), pero debes verificar que realmente tendrás algo que analizar cuando llegue el momento. No datos, significa no ML/IA.

¿No tienes acceso a datos relevantes o no hay computadoras para procesarlos? No hay una manera educada de decir esto…

Si no tienes datos, así será tu sueño de ML/IA

También deberás verificar que tienes la potencia de computación para procesar tus datos. (¿Has oído hablar de Google Cloud? Ellos tienen mucha y les gusta compartirla. Eso dicen…)

Lista de Verificación de la Realidad

Asegúrate de que puedas responder sí a toda esta lista. Es probable que cada punto de la lista tenga su propia guía más adelante. Estate atento. Esto es solo una guía rápida general con preguntas para identificar cuando un proyecto no debería comenzar.

  • Tarea apropiada: ¿Estás automatizando muchas decisiones/etiquetas? ¿Dónde no puedes encontrar la respuesta correcta cada vez?
  • Expectativas razonables: ¿Entiendes que tu sistema podrá ser excelente, pero no será perfecto? ¿Puedes vivir con el error ocasional?
  • Posible en producción: independientemente de la procedencia de esas decisiones/etiquetas, ¿podrás implementarlas en producción? ¿Puedes reunir los recursos de ingeniería para hacerlo a la gran escala que estás pensando? Estarás revisando esta pregunta con más detalle cuando te sientes con los ingenieros, pero por ahora será suficiente una verificación de cordura.
  • Datos para aprendizaje: ¿Existen datos de entrada potencialmente útiles? ¿Puedes acceder a ellos? (Está bien si los datos aún no existen, pero tienes un plan para obtenerlos pronto).
  • Datos de ejemplo suficientes: cuando estás tomando un café con tu estadístico o ingeniero de Machine Learning y mencionas casualmente la cantidad de datos de ejemplos disponibles junto con el tipo de resultados al que apuntas, ¿su cara se transforma y se llena de gestos? (Te enseñaré cómo desarrollar esta intuición en un futuro artículo).
  • Computadoras: ¿Tienes acceso a suficiente capacidad de procesamiento para manejar el tamaño de tu conjunto de datos? (Las tecnologías de la nube hacen que esto sea un sí automático para cualquier persona que esté dispuesta a considerar su uso).
  • Equipo: ¿Confías en que puedes formar un equipo con las habilidades necesarias?
  • Precisión de datos de entrenamiento: a menos que estés buscando un aprendizaje sin supervisión, ¿tienes acceso a los resultados/salidas? Si no, ¿puedes pagar a humanos para que lo hagan por ti, repitiendo el trabajo una y otra vez?
  • Registro de cordura: es posible saber qué entrada (input) va con qué resultado (output), ¿verdad?
  • Registro de Calidad: ¿Confías en que los datos son realmente lo que tus abastecedores afirman que son? (Para aprender de los ejemplos, necesitas buenos ejemplos).

Arma tu equipo

Una vez que hayas terminado la lista de verificación de realidad, es hora de comenzar a reclutar, lo que puedes hacer en paralelo mientras lees el resto de esta guía. Mi consejo sobre los roles que estás buscando está aquí.

Crea sabiamente una métrica de desempeño

Aduéñate de los pros y contras

El siguiente punto puede ser un poco complicado si eres nuevo en ello. Tú estás a cargo de decidir qué importancia o valor tiene cada tipo de resultado. ¿Le darías a la horrible botella de vino que tomamos, un puntaje dos veces más malo que a la deliciosa botella que no tomamos? es 3.4823 veces más mala? ¡Depende de ti!

¿Complicado? Agarra a alguien a quien le gusten los números y pídele que te ayude a intercambiar ideas. Los expertos cualitativos están especialmente capacitados para esto, y su calculadora lo hará en un abrir y cerrar de ojos. Si deseas al mejor ayudante, utiliza jerga formal para ello (involucrando curvas de indiferencia) y convoca a un economista.

Los economistas resultan asesores sorprendentemente útiles para proyectos de inteligencia artificial.

Ahora que has descubierto cómo combinar varios resultados en un solo resultado (output), es hora de pensar cómo te gustaría puntuar algunos miles de ellos a la vez. Usar el promedio es una opción promedio, pero tú no debes ser promedio. Una vez más, el que toma las decisiones es el jefe aquí. La forma correcta de calificarlos dependerá de lo que sea correcto para tu negocio.

(Opcional) El modo experto usa mucha simulación

Los proyectos complejos y delicados se benefician enormemente de la simulación. Ahí es donde un analista especializado en generar datos falsos pero plausibles puede ayudarte a ver las posibles consecuencias de las decisiones que estarás tomando luego de leer este artículo.

Un ensayo general ayuda a tener una noche de estreno sin problemas.

La simulación te da un ensayo general, que te ayuda a identificar y resolver un montón de problemas antes de que tengas que comenzar tu proyecto en serio. Al igual que los analistas, ayuda al tomador de decisiones quitándole parte de la carga de tener que meditar y pensar en todo.

Haz tu métrica

Hay muchas maneras diferentes de hacer una métrica. En nuestro ejemplo de vinos, podrías optar por uno realmente simple: accuracy, también conocida en español como “No te equivoques”. Cada error es igualmente malo (0), cada respuesta correcta es igualmente buena (1), y luego calculas un promedio.

Espera, tal vez lo que tienes es FOMO (miedo a sentirte relegado) cuando se trata de buenos vinos, y no tienes problema con ir teniendo dudas en el camino. Bueno, esa es una métrica diferente llamada recall. O tal vez no quieres perder tu dinero; estás con presupuesto ajustado. Eres un estudiante con poco dinero (he pasado por eso, créeme) y necesitas asegurarte de que cuando el sistema diga “sabroso” no estarás malgastando tu dinero, pero no tienes problema si te pierdes de probar una riquísima botella de vino. Esa es una métrica completamente diferente llamada precisión. Ya nos sumergiremos en las métricas en otra publicación. Por ahora, no importa cómo se llaman, solo define una que refleje lo que es correcto para tu negocio.

¿Necesitas ayuda? ¿Ya has ido con tu economista? ¡No hay problema! ¿Quizás tienes un amigo al que le encanta diseñar juegos? Los desarrolladores de juegos han estado sin saberlo entrenando para esto toda su vida! Si no tienes muchos amigos así, puedes llamar a tu experto cualitativo, ya que es su trabajo ayudar a los tomadores de decisiones a aclarar sus pensamientos sobre este tipo de cosas.

Busca una revisión experta

En las aplicaciones donde el bienestar humano está sustancialmente en juego, busca consultar con un panel de expertos para verificar que no sea posible lograr una puntuación alta en tu métrica de una manera perversa y dañina.

¿Qué expertos? ¿Has escuchado hablar de un panel en el que un tomador de decisiones, un especialista en ética, un teórico de control de IA, un estadístico, un investigador de experiencia de usuario, un economista del comportamiento, un experto en dominios y un ingeniero de confiabilidad entran a un bar…?

Lo sé, todo esto puede ser exagerado para aplicaciones comerciales inofensivas, por lo que la experiencia de un experto cualitativo con un nivel básico en cada una de estas disciplinas te ayudará a tener todo cubierto, y los instintos de tu amigo diseñador de juegos también estarán siendo aprovechados de una buena manera.

¡Hola, métrica de rendimiento de negocio!

Cuando hayas terminado, escucharás un coro angelical. ¡Has creado la métrica de rendimiento de tu negocio!

Esto no es lo mismo que una función de pérdida (hablaremos de eso más adelante). Cuando se trata de métricas, las posibilidades son infinitas y depende de quienes toman las decisiones definir qué es realmente importante. En caso de que te sientas ansioso por conocer más de esto, estoy elaborando algunos artículos más para ayudarte a dominar el desarrollo de métricas.

(Alerta de jerga) Algo que tus expertos en Inteligencia Artificial deben saber.

Este es un pequeño tema que puedes omitir hasta que profundicemos en ello en una publicación posterior, pero si sabes qué es una función de pérdida, entonces te darás cuenta de que tendremos dos métricas en juego. Si eso no significa nada para ti, por ahora no te preocupes, tu trabajo es solo asegurarte que tus expertos en ML/IA lean el siguiente párrafo. Te aseguro que muchos de ellos se perdieron esta lección en la universidad. Advertencia: muchos tomadores de decisiones encontrarán que leer esto es una pesadilla y pura jerga: ¡mil disculpas! — solo salta la lectura y continúa en el siguiente título, más adelante.

La función de pérdida es para optimización, no para pruebas.

“En ML/IA aplicada, la función de pérdida es para optimización, no para pruebas estadísticas. La prueba estadística debe preguntar: “¿La performance es suficientemente buena como para construirlo/lanzarlo?” Donde la performance debe ser definida por el problema de negocio y su propietario. Se supone que no debes alterar la definición del problema de negocio para adaptarse a tus ambiciones de optimización. Por conveniencia, eres libre de optimizar utilizando una función de pérdida estándar que se mueve en la misma dirección que la función que la imaginación de tu líder acaba de generar (realizar verificaciones de correlación * analítica o con simulación), pero prueba con tu función. ** ¿Has estado usando la pérdida para todas tus evaluaciones? No te preocupes, es un error común que puede tener algo que ver con los valores predeterminados del software, el formato del curso universitario y el ausentismo en la toma de decisiones en la inteligencia artificial. “

** Si no hay una función de pérdida estándar que se correlacione decentemente con la métrica de rendimiento, coméntale ahora a tu tomador de decisiones que lo que piden es muy difícil y probablemente se requiera invertir en investigadores de optimización.

** Expertos disidentes de Inteligencia Artificial, lean esto. Aunque no es acerca de funciones, las ideas generales sobre trabajar con tomadores de decisiones aplican.

Establece criterios de prueba

Define tu población de interés

Hablar sobre el “funcionamiento” de tu sistema no tiene sentido hasta que especifiques en qué instancias deseas trabajar. ¿Todas las entradas (inputs) del verano de Estados Unidos? ¿Todas las entradas a nivel mundial? (¡Son diferentes!)

Antes de continuar, deberás definir tu población estadística de interés, la amplia colección de instancias que necesita tu sistema para demostrar un buen desempeño antes de darle luz verde. Tengo una guía de dos partes para en caso de que necesites un repaso de esto.

¡Comprométete a procesarlo!

Ahora que tienes a mano tu métrica de rendimiento y tu población, tienes un trabajo más que hacer antes de poder poner los pies en alto. Cómo llegar aquí puede llevar meses, y tus pobres pies deben estar bastante adoloridos.

Aquí está la última tarea: decide el rendimiento mínimo que estás dispuesto a aceptar y firmar, porque estoy a punto de hacerte prometer que no vas a dejar que este sistema se encargue de etiquetar las cosas para ti a menos que sea lo suficientemente bueno.

Establecer un límite mínimo para probar el sistema, es una responsabilidad que el tomador de decisiones debe tomar muy en serio. (Imagen: María Fernanda Murillo ganando una competencia de salto de altura, crédito: Diego Sinisterra)

¿Qué significa “lo suficientemente bueno”? ¿Qué tan alto debe ponerse la barra? Depende de tí, pero debes comprometerte ahora.

Establecer criterios por adelantado es parte de cómo te mantienes tu (y yo) a salvo cuando el Machine Learning e Inteligencia Artificial funcionan terriblemente.

Este criterio no es una estrella que te guía. También puedes tener un nivel de rendimiento que le digas y des como objetivo a tu equipo para que alcance, pero no es contra lo que vas a probar. Prueba contra lo mínimo.

Tú, especie predispuesta al sesgo

¿Por qué se te ocurre establecer este límite ahora, incluso antes de que hayas reunido y formado un equipo para este proyecto? Resulta que como miembros de la especie humana, que sufre de algunos adorables sesgos cognitivos (no digas costo hundido o efecto de dotación o sesgo de confirmación a menos que desees que de la nada el economista aparezca de nuevo, esta vez arrastrando a un psicólogo) que se reduce a esto: cuando los humanos invierten tiempo y esfuerzo en algo, nos enamoramos de lo que hemos hecho… así sea, incluso, un montón de basura venenosa. Luego nos encontramos justificándolo: “umhhh pero el rendimiento no es tan malo. Estoy un poco orgulloso del 12% de precisión. ¿Tal vez podríamos lanzarlo de todos modos? ¿Por qué no pruebo contra el 10%? ¿Ves? Si pasó. Es estadísticamente lo suficientemente bueno”.

Si quieres revolcarte en este triste tema conmigo durante otros 6 minutos, ¿quién soy yo para detenerte?

Nosotros, los humanos, nos enamoramos de aquello en lo que hemos invertido esfuerzo… incluso si es un montón de basura venenosa.

Mientras todavía estemos sobrios (!) y antes de que hayamos invertido una gran parte de nuestra vida en esto, vamos a analizar el problema de negocio con frialdad y decir: “Si no cumple con este requisito mínimo, prometo que MUERE”.

¿Mejor que un humano?

Espero que ahora tengas una idea de por qué me veo forzado a aguantarme una carcajada cuando la gente me pregunta: “¿Es la IA mejor que los humanos haciendo cosas?”

¿Mejor que los humanos? Las tautologías son tautológicas.

Si el creador de un sistema le exigió que sea mejor que un humano e hizo las pruebas correctamente, entonces, si no era mejor que un humano… lo destrozaba. Si existe, entonces sí lo es. A menos que no requirieran que fuera mejor que un humano, en cuyo caso, probablemente no lo sea. ¿Por qué la gente me pregunta a mí? Pregúntenle a los responsables de la toma de decisiones cómo definen sus criterios y pruebas. (Hablando de poblaciones, ¿de qué seres humanos se supone que sea mejor que? ¿De este voluntario?)

Además, no nos obsesionemos tanto sobre si las máquinas son mejores que nosotros en ese aspecto. Mi computadora siempre ha sido mejor que yo… al realizar la multiplicación. Esto no me molesta en absoluto. Mi balde es mejor que yo para retener el agua. ¿Para qué sirve una herramienta si no reduce tu esfuerzo o mejora lo que puedes lograr?

En su lugar, concéntrate en si es lo suficientemente bueno para ser útil.

No seas demasiado exigente.

Si requieres un rendimiento mejor que el humano, podrías estar perdiendo dinero. Es como decir que solo contratarás a un medallista de oro olímpico para que ponga ladrillos. Tal vez un atleta olímpico sea más fuerte que tu Juan promedio, pero tener un estándar de contratación tan estricto podría dejarte sin trabajadores. Reduce tus estándares hasta donde tengan buen sentido de negocio, pero no más bajo. Establecer el nivel de pruebas al mínimo es compatible-con-incentivos, como dirían los economistas. (Si eres recién egresado de una escuela de negocios y quieres aprender de diseño de mecanismos, básicamente estamos estableciendo una subasta BDM para nuestro procedimiento de prueba de hipótesis).

No te pierdas una solución rentable, por establecer límites muy altos para tus pruebas.

A veces, la automatización proporciona una calidad por unidad inferior a la de los productos hechos a mano, pero la escala y la velocidad de la máquina hacen que valga la pena como negocio. ¿Vale la pena para tu negocio? Oye, tú estás a cargo, no yo. ¡Buena suerte!

Para un breve resumen de este texto largo, vea a la versión de lista de verificación.

¡Ese es el primer paso de ML/IA ! El segundo paso involucra datos y hardware (¡e ingenieros!), por lo que a lo mejor te gustaría repasar un poco de vocabulario anticipándote a las próximas atracciones.

Si consideras que alguna de las ideas de esta guía vale la pena, por favor compártelo con quien, en tu red, sea más probable que vaya a tomar un rol de decisor. ¡Construyamos un nuevo grupo de líderes en Inteligencia Artificial, capacitados y responsables para lograr un futuro brillante con Inteligencia Artificial!

Obtén más información sobre ciencia de datos e inteligencia artificial en español aquí.

--

--

Cassie Kozyrkov
Ciencia y Datos

Head of Decision Intelligence, Google. Hello (multilingual) world! This account is for translated versions of my English language articles. twitter.com/quaesita