NOCIONES BÁSICAS DE MACHINE LEARNING | THE EXPERIENCE

Dalekdev
3 min readAug 19, 2018

--

Tener en cuenta que este es mi resumen del libro deeplearningbook.org, para mi yo del futuro, y en el tiempo que disponga se irá mejorando.

En el libro de Deep Learning detalla la experiencia como muestra de lo logrado a partir de algoritmos de aprendizaje, de los cuales son diversos y cada uno es más optimo que otro dependiendo de sus situaciones. En este caso hablaremos de la experiencia en general y de como se va mostrando paulatinamente sobre nuestros datos con el criterio que buscábamos al otorgarle una tarea.

El ML se puede categorizar en dos partes en supervisados, y no supervisados por la experiencia que se les permite tener durante el proceso de aprendizaje.Un conjunto de datos lo podemos definir como una colección de puntos de datos.

En términos generales, el aprendizaje no supervisado implica observar varios ejemplos de un vector X aleatorio y tratar de aprender implícita o explícitamente la distribución de probabilidad P(x), o algunas propiedades interesantes de esa distribución; en cambio el aprendizaje supervisado involucra la observación de varios puntos de datos de un valor vectorial X o de un valor aleatorio, para luego ser llevado a una predicción, generalmente al estimar la probabilidad P(y|x).

Para esclarecer con un ejemplo, el término de “aprendizaje supervisado” se refiere a la orientación proporcionada por un instructor o profesor que muestra al sistema de ML como debe actuar. En el aprendizaje “no supervisado”, no existe tal instructor o tutor, y el algoritmo debe aprender a dar sentido a los datos sin este guía. Y aun así no existe una definición formal de aprendizaje supervisado y no supervisado, no existe tal cosa como taxonomía rígida de conjuntos de datos o puntos de datos, etc, es decir, se pueden diseñar nuevos modelos con nuevo patrones, para generar nuevas aplicaciones a partir de estas.

Para ejemplificar la experiencia nuestro agente en Unity 3D, este aprendió a caminar a través de aprendizaje no supervisado, ya que los datos en bruto que se obtenían servían para que pueda desplazarse sin caerse al piso.

Un detalle importante es que para optimizar el tiempo de aprendizaje de nuestro agente, era necesario crear varios agentes, controlados por un mismo cerebro, para que puedo aprender a caminar de forma acelerada.

He aquí el resultado:

Palabras Finales:

Este es un artículo que consta de 3 partes: Tasks, The Performance Measure, The Experience.

Tener en cuenta que las imágenes no pertenecen al libro, y son solo referenciales para esclarecer el texto, para una mejor lectura.

En caso de algún error o contribución al artículo, hacérmelo notar a mi correo victor.m.diniz@gmail.com.

Referencias:

  1. Goodfellow, I., Bengio, Y., Courville, A.(2016). Deep Learning. Revisado el 20 de julio del 2018 de http://www.deeplearningbook.org/

--

--

Dalekdev

Passionate about mobile apps, new technologies, and books. Hoping to become wise.