Vision Artificial

Erik Ibarra
Inteligencia Artificial ITESM CQ
2 min readFeb 6, 2015

La realidad para los seres humanos consta de 3 dimensiones espaciales, sin embargo nuestros ojos como las cámaras o sensores con las que las computadoras pueden tomar perspectiva del mundo real solo pueden recibir imágenes en 2 dimensiones. El ser humano al contar con visión binocular y un cerebro que puede lograr sin problema la fusión sensorial, es capaz de percibir las 3 dimensiones y así poder ubicase en un espacio.

Por otro lado, una computadora solo puede recibir imágenes en 2 dimensiones. Para las personas una imagen vale más que mil palabras, ya que puede percibir e interpretar muchas conclusiones a partir de una sola imagen. Para una computadora, una imagen solo consta de bits y esto reduce significativamente la posibilidad de una interpretación. Es por esto que surge la rama llamada Visión Artificial, también conocida como visión computacional o procesamiento de imágenes. Esta rama utiliza la captación y procesamiento de señales con el fin de que una computadora pueda entender y así poder describir y llegar a resultados.

Nuestro cerebro para percibir y reconocer objetos realiza una serie de tareas automáticamente, y por lo mismo aun no podemos descifrar que hace para así simular estos comportamientos. Es por esto que existen distintos técnicas para recuperar la dimensión que perdimos (profundidad).

Una técnica utilizada por Microsoft Live Labs, es la de analizar un conjunto de imágenes de algún objeto, y usando técnicas como el reconocimiento de patrones, reconocer las áreas comunes de las imágenes y así poder unirlas y crear un modelo en 3 dimensiones.

Otra técnica para recuperar la profundidad es la de utilizar los distintos tonos presentes en una imagen para localizar relieves (sombras). Con estos relieves poder localizar la fuente de luz en la imagen y así llegar a un modelo de la forma de los objetos.

Entre las principales aplicaciones se encuentran:

• Reconocimiento Facial: https://www.youtube.com/watch?v=mdhvRNYX0PI
• Reconocimiento de Objetos: https://www.youtube.com/watch?v=tlC2O9T9jks
• Seguimiento de Objetos: https://www.youtube.com/watch?v=whwsLjLjEiY
• Análisis de comportamiento: https://www.youtube.com/watch?v=o0GVUgTdxKg
• Robótica: https://www.youtube.com/watch?v=kKDd2vIjtEU
• Detección Remota: https://www.youtube.com/watch?v=Dwl6rli1EiY

Fuente:

Originally published at inteligenciaartificial101.wordpress.com on February 6, 2015.

--

--