Computer Vision

En Flux IT estamos investigando cómo los avances tecnológicos más sólidos pueden ser útiles hoy para resolver algún problema concreto de las empresas, generar una ventaja competitiva o mejorar la eficiencia de su negocio. A este espacio de innovación lo llamamos Flux IT Forward; y entre sus múltiples objetivos plantea generar valor a través del uso de sensores.

Trazando el objetivo

Acercar el procesamiento de imágenes al retail

Nuestras primeras ideas giran en torno al reconocimiento de objetos a través del uso de cámaras web. Por ejemplo, podríamos medir la reacción de las personas frente a un estímulo, el interés de las personas ante la presencia de promociones o reconocer a nuestros clientes cuando pasan cerca de un local.

Para cumplir este objetivo elegimos trabajar con una disciplina que ya tiene algunos años, pero ha ganado popularidad hoy en día: computer vision.

Nuestras herramientas

Computer Vision “es una disciplina científica que incluye métodos para adquirir, procesar, analizar y comprender las imágenes del mundo real con el fin de producir información numérica o simbólica para que puedan ser tratados por una computadora”. Por lo tanto, para avanzar en nuestra investigación, establecimos que necesitaríamos:

  1. Un origen de video/imágenes (cámara web).
  2. Un servicio de procesamiento de imágenes que busque los patrones.
  3. Un sitio web para ver y analizar los resultados.

Time to develop

Origen de video

Para implementar la solución recurrimos a una de las cámaras web públicas de libre acceso para cualquier mortal. Hay una infinidad de cámaras que permiten ver muchos lugares del mundo en tiempo real. En este caso nos quedamos con una cámara de la ciudad de Tucumán, Argentina.

Av. Aconquija en Tucumán

Servicio de procesamiento de imágenes

Para detectar patrones en las imágenes utilizamos OpenCV, que es una librería open source.

Web site

Implementamos un sitio web íntegramente en Firebase para ver los resultados.

Algunas conclusiones iniciales

Sobre el procesamiento de imágenes:

  1. Es una tarea de consumo intensivo de CPU y espacio en disco.
  2. La práctica lo es todo. Sin un buen set de entrenamiento, el reconocimiento de patrones tiene un alto margen de error.
  3. Simplificar la entrada. Recortar la imagen o transformarla en escala de grises facilita el análisis.

Sobre el procesamiento de imágenes en Cloud:

Existen servicios excelentes en la nube como Google Cloud Vision y Watson Visual Recognition. Estos pueden ser utilizados como complemento en el procesamiento de alguna imagen. Facebook también permite reconocer caras con su Graph API y nos mantiene al tanto de sus tareas en el ámbito de Computer Vision a través de su blog.


Otras lecturas

Santiago Urrizola escribió una entrada sobre cómo las API de Computer Vision hacen “fácil lo difícil”. Si no leíste este artículo, ¡Recomendado!