W1: Collaborative Filtering Recommender Systems

Tamara Alexandra Cucumides
tam_recomienda
Published in
3 min readAug 15, 2019

Esta es mi crítica del paper “Collaborative Filtering Recommender Systems” de Schafer, J. B., Frankowski, D., Herlocker, J., & Sen, S.

¿De qué trata el paper?

El objetivo del paper es introducir al lector a las técnicas de collaborative filtering. El documento primero realiza una definición y breve explicación de lo que es collaborative filtering, diferenciándolo de las técnicas content-based. En la misma introducción se presenta al lector la terminología básica para entender lo que sigue del documento.

Luego de la introducción, el autor se dedica a explicar más en detalle lo básico de las técnicas de CF, respondiendo a preguntas como: ¿cuándo y para qué se pueden usar?, ¿cómo tienen que ser los datos? Posterior a esto, el paper presenta los algoritmos más típicos (Item KNN, User KNN), junto con una breve explicación de estos. Finalmente se presentan los desafíos que involucran las técnicas CF, entre los cuales se encuentran: 1) la adquisición de ratings 2) la evaluación de los sistemas recomendadores 3) privacidad y seguridad de los datos.

Para concluir el paper presenta un par de preguntas abiertas referidas a los algoritmos en sí, acerca de cómo evolucionan los datos, usuarios y ratings a través del tiempo (desde que son nuevos, hasta que son aptos para incluirlos en las recomendaciones) y finalmente acerca de cómo ampliar el acceso a sistemas recomendadores (que en ese tiempo eran usados casi exclusivamente por grandes compañias).

Comentario

La primera cosa que hay que notar es la fecha del paper: 2007, por lo que no es extraño que hayan cosas que estén un poco out dated (qué extrañeza que en ninguna parte del paper se mencione a Netflix, ejemplo más que canónico hoy en día de sistemas recomendadores). Es necesario entonces, ser un poco más indulgentes con algunas críticas y reconocer que algunas de las afirmaciones que se encuentran en el paper realmente adelantaron problemas actuales (por ejemplo la discusión acerca de sistemas recomendadores y la privacidad del usuario).

El paper se presenta, en un principio, como una lectura liviana y amigable, apta para todo público y que presenta de manera sencilla qué es y cómo funciona un sistema recomendador basado en CF. A medida que se avanza en el, se nota el uso de lenguaje más especializado y queda en manifiesto que el documento en sí no está dirigido a todo público.

Este documento es en sí un excelente punto de partida para estudiar sistemas recomendadores, puesto que presenta no solo la técnica de CF, sino también sus alcances, descripción de los algoritmos, discusión acerca de su complejidad y varios desafíos que se presentan. Sin embargo, creo que el documento no es lo suficientemente didáctico: le hacen falta figuras y/o ejemplos del funcionamiento de los algoritmos.

Otro punto importante en el que el paper falla, es en mostrar ejemplos interesantes de uso de sistemas recomendadores: se limita solo a mencionar los típicos (libros, películas, Amazon, etc.). Desconozco si esto es producto del año del paper, pero hacen falta referencias por ejemplo a redes sociales.

Uno de los puntos realmente positivos del paper es cómo logro vaticinar el gran problema que sería la privacidad y seguridad de los datos de las personas. En ese tiempo no era un tema tan relevante como lo es ahora, pero en el paper el autor supo que eventualmente los datos almacenados para sistemas recomendadores, podrían ser aprovechados/robados/vendido.

--

--