W2: Scalable Collaborative Filtering Approaches for Large Recommender Systems

Tamara Alexandra Cucumides
tam_recomienda
Published in
2 min readAug 23, 2019

Esta es mi crítica a Scalable collaborative filtering approaches for large recommender systems de Takács, G., Pilászy, I., Németh, B., & Tikk, D. (2009).

¿ De qué se trata el paper ?

El objetivo del paper es mostrar alternativas escalables de algoritmos de filtrado colaborativo basadas en factorización matricial y reportar los resultados sobre el dataset Netflix Prize. Además se propone una alternativa de factorización matricial al algoritmo de vecinos cercanos.

Para hacer esto, el paper introduce los conceptos de filtrado colaborativo y el procedimiento general de factorización matricial. Posteriormente propone variantes que incluyen regularización, fijar términos, cambios en las reglas de aprendizaje, etc.

Crítica y comentarios

El paper realmente parte desde 0 con los conceptos y terminología necesarios para luego entender los algoritmos que proponen posteriormente. Destacan la formulación de la factorización de matrices y de los estimadores.

Cada una de las variantes que propone el paper está debidamente descrita y analizada, destaca a mi parecer la variante 2D que se realiza con el objetivo de aportar con interpretabilidad al modelo, pero que es realmente distinta a la interpretabilidad que otorgan algoritmos de tipo KNN (de hecho la interpretabilidad que tiene este método es más similar a los algoritmos basados en contenido).

Una sección que destaca del resto es la sección 3.8 donde se asocia el esquema MF con el de las redes neuronales: la relación está bien explicada, pero no queda muy claro el objetivo de hacerla

La propuesta de combinar técnicas basadas en vecinos con técnicas de factorización matricial viene acompañada de una intuición muy clara: tomar lo local de NB y lo global de MF. Lo interesante de esta propuesta es que obtiene valores bastante buenos sin tener costos relevantes (comparativamente) en términos de tiempo y espacio.

Otro punto muy alto del paper, es la descripción de los dataset que fueron utilizados; independiente del objetivo con el que ellos lo incluyeron en su trabajo, creo que es material realmente valioso para futuros investigadores que estén interesados en trabajar con aquellos dataset.

Finalmente, el paper culmina con un análisis realmente extensivo de los resultados obtenidos, en conjunto a una descripción muy completa de la metodología utilizada en los mismos.

--

--