W4: Content-based recommendation systems.

Tamara Alexandra Cucumides
tam_recomienda
Published in
3 min readSep 8, 2019

Esta es mi crítica a Content-based recommendation systems. de Pazzani, M. J., & Billsus, D. (2007).

¿De qué se trata el documento?

Este documento corresponde al capítulo 10 del libro The adaptive web (cabe notar que ya hice la crítica del capitulo de este libro relacionado a sistemas recomendadores de filtrado colaborativo en https://medium.com/tam-recomienda/w1-collaborative-filtering-recommender-systems-a95d20df617)

El objetivo del documento es básicamente introducir todos los conceptos necesarios para que este comprenda qué es y cómo funcionan los sistemas recomendadores basados en contenido. En específico, el documento se propone discutir distintas representaciones de items y distintos algoritmos que sirven para cada una de estas representaciones.

Crítica y comentarios

La lectura del capítulo sigue la línea del capítulo que discutimos antes: es bastante liviano y auto-contenido y representa un muy buen punto de partida para estudiar sistemas recomendadores basados en contenido (en este caso es necesario destacar que es solo un punto de partida, puesto que realmente no se entra en detalle en nada: ni en implementación, ejemplos prácticos, complejidad, desempeño, nada.)

Un primer alcance que quiero hacer del documento en general, es que este en el abstract menciona que se propone a discutir de los temas. Sin embargo, me parece que solo se limita a presentarlos, sin ahondar realmente en una discusión acerca de ellos (sólo hace un barrido histórico: presenta técnicas y la intuición del por qué estas aparecen). Destaco esto porque es realmente muy distinto a lo que se ve en este mismo libro en el capítulo comentado anteriormente, el que se preocupaba de plantear inquietudes y fomentaba la discusión acerca de los puntos más cuestionables.

Dejando de lado esta crítica, aún en el carácter expositivo del documento considero que hay aristas que faltan como por ejemplo:

  1. Por qué querríamos usar sistemas de recomendación basados en contenido??
  2. En qué contexto son útiles: qué ventajas y desventajas tienen?
  3. De qué depende su éxito y/o su fracaso?? Bajo que supuestos operan?

Aproximadamente la mitad del documento está destinado a ahondar en distintas técnicas (árboles de decisión, naive bayes, vecinos cercanos, etc.), espacio que por el objetivo del documento podría haber sido reducido y utilizado en generar más discusión acerca de los aspectos generales de los métodos y distintas aristas a considerar cuándo se deseen implementar (notar que la sección de limitaciones y extensiones comprende menos de 1 página, mientras que para cada algoritmo hay entre una y dos). Más aun, las descripciones de los algoritmos tampoco son del todo completas y no contienen todos los detalles necesarios para que alguien pueda guiarse solo en ellas para la implementación: como decía, no se justifica mucho esta decisión de “división” del trabajo.

Yendo aún más lejos, para qué presentamos todos estos distintos algoritmos/técnicas si no los vamos a comparar? Mientras leía cada una de las descripciones de los modelos, realmente esperaba que luego los comparara (en cuanto a desempeño, utilidad o contextos en los que podía ser usado uno y no el otro) mencionando sus ventajas y desventajas comparativas, cosa que no sucedió. Solo pude encontrar comentarios del tipo “esta técnica funciona muy bien”, “esta técnica no funciona bien”, etc..

Uno de los puntos que me gusta del capítulo es la distinción que hace entre trabajar con bases de datos estructuradas versus texto libre; creo que esta distinción es muy relevante y está muy bien explicado el por qué es así (menciona los contextos en los cuales nos podemos encontrar con ambos casos y cómo trabajarlos). Creo que todo el documento podría haber seguido en esta línea (análisis general, pero completo) y hubiese sido mucho mejor.

--

--