MACHINE LEARNING: LES SYSTEMES DE RECOMMANDATIONS

Mounir
5 min readSep 16, 2023

--

1-QU’EST CE QUE C’EST?

Les systèmes de recommandations sont des algorithmes conçues pour suggérer des articles relevant a chaque utilisateur dans le but de maintenir l’engagement de celui-ci. Vu les données massives disponible sur internet les utilisateurs font face à une pléthore de choix quand il s’agit de choisir le prochain film à regarder ou la prochaine vidéo Youtube à suivre, D’où L’importance des systèmes de recommandations qui réduisent considérablement l’espace de choix auquel l’utilisateur fait face.

2- systèmes de recommandations: applications

  • Youtube: chaque heure, approximativement 30000 heures de vidéos sont postées sur Youtube , il prendrait 4 années non stop à un utilisateur pour voir toutes les vidéos postées en une heure
  • Spotify: les utilisateurs ont la possibilité d’ecouter plus de 80 millions de songs et podcasts
  • Amazon: les utilisateurs ont à leur porté 350 millions produits qu’ils peuvent acheter

Toutes ces platformes utilisent des systèmes de recommandations pour proposer que des articles relevant à chaque utilisateur

3- comment les données sont elles générées ?

Les systèmes de recommandations utilisent des models d’apprentissage automatique pour prédire une note r qu’attribuerait un utilisateur u a un article i. Après que le model aie été entrainé, l’article avec la plus grande note r est recommendé à l’utilisateur u.

Les données utilisées pour entrainer le model d’apprentissage automatique sont collectées de 2 facons:

  • Feedback explicite : est une note que l’utilisateur attribue à un article suite à l’interaction avec cet article. Les données collectées ici sont différents notes attribués par les utilisateurs du système à chaque article.

Examples:

-Nombre d’étoiles sur une échelle de 1 à 5 après l’achat d’un produit

-Aimer ou ne pas aimer une video sur Youtube après l’avoir vu.

L’avantage de ce feedback c’est qu’il founit des informations detaillées sur l’interaction entre un utilisateur donnée et un article specifique. L’inconvénient c’est qu’il reste difficile à collecter parce que la majorité des utilisateurs n’attribue pas de notes ou commentaires après avoir interagis avec un produit ou un post.

  • Feedback implicite: est basé sur la supposition que l’interaction de l’utilisateur avec un article est un indice de préférences. Les données collectées ici sont les détailles sur l’interaction(si oui ou non l’utilisateur a interagi avec l’article) entre les utilisateurs et les articles.

Exemples:

-L’historique des achats sur les sites de E-commerce comme Amazon

-L’historique des sites visités

-La liste des songs joués par l’utilisateur dans le cas de Spotify

L’avantage de ce feedback est qu’il est extrêmement abundant mais il apporte moins de details et plus de pertubations comparé au feedback explicite (Ex: quelqu’un pourrait acheter un produit comme cadeau à un ami). Cependant due a l’enorme quantité de ce genre de données disponible , les pertubations sont souvent négligeables

Une fois que les feedback explicites et implicites ont été collecté, Nous passons a la construction d’une matrice d’utilité modélisant l’interaction entre chaque utilisateur et chaque article (appele rating matrix en anglais) . Dans le cas du feedback explicite, chaque entré de la matrice represente le nombre d’etoiles qu’un utilisateur u a attribué a un article i. pour ce qui est du feedback implicite, chaque entré correspond à si oui ou non l’utilisateur u a interagi avec l’article i, le 1 represente ‘oui’ le 0 ,’Non’

4-TYPES DE SYSTEMES DE RECOMMANDATIONS

Selon le type d’informations utilisé pour predire les preferences d’utilisateurs l’on distingue l’approache par filtrage basé sur le contenu, l’approache par filtrage collaboratif et l’approache hybride

  • L’approache par filtrage basé sur le contenu

Cette methode a besoin des caractéristiques de chaque utilisateur (E.g: age,pays,langue,sex ect ..) et de chaque article ( E.g: film d’action,comedie,documentaire ect ..) .

Pour Entrainer un model d’apprentissage automatique il serait convenient d’utiliser le KNN(K Nearest Neighbors) model afin de proposer à chaque utilisateur les articles dont les caractéristiques sont le plus similaire au profile de l’utilisateur .

L’avantage de cette approache c’est qu’il permet de recommender des articles à des utilisateurs ayant nouvellement adhérer a une platforme vu que l’on ne dispose pas encore des informations d’interactions de l’utilisateur avec les articles de la platforme:

L’inconvénient est que nous devons disposer des informations sur chaque utilisateur et des informations sur chaque article due au fait que nous ne disposons pas d’informations d’interactions entre utilisateur-article

  • L’approache par filtrage collaboratif

Ici, Pas besoin des caractéristiques d’utilisateur ou de descriptions d’article Cette approache fait utilisation des interactions d’utilisateurs avec different articles contenus dans l’historique des activités de tous les utilisateurs .Le model d’apperntissage automatique utilise toutes ces informations dans le but de prédire la note qu’un utilisateur attribuerait à un article donnée.

L’entrainement du model d’apprentissage automatique passe par factorization de la matrice definissant les interactions entre chaque utilisateur et chaque article (appelé rating matrix en anglais) dans le but de prédire des notes qu’attribuerait un utilisateur à un article donnée.

L’avantage de cette approache est qu’il utilise l’énorme quantité d’information des interactions entre utilisateur et article qui favorisent l’obtention d’un model plus éfficace comparé à celui de l’approache par filtrage basé sur le contenu.

L’incovénient c’est que pour pouvoir utiliser cette approache il faut que l’utilisateur aie eu à interagir avec les articles de la platforme ce qui rend cette approache inappropriée pour un nouvel adhérent ou un nouvel article.

  • L’approache hybride

Cette approache combine les deux approaches précédentes en utilisant le profil d’utilisateur et les caractéristiques de l’article ainsi que l’ensemble des interactions observées entre chaque utilisateur et chaque article.

Conclusion

Les systèmes de recommandations alimentés par le machine learning représentent une avancée significative dans notre ère numérique. Ils jouent un rôle éssentiel dans la personnalisation des expériences en ligne, que ce soit dans le domaine du divertissement, du commerce électronique, de la recherche d’informations ou d’autres domaines. Grâce à leur capacité à analyser de vastes quantités de données et à comprendre les préférences individuelles, ces systèmes offrent une valeur inestimable tant pour les utilisateurs que pour les entreprises.

En fin de compte, les systèmes de recommandations basés sur le machine learning sont là pour rester, mais leur utilisation doit être guidée par des principes éthiques et une compréhension approfondie de leur fonctionnement. Ils sont un exemple fascinant de la manière dont la technologie peut améliorer nos vies, mais seulement si nous les utilisons de manière réfléchie et éthique pour créer des expériences en ligne plus enrichissantes et plus personnalisées pour chacun d’entre nous.

--

--

Mounir

Passioné d'intelligence artificielle théorique et pratique