In Tribune expert

L’utilisation des moteurs de recommandation est omniprésente de nos jours. De nombreuses entreprises n’ont de cesse d’améliorer leur algorithme afin d’effectuer les recommandations individuelles les plus justes possibles. Faciliter le parcours utilisateur en proposant une offre personnalisée c’est aussi fidéliser sa clientèle en anticipant ses envies. Cela permet alors un gagnant-gagnant entre les entreprises et les utilisateurs.

En effet, pour l’utilisateur c’est un gain de temps considérable puisqu’il n’a plus à chercher le bon produit à travers tout le catalogue.

Selon un sondage mené par Infosys, 86% des cyber-consommateurs ayant eu recours à une technologie de personnalisation admettent que celle-ci a influencé leur décision d’achat.

En plaçant le consommateur au cœur de son dispositif, la personnalisation engendre un sentiment d’unicité, chaque utilisateur se sent ainsi considéré et compris.

Cet avantage est partagé par les entreprises qui, en plus de fidéliser ses clients, voient leur taux de transformation et leur panier d’achat augmenter. D’après un rapport E-consultancy, les entreprises qui personnalisent leur site web voient en moyenne leurs ventes augmenter de 19%. Amazon a ainsi calculé que 30% des pages visitées provenaient de leur recommandation. Pour Netflix, le contenu personnalisé dépasse les 80%.

L’enquête Global Data-Driven Marketing Survey a démontré qu’en 2 ans, deux fois plus d’entreprises ont mis en place des initiatives marketing stratégiques basées sur les données. La personnalisation est donc maintenant un enjeu majeur notamment dans le secteur du e-commerce.

Dans quels cas utiliser un moteur de recommandation ?

Si la recommandation personnalisée est très couramment utilisée dans le e-commerce, elle est également très utile dans d’autres secteurs et les cas d’usage s’avèrent très divers. Parmi les projets que nous avons pu développer au sein d’AVISIA pour nos clients, nous pouvons citer par exemple :

  • Faciliter la navigation
    • Un moteur mis en place sur le site e-commerce d’un client issu de la grande distribution a permis de proposer des produits complémentaires à son panier d’achat. Si le client ajoute une pâte à pizza à son panier, le moteur peut par exemple proposer une sauce tomate ou de la mozzarella.
  • Elargir les résultats de recherche
    • Un client dans le secteur de la revente automobile nous a ainsi demandé d’élargir les résultats de recherche de son site Web en proposant des voitures similaires à celle recherchée. Cela a permis de proposer d’autres références quand le modèle souhaité n’est pas disponible ; de plus, les internautes ont tendance à limiter leurs critères de recherche : le moteur a permis de proposer des références très similaires mais pas initialement considérées par l’utilisateur.
  • Engendrer du cross-selling
    • Une enseigne de luxe a souhaité disposer d’un outil lui permettant de proposer à ses clients les vêtements et accessoires assortis à l’achat qu’ils viennent de faire. Nos recommandations ont alors été utilisées sur le site Web, sur une application destinée aux conseillers en magasin ou bien dans les campagnes e-mail de l’équipe marketing.
  • Proposer le bon assortiment en magasin
    • Les magasins d’une coopérative spécialisée dans la distribution alimentaire, qui choisissent eux-mêmes leur assortiment, ont remonté la nécessité d’avoir des recommandations sur les produits à vendre absolument dans leur établissement selon les ventes des magasins similaires. La solution proposée permet alors de sélectionner le nombre de produits à proposer et les sélectionner par catégorie.
  • Capitaliser sur les produits/services déjà créés
    • Mise en place d’un moteur de recommandation au service des commerciaux afin de pouvoir répondre aux appels d’offres en se basant sur des produits ou services déjà créés par le passé. Prenant comme input des mots-clés, le moteur permet une réponse plus rapide et moins de sollicitations aux experts internes qui peuvent ainsi se consacrer aux projets plus challengeants.

Les grandes familles de méthodologies

Un utilisateur attend en général qu’on lui fournisse des « idées » mais la nature de la demande peut modifier l’approche à adopter pour la construction d’un outil de recommandation. En effet, si le but est de fournir à l’utilisateur une liste de musiques ressemblant à celles qu’il a l’habitude d’écouter, il ne faut pas suivre la même approche qu’un site travaillant sur la complétion d’un look ou d’un panier d’achat.

Content-based versus Collaborative Filtering

La littérature distingue à chaque fois les moteurs de recommandation en deux approches principales :

  • L’approche « content-based » basé sur la nature des produits avec lesquels l’utilisateur a déjà eu une interaction,
  • Le « Collaborative Filtering » qui s’appuie sur des données propres à l’utilisateur.

Content-based

« Si tu aimes cet item, alors tu pourrais également aimer… »

On observe assez régulièrement ce type de bannière sur les sites de e-commerce qui utilisent l’information de notre clic sur un item pour en proposer de nouveaux similaires.

Cette technique se focalise sur les caractéristiques des produits afin de recommander aux utilisateurs de nouveaux produits qui auront des propriétés similaires aux produits avec lesquels ils ont déjà interagit. Aucune information provenant d’un autre utilisateur n’est donc impliquée dans la recommandation. Pour cette méthode, on pose l’hypothèse que les utilisateurs apprécieront dans le futur ce qu’ils ont déjà apprécié dans le passé.

Par exemple, la souscription à Netflix réside dans le gain de temps obtenu pour la recherche de films. La recommandation se base alors sur la nature des films que les clients ont l’habitude de regarder en proposant des films similaires aux films déjà visionnés.

La recommandation est donc directement corrélée au comportement de l’utilisateur : si l’utilisateur n’a regardé qu’un seul type de film, alors seuls les produits similaires lui seront proposés. Le risque peut être alors de perdre en diversité de proposition.

Collaborative Filtering

Cette méthode s’appuie sur les informations relatives aux utilisateurs pour calculer la similarité entre deux produits/utilisateurs. Deux branches se distinguent dans cette méthode, que le schéma ci-dessous résume bien. Les approches « memory-based » et « model based » se décomposent elles aussi en plusieurs sous-méthodes qui ne sont pas explicitées dans cet article.

 

Comment choisir la méthodologie ?

Choisir parmi tous ces modèles de recommandation peut paraître compliqué au premier abord, mais chez AVISIA nous avons construit une matrice décisionnelle afin de guider ce choix selon les données utilisées et le type de recommandation envisagé.

D’autres indices peuvent également aider à faire ce choix. En effet, les méthodes Collaborative Filtering nécessitent de connaître les retours des utilisateurs. Si ce n’est pas le cas, il faut plutôt s’orienter vers des méthodes Content-based afin de pouvoir recommander des produits dès le début de la navigation des utilisateurs et éviter ainsi le cold start. Il est possible d’imaginer combiner au début de la navigation des méthodes Content-based, puis au fil de la navigation, quand l’utilisateur est mieux connu, lui proposer des produits choisis via des méthodes Collaborative Filtering.

Comment évaluer ces recommandations ?

Pour comparer les performances des algorithmes de recommandation et choisir le meilleur système de recommandation, on utilise des métriques spécifiques. Il y a les métriques dites traditionnelles :

  • Pour les données continues (dans le cas de notes par exemple), valeurs estimées et valeurs réelles sont comparées : RMSE (Root Mean Squared Error), MAE (Mean Absolute Error),
  • Pour des données binaires (les produits ont été recommandés ou non, cliqués ou non) : matrice de confusion, ainsi que les indicateurs qui en découlent : taux d’erreur, accuracy, précision, sensibilité, spécificité…
  • Ou encore pour comparer la pertinence de l’ordonnancement des recommandations (afin de vérifier si l’utilisateur clique sur les recommandations, et si l’ordonnancement de ces résultats est pertinent) : AP (Average Precision) et MAP (Mean Average Precision), NDCG (Normalized Discounted Cumulative Gain), MRR (Mean Reciprocal Rank).

Il existe également d’autres métriques plus atypiques : « diversity », « coverage », « serendipity », « relevancy » et « novelty ». Ces métriques nous permettent d’aller plus loin dans nos projets pour optimiser les objectifs de nos clients.

Lors de la mise en production, le moteur de recommandation peut être challengé de différentes manières :

  • A/B test : une partie des utilisateurs recevra des recommandations issues d’un modèle en particulier, l’autre partie n’aura pas de recommandations (ou alors des recommandations issues d’un modèle précédent). Par la suite il est possible de facilement savoir quelle variation fonctionne le mieux grâce aux KPIs suivis par l’entreprise.
  • Interleaving : si plusieurs modèles doivent être comparés et qu’ils doivent être tous présentés à chaque utilisateur, l’A/B test montre ses limites ; il est alors possible de présenter successivement, au sein d’une même page, la 1e recommandation du 1er modèle, puis la 1e recommandation du 2e modèle, puis la 2e du 1er modèle, et ainsi de suite.

Conclusion et next steps

À la lecture ce cet article, vous souhaitez initier un projet de recommandation dans vos équipes ? Comme pour tout projet de Data Science, il ne suffit pas de la volonté et des connaissances d’un Data Scientist pour mener le projet à son terme. Voici quelques recommandations à suivre pour maximiser les chances que le moteur soit performant, utile et utilisé.

  • Il faut déterminer avec les équipes business adéquates quel est l’objectif de ce projet. En effet, selon le besoin (comme explicité plus haut dans l’article), l’approche change (basée sur le contenu ou sur la navigation), la métrique change (optimiser le clic, la commande, réduire l’attrition, augmenter la nouveauté, la diversité, etc.).
  • De plus, au sein de l’approche Content-based, il existe différentes manières de traiter des informations diverses : le texte et les images ne sont pas utilisées de la même manière que des caractéristiques simples du produit. De plus, comme indiqué précédemment, au sein des approches de type Collaborative Filtering, de nombreuses méthodes différentes sont utilisables ; chaque méthode a ses avantages et inconvénients et doit être utilisée de manière appropriée.
  • Du point de vue technique, il nous a fallu répondre, lors des projets menés par AVISIA, à de multiples challenges techniques : quelles données peuvent être utilisées pour un moteur de recommandation ? comment construire la matrice des données ? comment évaluer concrètement une méthode statistique ? est-il utile de créer une baseline ? quand et comment appliquer la méthode statistique pour proposer une recommandation ? quid des nouveaux utilisateurs et nouveaux produits ? faut-il ré-entraîner le moteur ? comment gérer les temps de calcul des recommendations ?

 

Cet article a introduit les principes des moteurs de recommandation, présenté les approches possibles, et soulevé des points d’attention importants pour l’implémentation. Un moteur de recommandation est simple à concevoir dans son objectif, mais son utilisation n’est pas triviale et représente un changement de paradigme par rapport à l’utilisation du machine learning classique pour répondre à un objectif de prédiction.

Pour vous aider à construire un moteur de recommandation, vous pouvez également utiliser la solution de Google nommée Google Recommandations AI. Il s’agit d’un service de recommandations prêt à l’emploi. On vous dit tout sur cette solution dans l’article « Optimiser ses ventes en ligne avec google recommendations AI ».


Merci à Margaux, MarjorieCaroline et Thibault, Consultants Data Science à AVISIA et experts en recommandation, pour la rédaction de cet article.

Recommended Posts
AVISIA