In Tribune expert

Entre périodes de festivité, actions commerciales, inflation ou encore mouvements sociaux, le comportement des consommateurs est en constante mutation. Dans ce marché en évolution, les entreprises peuvent se doter d’outils fiables leur permettant d’optimiser leurs coûts notamment via l’utilisation de l’IA dans le domaine de la Forecast pour les aider dans la prévision des ventes ou dans la planification de leurs effectifs.

La forecast de la demande pour les entreprises

Afin de suivre le rythme de la demande, il est nécessaire d’adapter sa chaîne logistique et d’armer ses équipes de solutions concrètes dans la planification, l’approvisionnement des ressources, la fabrication des produits et leur distribution. 

Les problématiques de la supply chain sont largement guidées par les prévisions de la demande. Les prévisions sont des estimations des quantités futures établies à partir des historiques de ventes, des tendances actuelles, et d’autres données externes qui peuvent avoir un impact sur les ventes futures comme les promotions ou la météo. 

La forecast de la demande est un élément central dans les processus S&OP (Sales and Operations Planning) puisqu’elle permet de prévoir les besoins sur toute la chaîne logistique, de l’approvisionnement des matières premières jusqu’à la distribution des produits en passant par leur production et leur stockage. On peut ainsi définir avec les différents départements de l’entreprise une vision commune afin de prendre des décisions  à moyen terme pour planifier les besoins de main d’œuvre ou encore déterminer à long terme les investissements à réaliser pour répondre à la demande future.

Pour chaque besoin, la forecast est construite selon plusieurs dimensions : 

  • La granularité : produit, gamme de produit..
  • La temporalité : journalière, hebdomadaire, mensuelle..
  • La maille géographique : niveau national, départemental, magasin..
  • L’horizon de forecast : à définir selon le lead time d’approvisionnement des produits et le niveau de décision (opérationnel, tactique, stratégique).

La réalisation des forecasts de la demande permet ainsi de répondre à plusieurs type de problématiques qui peuvent concerner différents maillons de la chaîne logistique : 

  • Quelle quantité de produit mon magasin doit-il commander à l’entrepôt central pour répondre à la demande des clients le 14 juillet ?
  • Quelle quantité dois-je produire pour lancer un nouveau produit saisonnier de la collection printemps-été 2023 ?
  • Quel effectif dois-je prévoir pour préparer mes commandes e-commerce la semaine avant Noël ?

Face aux besoins des entreprises, AVISIA met à disposition son savoir-faire pour exploiter les données et construire des outils de prévision basés sur l’IA.  Dans cet article, nous nous concentrerons sur la modélisation de la forecast de la demande avec des modèles statistiques et de machine learning afin de répondre à ces trois problématiques.

Forecast de la demande pour optimiser la distribution des produits en magasin

Quelle sera la quantité de glaces au chocolat vendues dans mon magasin de Nancy le 14 juillet 2023 ? 

Livrer la bonne quantité de produits au bon moment au bon endroit est le nerf de la guerre de nombreuses entreprises afin de maximiser les ventes et de minimiser les pertes de produits (pour des raisons économiques et environnementales). Dans notre exemple de glaces au chocolat, l’épicier du magasin de Nancy souhaiterait avoir assez de glaces pour satisfaire sa clientèle, sans être en excès car la capacité de son congélateur est limitée.

Choix du modèle de forecast de la demande

Lorsque l’on construit un modèle de forecast pour la prévision de la demande, on peut s’intéresser à différents types d’algorithmes. Il est possible de tous les mettre en compétition sur nos données et de choisir le plus performant, mais surtout, il est nécessaire de sélectionner celui qui répond le mieux possible à notre besoin.

Modèles statistiques

Les modèles statistiques ont fait leurs preuves depuis quelques décennies et sont très largement implémentés aujourd’hui dans l’industrie. Ils ont l’avantage d’être robustes et compréhensibles par les équipes métiers.  Comme ils donnent de très bons résultats même face aux algorithmes de Machine Learning, ils doivent impérativement être pris en considération lorsque que l’on met en place un nouveau modèle de forecast. Parmi les plus utilisés, on retrouve par exemple :

  • Des méthodes de lissage qui s’appuient sur les ventes passées en donnant plus d’importance aux données récentes. Avec le modèle de Holt-Winters la tendance et la saisonnalité sont prises en compte.
  • Facebook Prophet ou des modèles autorégressifs comme SARIMAX qui sont des méthodes statistiques plus évoluées. Il est possible d’ajouter des données exogènes (externes) à la série, comme les vacances scolaires ou la météo. 
Modèles de Machine Learning

Les algorithmes de Machine Learning ont émergé il y a quelques années et sont de plus en plus utilisés pour la prévision de la demande. Ces modèles donnent de très bons résultats, souvent meilleurs que les modèles statistiquesL’avantage est qu’ils peuvent traiter de grandes quantités de données et trouver de manière automatique des relations entre des variables exogènes et les ventes réalisées que l’on cherche à prédireIls sont intéressants à mettre en œuvre à condition d’avoir un grand nombre de séries temporelles à prédire qui vont avoir des similitudes (même type de produit, de magasin, …). La difficulté réside surtout en aval de la prévision car ce type de modèle est plus difficile à interpréter ce qui rend l’adoption par le métier plus compliquée. Parmi les plus utilisés pour les forecasts, on retrouve par exemple :

  • Des méthodes qui reposent sur de l’agrégation d’arbres de décisions comme XGBoost ou LightGBM.
  • Des réseaux de neurones récurrents comme LSTM (long short term memory) qui gardent en mémoire les ventes passées pour faire des prédictions futures.

Données à intégrer dans les modèles de forecast

Quel que soit le modèle utilisé, celui-ci sera toujours meilleur si on utilise des données qui vont apporter de l’information au modèle. Ces données doivent être correctement traitées des anomalies afin de ne pas avoir de prévision erronée en sortie. Voici quelques exemples de variables qui peuvent aider le modèle de statistique ou de machine learning.

  • Les promotions : indicateur de promotion et de mécanique promotionnelle.
  • Les stocks : nécessaires pour dépolluer les historiques des ruptures de stocks. Le but est souvent de faire une prévision de la demande et donc de refléter le potentiel des ventes, même si l’article est en rupture de stock.
  • Les données e-commerce : utiles seulement si elles ne sont pas 100% corrélées temporellement aux ventes. Il faut qu’elles donnent une vision anticipée des ventes. On pourra utiliser le nombre de pages vues, les ajouts au panier…
  • Calendrier : événements nationaux (Noël), événements locaux (24h du Mans), vacances scolaires, jour de la semaine, indicateur début / fin de mois (reflet de la période à laquelle les gens perçoivent leur salaire)…
  • Données météorologiques : très utiles pour des articles météo-sensibles comme les glaces.
  • Des indicateurs macroéconomiques : salaire moyen, taux d’inflation, prix de l’énergie, indice du CAC40…
  • Indicateurs relatifs au COVID si besoin de retraiter les séries temporelles du covid (actions gouvernementales, historique des vols de compagnies aériennes..)

Forecasts de la demande de nouveaux produits saisonniers

Lors du lancement de la nouvelle collection saisonnière le 23 Janvier, combien de sweats bleus seront vendus ?

Les sujets de prévision de la demande avant lancement de nouveaux produits représentent un énorme enjeu pour les entreprises, en particulier celles qui ont des lancements saisonniers fréquents. Ces produits dits “saisonniers” ne seront produits qu’une seule fois, quelques semaines/mois après leur lancement ils seront retirés du catalogue magasin et donc plus disponibles à l’achat. Il est donc impératif de prévoir au mieux les ventes d’un produit pour en assurer les quantités à produire nécessaires et répondre au mieux à la demande client tout en limitant au maximum le stock de produits invendus en fin de saison.

Le machine learning au service des produits saisonniers

La difficulté avec la prévision de vente de nouveaux produits c’est qu’il n’y pas d’historique concernant ce produit sur lequel s’appuyer pour estimer ces ventes. Il est donc difficile d’utiliser un algorithme statistique comme un lissage exponentiel qui nécessite plusieurs années d’historique. En revanche, l’analyse et l’utilisation des données de ventes des anciens produits constituent une source d’information indispensable dans la création de notre modèle de Machine Learning

Pour la collection saisonnière citée en exemple, on remarque notamment que les ventes se traduisent par une forte demande dans les premières semaines et une décroissance sur les semaines suivantes. Ce phénomène est typique des collections saisonnières, la demande est très forte les premières semaines due à l’engouement pour les produits grâce à la pub et les promotions faites par l’entreprise. Nous pouvons modéliser le cycle de vie du produit saisonnier par la courbe suivante: 

Le Machine Learning va permettre de trouver de manière automatique ces patterns spécifiques en s’appuyant sur les lancements d’anciens produits qui présentent des similitudes avec les nouveaux produits à prédire. À noter que cette courbe ne représente pas forcément une norme, selon l’entreprise, sa stratégie de vente, ses stocks, les tendances de ventes peuvent être bien différentes. Il est nécessaire de faire cette analyse en amont de la création de notre modèle afin de bien comprendre les comportements de ventes des collections. L’objectif étant d’apporter des indicateurs pertinents à notre modèle.

Données à intégrer dans les modèles de forecast des produits saisonniers

En plus des données vues précédemment, on peut également ajouter pour alimenter le modèle de machine learning : 

  • Historique des ventes de produits similaires : détection de la similarité entre anciens et nouveaux produits à l’aide du prix, de la matière, de la catégorie de produit, de la proximité visuelle entre les images des produits…
  • Potentiel de vente déterminé par les équipes métier : les quantités de produits à produire définies par les experts métiers
  • Préventes : le nombre de réservations sur les produits
  • Les données e-commerces : dans ce cas les données e-commerce peuvent être précieuses afin d’extraire des premiers signaux qui peuvent refléter le potentiel d’un futur article.

Ces données nécessitent un retraitement afin d’en extraire toutes les informations qui s’avèrent utiles au modèle. Il est important de faire valider les forecasts du modèle par une équipe métier ayant une grande connaissance sur les produits. Les retours des experts métiers permettent de faire évoluer le modèle et d’améliorer la qualité des forecasts.

La forecast dans la planification des effectifs

Combien d’employés faudra-t-il affecter la semaine avant Noël pour préparer les commandes dans le magasin de Nancy ?

Quand les services de commerce en ligne fourmillent au sein des marques de grande distribution, les défis se multiplient pour préserver une efficacité dans la livraison, la préparation des commandes, la gestion des stocks et des ressources humaines sans mettre en péril son commerce physique, en particulier pendant les périodes de fortes activités. Afin de préserver un équilibre des effectifs entre gestion des ventes en magasin et préparation des commandes, les prévisions de la demande peuvent offrir une aide dans la planification des ressources humaines.

Le problème de staffing : entre réduction des coûts et saturation des magasins

Ouvrir un canal de commerce en ligne en plus des activités en magasin demande une rigueur dans la gestion de ses ressources :

  • un manque d’effectif en préparation des commandes entraîne des reports et de l’indisponibilité impactant la satisfaction client
  • un surplus d’effectif engendre des coûts inutiles.

La tâche se complexifie lorsque l’activité des consommateurs fluctue entre jours de fêtes, promotions, intempéries, inflation… Afin d’estimer les besoins en termes de ressources humaines dans les semaines à venir, nous cherchons à estimer la demande en termes de quantités de commandes.

De la donnée à la prévision, de la prévision à l’effectif

La demande varie dans le temps et selon des facteurs externes (croissance du magasin, effets vacances, …). Il est donc question d’analyser des séries temporelles : les données retraçant l’historique des commandes passées deviennent une source riche d’informations. Cela permet d’identifier les facteurs contribuant dans l’évolution des commandes et leur impact (e.g. une augmentation de X% des commandes la 1ère moitié de décembre due à l’approche des fêtes de fin d’année).

Guidés par ces analyses, des méthodes d’intelligence artificielle et statistiques permettent de modéliser les séries temporelles comme une composition de facteurs à partir des données sur le passé telles que :

  • la tendance et les effets de saisonnalité,
  • les périodes de vacances scolaires,
  • les périodes de promotion et évènementielles…

Ces méthodes “prolongent” la logique de ces composantes afin d’obtenir des prévisions de manière automatique pour l’ensemble des magasins. Avoir la décomposition des séries temporelles par facteur assure que les prévisions restent interprétablesCes prévisions sont soumises à une supervision macro des experts métiers afin de valider la qualité des prévisions avant d’être retranscrites en termes d’effectif pour chaque jour à planifier, puis livré aux managers de magasins pour la planification de ses équipes. 

 

Pour booster la qualité de la prévision et anticiper les dérives

La construction du modèle de machine learning et sa validation avec les équipes métiers ne sont qu’une partie du cycle de vie du projet.

Le modèle doit être déployé en production afin que les inférences (les prédictions) soient disponibles dans les outils métiers. Ensuite, le modèle doit être monitoré afin de contrôler le modèle en production.

Pour cela, il ne suffit pas de s’assurer que le modèle tourne correctement en production.

  • Les performances des forecasts sont suivies régulièrement avec des indicateurs non biaisés comme la RMSE (Root Mean Square Error) et des indicateurs compréhensibles par le métier comme des écarts relatifs entre les prévisions et les ventes.
  • Les données d’entrée sont monitorées également. On met en place des indicateurs statistiques afin de comparer la distribution des variables lors de l’entraînement du modèle et lors de son inférence. Il est possible par exemple que tous les prix augmentent ce qui peut avoir un impact pour le modèle.
  • On mesure les corrélations entre les variables en entrée du modèle et la forecast afin de vérifier que les variables apportent toujours les mêmes informations.

Ce suivi est indispensable car les habitudes de consommation peuvent très vite évoluer et un modèle peut devenir obsolète. Il est ainsi indispensable de le monitorer, d’identifier et d’apporter des améliorations continues avec le métier et de réentraîner le modèle régulièrement afin d’y intégrer les données les plus récentes.

Des outils comme ceux de nos partenaires chez AVISIA sont précieux pour faciliter la mise en œuvre de toutes ces tâches : Google Cloud Platform Vertex AI et Dataiku DSS.

Pour en apprendre plus sur le MLOps (Machine learning operations) ou le suivi des drifts, vous pouvez aussi consulter nos articles : 

Jordan FLON, Aurélien LEFEUVRE, Yves TRAN, Data Scientists AVISIA

Recommended Posts
AVISIA