In Tribune expert

Depuis le début de la crise sanitaire, de nombreux secteurs d’activité ont été bouleversés, et cela peu importe la taille de l’entreprise. Un an après l’apparition de la COVID, cette pandémie continue sans cesse d’évoluer avec notamment 99,7 millions de personnes testées positives au Covid-19 dans le monde (selon les données compilées par l’université américaine Johns-Hopkins jusqu’au 26 janvier 2021). Elle a aussi d’importantes conséquences sanitaires, économiques et financières. Cette situation est inédite et demande aux entreprises d’adapter ses produits et ses services. De nombreuses entreprises puisent déjà dans leurs data pour s’ajuster à ce nouvel environnement mais peuvent avoir des difficultés à s’y adapter, notamment pour la modélisation prédictive :

Quels sont les impacts de la crise sanitaire sur les modèles ? Comment obtenir des modèles performants suite à la COVID19 ? Comment les monitorer dans le temps ? 

Suite à notre dernier article publié à la sortie du premier confinement (lien ci-dessous), nous avons complété et structuré nos savoir-faire en développant une approche pragmatique basée sur de nombreux retours d’expérience (secteur du retail, de la cosmétique, de l’automobile, …) qui permettent aux entreprises de prendre la meilleure décision en fonction des effets de cette crise sanitaire.

Comment la data peut aider à surmonter la crise ?

Quels sont les chantiers majeurs à travailler ?

Chantiers à analyser

Nous avons listé 5 chantiers majeurs à travailler avec différents niveaux de difficulté pour prendre en compte les effets de la crise sanitaire, les voici ci-dessous :

  • Diagnostic 📈 (niveau de difficulté : très facile)
    Avant toute chose, il est nécessaire d’analyser la viabilité du modèle afin d’identifier ou non une dégradation de la performance. L’idée est d’établir un diagnostic complet avec et sans les données de la crise sanitaire en faisant des statistiques descriptives de manière univariée / bivariée, mais aussi en mesurant la performance théorique & opérationnelle du projet.
  • Périmètre 👓 (niveau de difficulté : facile)
    Un modèle qui se base sur plusieurs mois ou années d’activité peut venir perturber les dernières prévisions et ne pas refléter les dernières tendances de l’activité. C’est donc l’occasion de revoir le périmètre du projet data en identifiant le bon historique (exemple : réduire ces données sur une période précise : avant / pendant / après la crise) mais aussi le bon niveau de précision (ex : affiner la granularité des prévisions) pour permettre une adaptation rapide pour l’entreprise.
  • Développement de variables 🚀 (niveau de difficulté : moyen)
    Le modèle se dégrade au fur et mesure du temps et n’identifie toujours pas les nouveaux comportements, alors le data scientist peut développer de nouvelles variables pour apporter du contexte à son modèle et venir absorber les particularités de cette crise. Le data scientist peut, par exemple, créer des indicateurs décrivant la crise, ou encore pondérer les données de la crise.
  • Moteur d’intelligence 🤖 (niveau de difficulté : difficile)
    Les prévisions ne peuvent plus être diffusées car le modèle en place n’est plus performant, alors le data scientist doit trouver le bon niveau d’intelligence pour continuer à diffuser. Par exemple, en utilisant une solution quick-win pour diffuser rapidement, en réapprenant son modèle plus souvent ou bien en créant des modèles croisés.
  • Monitoring 📊 (niveau de difficulté dépendant des chantiers cités précédemment)
    Pour savoir si son projet data fonctionne dans le temps, il est indispensable de le monitorer pour analyser l’impact de ses actions. Ce monitoring permet de répondre à plusieurs questions comme : est-ce que la performance est stable dans le temps ? Est-ce que mes modèles / mes variables les plus importantes ont dévié depuis le dernier réapprentissage du modèle ?
    Grâce à ce monitoring, c’est aussi l’occasion de mettre en place des alertes pour agir rapidement en cas de baisse significative de la performance ou bien d’anomalie(s) dans le flux.

Si vous êtes perdus dans ces chantiers ou que vous ne savez pas lesquels choisir, alors consultez le décisiomètre associé dans la suite de cet article !

Le décisiomètre envisagé : comment choisir un chantier ?

Décisiomètre sur les chantiers

Avant de se lancer dans les différents chantiers, il est nécessaire de se poser les bonnes questions pour axer votre intervention en consultant notre décisiomètre comme ci-dessus. Ces différentes questions permettent à une intervention d’être itérative en ajoutant successivement la bonne couche d’intelligence. Par exemple, la première itération va porter sur le diagnostic de vos modèles en analysant s’il y a eu ou non un impact suite à la crise sanitaire. Une fois que le diagnostic est réalisé et que vous constatez une évolution des comportements et de la performance, la seconde itération apportera des modifications sur le périmètre de votre projet data. En fonction des besoins identifiés au préalable, certaines étapes seront réalisées, et ainsi de suite jusqu’à la partie monitoring, cruciale dans le projet.

Et après ?

Voilà bientôt un an que la crise sanitaire subsiste dans notre société et qu’il est d’autant plus difficile de pouvoir anticiper certains phénomènes. Grâce à notre approche pragmatique basée sur de la Data Science, vous pourrez créer et utiliser des modèles performants malgré le contexte actuel.

Si vous avez besoin d’être accompagnés sur ce type de sujet, nous pouvons mettre à profit nos expertises, validées par de nombreux retours d’expériences chez nos clients, pour vous aider à retrouver la performance & la confiance envers vos modèles prédictifs.

Recommended Posts
AVISIA