Focus prédiction Miss France : M-1 avant l’élection 2024
Depuis 2017, le Data Lab’AVISIA propose chaque année des prédictions pour l’événement national de l’élection Miss France. Initiative interne, le Data Lab’ encourage la création de projets de Recherche et d’Innovation qui permettent aux consultants de monter en compétences sur de nouveaux outils, tout en leur donnant l’opportunité de découvrir de nouvelles techniques ou technologies.
Cette année encore, une équipe de quatre consultantes contribue au maintien et à l’enrichissement de ce projet.
Retour sur notre année de gloire l’année dernière où le destin de notre projet a basculé sous les feux des projecteurs en réussissant à prédire notre Miss France 2023 ainsi que sa première dauphine. En combinant scraping Twitter et Wikipedia, ainsi que Deep Learning pour l’analyse des traits des visages des Miss, notre modèle avait réussi sa performance.
Cette année, nous avons continué de redoubler d’efforts et de déployer tous les moyens nécessaires pour que notre prédiction soit encore une fois, la plus juste possible pour l’évènement qui se déroulera le 16 décembre à Dijon.
LE MODELE
D’un point de vue plus technique, c’est la plateforme Data Science Dataiku qui est utilisée pour l’analyse de nos données. Cette plateforme permet d’intégrer facilement différents langages de programmation tels que Python, SQL, faire du Data Management mais aussi construire des modèles de Machine Learning, permettant ainsi d’apprendre sur nos données et de révéler nos prédictions. Les données générées par Dataiku en sortie sont ensuite envoyées et stockées sur BigQuery, composant de Google Cloud Platform (GCP).
Notre modèle de Machine Learning, qui évolue chaque année, s’appuie sur différentes sources de données :
- Les caractéristiques des candidates : âge, taille, région, etc. (Source : Wikipédia)
- La composition du jury : âge moyen du jury, répartition homme/femme (Source : Wikipédia)
- La démographie des régions : données socio démographique, nombres d’habitants, répartition par âge, par niveau d’études, par CSP (Source : données publiques INSEE)
La notoriété des Miss régionales sur les réseaux sociaux est également prise en compte :
- Jusqu’à maintenant, seules les données de Twitter étaient récoltées puis analysées. Cependant, depuis l’acquisition de Twitter par Elon Musk en octobre 2022, le réseau social connaît de nombreux changements. Twitter est devenu X, le logo a changé et les politiques d’utilisation de l’API ont beaucoup évolué, et nous sommes ainsi plus restreints sur la récupération des Tweets. Le compte Développeur nous permet d’accéder à l’API Twitter v2 et de pouvoir ainsi récupérer les tweets associés aux hashtags des nos Miss régionales, sur lesquels nous effectuons ensuite une analyse de sentiments. Cette analyse nous permet de classer les tweets par type (positif ou négatif) et calculer un score de popularité pour chacune des Miss.
- Une nouveauté cette année est l’ajout des données récupérées depuis Instagram. Il était ici important de compléter notre modèle avec les données de ce réseau social puisque celui-ci est souvent privilégié par les Miss pour leurs communications et est également un bon indicateur pour le suivi de la notoriété des Miss. L’utilisation de l’API Graph nous permet de récolter différentes informations :
- Les profils des Miss : comme le nombre de followers, le nombre de posts
- Les posts des Miss : nombre de likes, nombre de commentaires, commentaires sous chaque posts sur lesquels il est aussi effectué une analyse de sentiments
- Les posts relatifs aux Miss régionales afin de jauger les Miss les plus mentionnées
NOTRE APPLICATION WEB
Pour que chacun d’entre vous visualise au mieux ces éléments techniques, nous avons décidé de mettre en œuvre cette année notre ✨ application web ✨.
Notre application web, à destination des collaborateurs d’AVISIA, mais aussi du grand public, a été développée en Next JS et déployée avec Cloud Run, composant de Google Cloud Platform.
Via notre application web, vous pourrez retrouver plusieurs informations à la fois sur les Miss régionales, sur nos indicateurs de popularité (manipulés dans notre modèle de prédiction) et sur nos prédictions. A savoir, toutes ces informations sont mises à jour à chaque actualisation des données et du modèle sur la plateforme Dataiku.
Notre application web se décompose en trois parties. Au sein de notre page d’accueil, vous pourrez distinguer les détails suivants :
- La prédiction by AVISIA du top 5 Miss France disponible à partir de J-5 avant l’élection, soit le 11 décembre, avec la dernière date/heure d’actualisation du modèle
- Une description rapide du projet avec la possibilité d’aller consulter le site AVISIA pour plus d’informations
Dans une deuxième partie, une page est dédiée aux 30 candidates qui concourent au titre de Miss France, avec pour chacune d’entre elles la possibilité de cliquer sur le bouton « Voir plus » pour faire apparaître les différentes données et différents indicateurs sur la Miss (provenant de Twitter et Instagram).
Pour finir, une troisième page est consacrée à la comparaison de la popularité du top 10 des Miss régionales, pour connaître les favorites selon nos données et celle qui aura le plus de chances d’être prédite comme Miss France.
A VOS AGENDAS :
- Le 4 décembre 2023 : Lancement de notre application web dans laquelle on y retrouve toutes les informations et données liées au projet de prédiction Miss France
- Le 11 décembre 2023, soit à J-5 de l’élection : Publication de nos prédictions
- Le 16 décembre, le soir de l’élection : Suivez notre application web pour connaître les prédictions actualisées
- J+7 de l’élection : Publication du debrief de l’élection sur le blog AVISIA
Contact Presse : Agence PROFILE / Shérazade EL HOUARI
La Team Miss France : Manon MAHEO, Louise MERLAUD, Ophélie TOURLAN, Solène VENEZIA
Articles en lien
Data contact