Au sein du Data Lab’ AVISIA, plusieurs projets de Recherche et d’Innovation se basant sur l’utilisation de la donnée, naissent chaque année. Véritable initiative interne, les consultants collaborent lors de leur temps libre sur des sujets techniques et d’actualité autour de la Data et l’IA. Grâce à ces projets, ils se challengent et montent en compétence sur de nouveaux outils ou process via des objectifs plus créatifs ou sur des sujets out of the box.
Depuis 2017, une équipe de consultants AVISIA constituée de Data Scientists s’est lancée dans un projet de prédiction annuel de notre Miss France. A quelques jours de l’élection, nous faisons tourner un modèle qui s’appuie sur différentes sources de données :
- Sur le profil des candidates : âge, taille, région, métier, classement au concours régional (Source : Wikipédia),
- Sur les données démographiques (région des élues et lieu de l’élection) : données socio démographique, nombre d’habitants, répartition par âge, par niveau d’études, par CSP (Source : données publiques INSEE)
- Sur les réseaux sociaux associés aux hashtags Miss : nombre de tweets, de retweets, de likes, de followers … avec une analyse de sentiments sur les tweets pour les classer en positif/négatif (Source : données API Twitter)
- Sur les données d’images génériques servant de référentiel pour la couleur des yeux, couleur des cheveux, … (Source : Google Image & algorithme de Deep Learning pour le traitement d’images)
Sur l’aspect technique, la plateforme Data Science Dataiku est utilisée pour collecter, nettoyer et modéliser la donnée, tout en combinant plusieurs langages comme R ou Python.
A quelques jours du traditionnel voyage de préparation des Miss régionales, le moment est venu de mettre à jour notre modèle de prédiction de notre prochaine Miss France. Pour cela nous commençons par analyser nos prédictions de l’an passé face aux résultats de l’élection. Notre modèle avait bien prédit Miss Martinique comme étant la favorite du public mais le jury lui, avait préféré Miss Île de France. Vous pouvez retrouver le détail de notre analyse de la précédente édition dans cet article (Résultats 2022). Cela s’était expliqué par le changement dans la comptabilisation des votes. En effet depuis 2020, les votes sont partagés à 50% entre les membres du jury et le public. Le jury appuie ses votes sur différents facteurs : le test de Culture Générale, le comportement des Miss régionales durant leur voyage d’intégration, leur attitude avec les médias, leur passage devant le jury… autant de facteurs humains qui peuvent biaiser la prédiction.
Cette année, nous avons néanmoins amélioré la méthodologie pour prendre en compte le vote du jury. Nous développerons les techniques utilisées dans un prochain article. En attendant, on peut vous dire qu’on met tout en œuvre pour prédire la nouvelle Miss avant le direct !
A VOS AGENDAS :
- Le 16/12, J-1 de l’élection : Publication des résultats de nos prédictions 2023
- Le 17/12, Jour J : Suivez AVISIA sur Twitter (@avisia_fr) pour connaître les prédictions actualisées à 3 moment forts du Prime
- A J+7 de l’élection : Publication du debrief de l’élection sur le Blog AVISIA
Suivez toute l’actualité prédiction Miss France et interagissez sur nos réseaux sociaux : LinkedIn : @avisia_fr Twitter : @avisia_fr
Contact Presse : selhouari@agence-profile.com
L’équipe : Ophélie TOURLAN, Amélie POILVERT, Analia GHELFI, Myriam ATTAR, Elise LAZURE, Matthieu BROCHARD