Prédiction Miss France 2026 : les nouveautés AVISIA

Chaque année depuis 2017, le Data Lab’ AVISIA relève un défi original : prédire la future Miss France selon le vote du public grâce à l’IA.

Projet emblématique du Data Lab’, cette initiative interne encourage les consultants AVISIA à explorer de nouvelles approches technologiques à travers des projets de Recherche et d’Innovation appliquée.

Le projet Miss France s’inscrit dans cette démarche en permettant d’explorer les enjeux du social listening, de tester des modèles prédictifs, et d’expérimenter les dernières avancées de GenAI dans un cadre à la fois ludique et concret.

Un modèle qui a déjà fait ses preuves

Prédire la prochaine Miss France n’est pas une tâche aisée : une grande part d’incertitude demeure au moment où le modèle est lancé :

  • Les prédictions sont publiées 5 jours avant l’élection.
  • Sur les 30 Miss régionales, seules 12 Miss sont présélectionnées pour prétendre au titre, une information inconnue lors de la publication de nos résultats,
  • Une fois cette présélection effectuée, les candidates sont ensuite départagées à 50/50 entre le vote du public et celui du jury.
  • Une grande partie du résultat se joue en direct le soir de l’élection, selon l’aisance, le discours ou encore la présence scénique des finalistes.

Malgré ces contraintes, le modèle ne cesse d’être amélioré et affiné chaque année pour anticiper le maximum de paramètres possibles. Et les résultats parlent d’eux-mêmes, sur ces 3 dernières années c’est :

  • 1 Miss France correctement prédite
  • Plus de 50 % du Top 5 est identifié par le modèle
  • Le Top 3 prédit dans le bon ordre lors du premier tour de l’élection Miss France 2025. L’an dernier, notre modèle avait classé Miss Martinique en 2ᵉ position, avant que les votes en direct et la délibération du jury ne viennent inverser la tendance pour la couronner Miss France 2025. Vous pouvez retrouver plus de détails sur l’édition passée sur cet article.

Cette année encore, alors que l’élection aura lieu le 6 décembre à Amiens, notre modèle est prêt à être actualisé pour tenter de prédire la prochaine Miss France 2026 !

Comment fonctionne ce modèle ?

D’un point de vue technique, le projet est construit sur la plateforme Dataiku pour le traitement des données, qui sont ensuite stockées sur BigQuery, composant de Google Cloud Platform (GCP)

Le projet s’accompagne également d’une page web, développée en Next JS et déployée sur Google Cloud, qui permet de suivre chaque jour l’évolution des prédictions ainsi que les indicateurs de popularité des candidates.

Pour estimer les chances de chaque candidate d’accéder au Top 5 du vote du public, notre modèle s’appuie sur plusieurs sources de données complémentaires, combinant tendances historiques et dynamique sociale en temps réel.

Les données historiques

Wikipedia
INSEE

 
Un modèle de Machine Learning est entraîné sur les résultats des élections des 15 dernières années afin d’identifier les régions ayant historiquement le plus de chances d’accéder au classement final. Ces données, principalement issues de Wikipédia, intègrent :

  • Les caractéristiques des candidates et leurs résultats aux précédentes éditions,
  • Les votes du public, permettant de repérer les régions les plus soutenues au fil des années.

À cela s’ajoutent des données socio-économiques provenant de l’INSEE, telles que le PIB régional, la répartition de la population, le niveau d’études ou encore la catégorie socio-professionnelle dominante, afin d’enrichir le profil des régions.

Les données issues des réseaux sociaux

Logo Avisia
Instagram
TikTok

 
La popularité en ligne des Miss régionales est également un indicateur fort du vote du public. Les données de trois plateformes complémentaires sont collectées via la plateforme de web scraping Apify :

  • X (ex-Twitter), réseau social historique et qui reste une référence pour capter les conversations et réactions en temps réel autour de l’élection. Principalement utilisé par les 35-54 ans, il se distingue par des échanges plus textuels et analytiques, permettant de suivre les opinions et débats suscités par les différentes candidates.
  • Instagram, qui constitue un excellent indicateur de visibilité et d’engagement médiatique. L’évolution du profil des Miss régionales (nombre de followers, taux d’engagement, interactions sur les publications) permet d’évaluer leur popularité grand public et leur capacité à mobiliser une communauté.
  • TikTok, où un fort engouement s’observe depuis plusieurs années chez les jeunes générations (notamment les moins de 25 ans). Bien avant l’élection, les utilisateurs y publient leurs propres classements, renforçant le sentiment d’implication du public et contribuant ainsi à façonner les tendances et à amplifier la portée médiatique du concours.

Ces données sont ensuite enrichies grâce à une analyse de sentiments réalisée via la GenAI, permettant d’attribuer à chaque Miss un score de popularité. Les commentaires issus des posts des Miss sont ainsi classés selon un ton positif, neutre ou négatif. Et l’an dernier, ce sont plus de 130 000 commentaires récoltés en 2 semaines qui ont ainsi été analysés.

Cette combinaison entre données historiques et indicateurs sociaux dynamiques permet d’assurer un équilibre dans les prédictions, en tenant compte à la fois des tendances passées et de l’engouement en temps réel du public.

Les principales nouveautés pour la prédiction de 2026 !

Un indicateur de représentation orale pour mieux anticiper les discours en direct

Certaines variables demeurent difficilement anticipables : présence sur scène, aisance à l’oral, discours, réactions du public… Autant d’éléments susceptibles de faire évoluer le classement final et qui restent difficiles à prédire au moment de l’annonce des prédictions, et ceci 5 jours avant l’élection.

L’année passée, nous avions bien anticipé le top 3 du premier tour, mais celui-ci a ensuite évolué lors du direct. 

Pour cette nouvelle édition, nous avons donc choisi d’affiner notre modèle de prédiction avec un nouvel indicateur : un score de représentation orale. Celui-ci est calculé à partir des vidéos de présentation officielles publiées par les candidates sur leurs comptes publics et permet d’évaluer différents aspects : aisance à l’oral, fluidité du discours, niveau de langage.

Comment avons-nous procédé ? 

Dans un premier temps, un traitement de Speech-to-Text est appliqué pour transcrire les vidéos et extraire le contenu verbal des présentations. Dans un second temps, un modèle de langage (LLM) analyse automatiquement deux dimensions essentielles :

  • La fluidité : capacité de la candidate à s’exprimer de manière naturelle, sans hésitations ni ruptures ;
  • Le niveau de langage : qualité lexicale et syntaxique du discours, ainsi que la pertinence du vocabulaire employé.

À partir de ces éléments, un score global de représentation orale est calculé. Celui-ci permet d’attribuer un léger “booster” aux candidates dont la communication se distingue particulièrement, un atout souvent décisif lors du direct.

Comment suivre nos résultats ?

Notre page web reste le cœur du dispositif. Elle sera actualisée tout au long de la période précédant l’élection, pour présenter les prédictions 2026 (publiées le 1er décembre) et suivre en temps réel l’évolution des tendances. Celle-ci sera ouverte à partir du 24 novembre et vous y retrouverez :

  • Une présentation du projet et un compte à rebours avant la révélation des prédictions 
  • Une fiche détaillée pour chacune des 30 candidates à l’élection de Miss France 2026
  • Une analyse comparative de la popularité des Miss régionales, pour découvrir les favorites selon nos données et identifier celles ayant le plus de chances d’accéder au titre.

Mais cette année, vous pourrez faire encore plus !

Donnez votre avis ! Choisir sa miss favorite

Grande nouveauté pour l’élection 2026 : le public peut désormais voter pour sa Miss favorite.

Grâce à cette fonctionnalité interactive, les visiteurs de notre page web peuvent exprimer leur préférence et consulter en temps réel le classement des candidates les plus plébiscitées.

L’objectif ? Observer si les votes des internautes suivent les mêmes tendances que celles prédites par notre modèle, et mesurer la convergence (ou non) entre la data et l’opinion publique.

Une vision régionale des tendances

Autre nouveauté : une page sera désormais dédiée pour une analyse comparative par grandes régions.

Chaque zone géographique, par exemple Outre-mer, Nord-Ouest, Auvergne-Rhône-Alpes, etc., dispose de sa propre page, permettant de comparer les dynamiques locales et d’explorer comment ces tendances régionales influencent les résultats à l’échelle nationale !

A VOS AGENDAS :

  • Le 24 novembre 2025 : Lancement de notre page web avec toutes les informations et données sur les Miss, ainsi que la possibilité de voter pour votre Miss favorite !
  • Le 1er décembre 2025, soit à J-5 de l’élection : Publication de nos prédictions
  • Le 6 décembre 2025, le soir de l’élection : Suivez notre page web pour connaître les prédictions actualisées
  • Le 11 décembre 2025 : Publication du debrief de l’élection sur le blog AVISIA

 

La Team Miss France : Anne-Sophie LE BAYON, Manon COUSIN, Solène VENEZIA

Articles en lien

Data contact

Avec notre expertise, faites parler vos données