In Communiqué, Tribune expert

Focus sur nos prédictions pour le Match de Finale 

************************

La révolution de la Data dans le sport :

La Data est présente dans tous les domaines, le sport n’y échappe pas. Le football professionnel en est le parfait modèle, où la donnée est utilisée dans toutes les parties prenantes (clubs, médias, recruteurs, agents de joueurs…). Côté rugby, les clubs et les sélections emboîtent le pas et exploitent désormais les données au quotidien. 

L’équipe de France en est un très bon exemple. En effet via son partenariat avec l’éditeur SAS, elle décortique toutes les données disponibles issues de tracking, radar, vidéo, …  (cf l’article BFMTV). Ces analyses ont plusieurs avantages : gain de temps, définitions et suivis d’objectifs personnalisés entre autres.

C’est dans ce cadre qu’a lieu depuis le 8 septembre 2023, en France, la Coupe du Monde de rugby, la plus importante et prestigieuse compétition de rugby à XV. Au cours de celle-ci, les 20 meilleures sélections vont s’affronter et tenter de décrocher le titre final. 

Le Rugby Player Index :

L’occasion pour nous de vous présenter, en détail, un outil de mesure et suivi de la performance, construit à partir de la donnée par notre AVISIA Sports _Lab’ : le Rugby Player Index. 

Cet indicateur de performance, spécifique au Rugby, a pour objectifs de :

  • Résumer la performance d’un joueur en une note globale sur 100,
  • Rester stable et robuste dans le temps, 
  • Être comparable entre les joueurs et les équipes,
  • Être interprétable via la création de 6 notes intermédiaires. 

Une approche mathématique :

Afin de construire notre indicateur et ses applications, nous avons récolté l’historique des matchs de chacune des équipes présentes à la Coupe du Monde : Test match, Coupe du Monde, Six Nations, Tri-Nations …. Soit plus de 800 matchs depuis 2016.

Pour chacun des matchs, nous avons à notre disposition trois groupes d’informations : 

  • Le contexte du match : date, lieu, résultat ..
  • Les statistiques par équipe,
  • Les statistiques par joueur.

Nous retrouvons une trentaine de statistiques, nous permettant la construction de l’indicateur, qui sont retravaillés afin de prendre en compte toutes les spécificités du rugby : 

  • Des postes différents : Les attentes de performance sont différentes entre les postes, nous appliquons des pondérations spécifiques aux statistiques selon les besoins de chaque poste.
  • Des styles de jeu différents : Les nations sont classifiées selon leur style de jeu. Les statistiques des joueurs sont remises à niveau selon le style de jeu de leur équipe,  
  • Un temps de jeu significatif : Le joueur doit avoir joué un minimum de 7 matchs pour être noté.

 

 

 

 

 

 

 

 

 

 

 

 

 

Source : https://www.sport365.fr/differents-types-de-postes-rugby-3502507.html

En regroupant mathématiquement certaines de ces statistiques, nous pouvons définir les performances d’un joueur sur plusieurs axes interprétables

  • Course (Déplacement avec ballon)
  • Distribution (Jeu de passe)
  • Kicking (Jeu au pied)
  • Physique (Jeu défensif)
  • Rigueur (Aptitude à ne pas concéder le ballon à l’adversaire)
  • Mise en danger (Impact offensif)

Ces sous-catégories sont ensuite combinées pour définir un indice allant de 0 à 100. Cet indice est calculé pour l’ensemble des joueurs des différentes équipes présentes à la Coupe du Monde et vous donne une lecture directe et simplifiée de la performance d’un joueur.

Application de l’indicateur dans un modèle de prédiction :

L’indicateur représentant la performance des joueurs, nous pouvons l’utiliser pour prévoir les résultats futurs de l’équipe. Nous avons donc mis en place un modèle de prévision de résultat des matchs de la Coupe du Monde de Rugby 2023. 

Notre modèle prend donc en compte des variables construites à partir de l’indicateur (Moyenne des indices sur les derniers matchs, top joueurs …) mais également les statistiques par équipe que nous avons à disposition. 

À cela s’ajoute de nouvelles variables créées à partir des données nous permettant de prendre en compte:

  • la forme actuelle de l’équipe,
  • le taux de rotation dans l’effectif,
  • le nombre de jours de repos entre les matchs…

Toutes ces variables ont permis la construction du modèle de Machine Learning de type Support Vector Machine (SVM, ou Machine à vecteurs de support en français)  et dont les résultats sont performants. Par exemple, sur les matchs des 6 Nations 2023, nous atteignons 80% de bonnes prévisions/de bons résultats (12 bonnes prévisions sur 15 matchs).

L’ensemble de ces traitements ont été réalisés en Python et/ou via l’éditeur Dataiku et sa plateforme Data Science Studio (DSS). 

Notre utilisation :

Nos travaux sont utilisables dans plusieurs situations comme des outils d’analyses et d’aides à la décision :

  • En amont d’une saison ou d’une compétition pour définir le groupe le plus complet possible selon l’objectif recherché,
  • En avant-match afin de préciser les points forts/faibles de l’adversaire et choisir la meilleure stratégie à appliquer,
  • En après match pour analyser et comprendre le résultat d’un match à partir de la donnée. 

AVISIA vous proposera avant chaque match, une analyse globale des deux équipes ainsi que des statistiques sur les principales confrontations individuelles pour chacun des postes

Si le Sport et la Data vous passionnent, retrouvez également les modèles analytiques réalisés pour le Football  en cliquant ici.

Même la presse en parle! Pour retrouver le passage de Pascal BIZZARI, dans l’émission de BFM BUSINESS :  SPORT BUSINESS cliquez ici

 

Recommended Posts
AVISIA