In Vie de l'entreprise

Comme chaque mois, nous vous proposons de partager les thèmes qui animent nos échanges internes de nos experts & leaders de communautés.

DATAVIZ – La boite à outils du Data Artist

Il est très courant de voir des boîtes à outils ou des Cheats Sheets (la prononciation est importante) pour la Data Science ou le Data Engineering. Portant du côté de la Data Viz, c’est un peu plus compliqué … Pour essayer de faire une boîte à outils la plus intéressante possible, nos experts ont travaillé sur deux axes :

  • Le fond : Quels graphiques ? Pour représenter quoi ? Comment ? Pour qui ?
  • La forme : Quelles couleurs ? Quel style ? Des exemples ?

Choix des graphiques, bibliothèque d’inspirations, vidéo de tuto, harmonie des couleurs … tout a été passé en revue. Mais nos consultants ont également pu contribuer en partageant leurs meilleurs liens pour faire grossir et grandir nos ressources de manière collaborative.

DATASCIENCE – Prédire le MVP de la saison 2021 de NBA

Pour allier apprentissage, fun et compétition interne, nos experts ont organisé un challenge Kaggle maison sur le thème du Basket. Celui-ci se décompose comme suivant :

  • Objectif : élaborer le meilleur modèle de prédiction du prochain Top 3 MVP en NBA.
  • Données : Ensemble des statistiques sur les saisons passées NBA sont mises à disposition.
  • Fonctionnement : Chaque participant construit son modèle de prédiction du Top 3 MVP en se basant sur ces données. Le challenge va durer plusieurs mois, ce qui laisse du temps à chacun pour participer et/ou pour optimiser son modèle !
  • Challenge : Ce n’est pas “un” mais “deux” challenges qui sont proposés :
    • Un premier concours où nous allons comparer la performance des modèles de prédictions sur un échantillon de saisons du passé.
    • Un second concours où nous allons comparer les prédictions sur les statistiques de la saison 2020-21 avec le vrai classement MVP qui sera annoncée après la fin de la saison.

Et comme nous sommes chez AVISIA, les consultants qui participent à ce Challenge seront célébrés avec de beaux cadeaux à la clés pour les vainqueurs.

INDUSTRIE – L’apport dans la data dans un secteur pas assez mis en avant à notre goût

L’exploration des méga données est encore aujourd’hui largement associée aux métiers du marketing pour mieux connaître et comprendre le comportement et les attentes des consommateurs. Néanmoins, la ruée vers le nouvel or noir des données disponibles à profusion est désormais lancée par les grands groupes industriels. En effet, dans l’industrie, la bonne compréhension et l’utilisation des données sont de formidables leviers de performance et d’innovation.

Que ce soit pour l’anticipation des pannes, la réduction des temps d’arrêt, l’amélioration de la qualité, la réduction des temps d’exécution, la modélisation de la connaissance empirique, … le besoin de données est de plus en plus présent et commun à de nombreux services de l’entreprise industrielle.

Nos experts ont ainsi réalisé un focus détaillé sur 3 sujets :

  • La Maintenance Prédictive avec une ouverture sur l’apport de l’IoT et de l’IA dans ce thème,
  • La Gestion des Stocks avec un focus sur les gains espérés,
  • L’amélioration de la Qualité via la démarche RCA (Root Cause Analysis).

Beaucoup d’informations qui vont certainement générées de nouvelles vocations pour nos consultants !

DIGITAL – A quoi servent les tags média ? Focus Facebook Pixel

Le tracking média onsite est sujet à tension ces derniers années. Il combine plusieurs qualités qui provoquent l’effroi chez n’importe quel digital marketer : il est technique, particulièrement opaque et sujet à de forts enjeux business. Son objectif principal est lié à l’attribution des conversions : quelles campagnes digitales sont à l’origine de mes leads (ou équivalents) ? Lesquelles y ont contribué ? Mon agence média me ment-elle ? Ces interrogations menant à la question ultime : ai-je correctement dépensé mon budget média ?

Son fonctionnement, reposant jadis exclusivement sur les cookies tiers, s’appuie de plus en plus sur les cookies 1st party et semble remis en cause par les initiatives privacy des navigateurs.

Nos experts nous ont fait découvrir le monde mystérieux des tags média au travers de l’un de ses plus célèbres représentants, le pixel Facebook.

DATAENGINEERING – Airflow, pourquoi et comment ?

Si vous avez déjà vécu d’une mise en production difficile de votre modèle de ML, de vos tables sql, de votre ciblage… vous avez surement déjà regardé du côté de Airflow.

Airflow est un orchestrateur open-source. Cette solution a pour but l’ordonnancement, la planification des tâches à mettre en production (workflows). Pour créer les workflows, Airflow met à disposition le concept “DAG” qui permet à partir d’un programme Python très basique, ce qui vous demande très peu de connaissance dans ce langage, de configurer vos workflows. De plus, Airflow propose une interface web pour faciliter le monitoring de vos pipelines. Les principales caractéristiques sont :

  • Facile à utiliser : si vous avez un peu de connaissances en python, vous êtes prêt à faire vos premiers pas sous Airflow !
  • Open Source : Il est gratuit et open-source avec de nombreux utilisateurs actifs.
  • Intégrations robustes : des opérateurs sont prêts à l’emploi afin que vous puissiez travailler avec Google Cloud Platform, Amazon AWS, Microsoft Azure, etc.
  • Interface utilisateur : vous pouvez surveiller et gérer vos flux de travail. Il vous permettra de vérifier l’état des tâches terminées et en cours.

Via un tuto ultra complet, nos experts nous ont donné les clés pour ne plus jamais vivre de cauchemars dans nos mises en production.

Et vous, quels sont vos “hot topics” du moment ?

Recent Posts
Nous contacter

AVISIA