Data Digital Intelligence Artificielle Retour d'expérience

Par Caroline BAL

le 4 août 2020

Améliorer l’écoute de son client grâce au NLP

Le monde de l’entreprise connaît une multiplication des points de contact avec les clients. Chacun peut rédiger un avis, un post sur un réseau social, un ticket ou un email. Cette source d’information est extrêmement riche puisqu’elle contient les ressentis et les questionnements des clients. Cependant, ces données sont rarement suffisamment exploitées alors qu’elles pourraient permettre de mieux comprendre les points d’insatisfaction ou de questionnement des clients.

Le traitement automatique du langage dit naturel, appelé aussi Natural Language Processing (NLP) en anglais, est une technologie permettant à des machines d’analyser le langage humain grâce à l’intelligence artificielle (IA). L’ordinateur peut alors comprendre et synthétiser les retours clients.

Il existe de nombreuses techniques autour du NLP, telles que :

L’analyse de sentiment,
La traduction automatique
La détection de thèmes (nouveaux trends twitter, nouveaux sujets abordés dans les médias, trouver les différents aspects d’un produit abordés par des commentaires afin de pouvoir plus facilement l’améliorer à partir de feedbacks utilisateurs, …),
La classification de messages (exemple : spams),
La reconnaissance vocale,
Les assistants personnels tels que Apple Siri, Microsoft Cortana, Amazon Alexa,
Les chatbots,
La génération automatique de texte,
…

Nous ne nous focaliserons ici que sur les techniques de traitement de textes qui nous permettent de remplir notre objectif d’écoute des clients : l’analyse de sentiment, la détection automatique de thèmes, appelée topic modeling, ou encore la classification de messages dans des thèmes.

L’analyse de sentiment

L’analyse de sentiment permet de connaître la satisfaction des clients et ainsi guider les stratégies commerciales. Mettre en place un monitoring de la satisfaction permet alors de la suivre dans le temps et d’en suivre les tendances :

Connaître l’évolution de l’avis des internautes sur la marque/les produits/les concurrents (moins coûteux que des enquêtes d’opinions !),
Identifier les influenceurs sur l’activité de la marque,
Identifier les sources de frustration.

Cette méthode peut aussi être utilisée pour segmenter la base des utilisateurs en plusieurs catégories et ainsi avoir une communication adaptée à chaque groupe ou prioriser les réponses à donner en urgence. Un message ayant un sentiment négatif peut provenir d’un client particulièrement insatisfait auquel il sera préférable de répondre rapidement.

Enfin, il peut aussi servir d’indicateur dans les prédictions, par exemple, avec le lancement d’un nouveau produit ou d’une nouvelle campagne marketing.

Du côté pratique, quel que soit le cas d’usage, les algorithmes de Data Science ne savent pas manipuler du texte brut. C’est pourquoi une étape de préparation des données est nécessaire. Le premier objectif de cette préparation est de réduire le nombre de mots pour ne conserver que ceux donnant son sens au message. Il est possible d’effectuer les étapes suivantes :

Ces étapes sont courantes mais pas systématiques ! Tout dépend de votre objectif. Par exemple, pour détecter des spams, l’utilisation des majuscules donnera un signal important. Ensuite, habituellement, chaque texte est transformé en des vecteurs de mots qui mènent à créer une matrice document-terme qui sera l’entrée de l’analyse. Cela facilite l’usage de certains algorithmes qui ne prennent en entrée que des nombres.

Côté méthodologie, plusieurs approches s’offrent à vous :

Approche par dictionnaire : il faut disposer d’un référentiel où chaque mot est associé à un score de sentiment. Le score d’un message est obtenu à partir des scores des mots qui le composent. L’avantage de cette méthode est qu’elle est simple à comprendre, à expliquer et à implémenter. Par contre, elle ne tient pas compte du contexte dans lequel le mot est employé et ne gère pas du tout les sarcasmes, l’ironie, etc.

Approche supervisée : entraîner un modèle de Machine Learning à différencier les messages positifs de ceux négatifs à partir de données labélisées. Exemples de modèles : SVM, régression logistique, XGBoost. L’utilisation de classification naïve bayésienne est aussi une approche supervisée possible. Elle calcule pour un message la probabilité de chaque classe de sentiment (positive, négative ou neutre) sachant les mots qui le composent. Ces méthodes sont souvent plus performantes que l’approche par dictionnaire mais sont un peu moins facilement explicables à des interlocuteurs métier. Elles nécessitent en outre un corpus de messages dont on connait déjà le sentiment.

Word Embedding : utiliser un réseau de neurones résumant un texte en un vecteur de nombres avant d’en prédire le sentiment. Ces vecteurs peuvent être pré-calculés et utilisés en entrée des modèles supervisés présentés juste avant, ou alors être découverts en entraînant un réseau de neurones adapté à la problématique. Cette méthode est très performante car c’est la méthode prenant le mieux en compte le contexte dans lequel le mot est utilisé. Cependant, comme tout réseau de neurones, il est difficile à expliquer et à interpréter.

API : il est également possible d’utiliser des API, déjà très performantes, telles que l’API Natural Language de Google ou l’API Cognitive Services d’Azure.

Toutes ces méthodes conduisent au même résultat qui donne pour chaque message un score de satisfaction permettant de quantifier la satisfaction ou l’insatisfaction du client.

=> Negatif à 95% ! Message pour lequel il faut répondre rapidement !

Le topic modeling

La deuxième fonctionnalité principale du NLP est l’extraction de thèmes plus communément appelée topic modeling. Le topic modeling peut s’appliquer à toute forme de texte : mails, tickets, feedbacks, etc. pour avoir une vision globale des préoccupations des clients.

Les principaux modèles de topic modeling sont non-supervisés. C’est-à-dire qu’ils n’apprennent pas à lier des messages à un thème donné, ils découvrent eux-mêmes les thèmes.

Mais avant d’être analysés, les messages doivent passer par la même préparation que pour l’analyse de sentiment. Ensuite, il existe, là encore, plusieurs méthodologies possibles :

Latent Dirichlet Allocation (LDA) : modèle probabiliste et algorithmique parcourant les messages pour former des groupes de mots qui co-occurrent souvent et ainsi découvrir des thèmes.
Latent Semantic Analysis (LSA) : modèle d’algèbre linéaire décomposant le lien « terme-document » en un lien « terme-thème » + « thème-document ». Il est basé sur la même intuition que la matrix factorization pour la recommandation de produits.
Non-negative Matrix Factorization (NMF) : modèle d’algèbre linéaire réalisant le même travail que la LSA pour découvrir des variables latentes, les thèmes. Les deux modèles se différencient par leur méthode de décomposition mais la LSA est plus fréquemment utilisée notamment par son caractère unique et son interprétation un peu plus aisée (grâce à l’importance des thèmes).

Ces 3 approches demandent de donner en paramètre le nombre de thèmes. Il existe des critères statistiques pour donner une indication sur le nombre de thèmes optimal mais il reste nécessaire, pour choisir sa méthodologie ou son nombre de thèmes, de s’assurer de la pertinence de l’interprétation des topics.

Les modèles vous fournissent le numéro du thème auquel le message est associé, voire même l’importance relative de chaque thème pour le message. Quoiqu’il en soit, le thème ne sera qu’un listing de mots auquel vous devrez associer vous-mêmes un nom.

La classification dans des thèmes connus

Il est également possible d’associer des messages à des thèmes connus si vous disposez d’anciens messages associés à ces thèmes. Des modèles de Machine Learning permettent d’apprendre le lien entre leurs contenus et les thèmes.

Cette méthode est par exemple utilisée pour classer les mails dans les spams dans les systèmes de messagerie ou plus largement, elle peut être utilisée pour classer des mails et les rediriger vers le service en charge de sa réponse.

Pour effectuer cette tâche, plusieurs modèles existent et notamment l’algorithme des k plus proches voisins (kNN), les SVM, la régression logistique ou les réseaux de neurones.

Pour aller plus loin

Les méthodes vues dans cet article peuvent être combinées entre elles ou avec d’autres pour extraire d’autres informations.

Par exemple, le topic modeling, utilisé en parallèle d’une analyse de sentiment, permet de mettre en lumière les sujets de mécontentement des utilisateurs. Il permet de savoir si les clients sont satisfaits ou non d’un service en particulier. Il indique ainsi les services à améliorer en priorité.

Le NLP peut aussi être élargi aux données de centres d’appels ou d’assistants personnels. Des méthodes de text-to-speech permettent de transcrire les données vocales en texte sur lequel toutes les méthodes vues précédemment peuvent s’appliquer.

Conclusion

Les données textuelles, ou plus généralement de langage, sont omniprésentes et souvent sous-exploitées bien qu’elles contiennent des informations clés. Utiliser des méthodes de NLP comme l’analyse de sentiment, le topic modeling et la classification permet d’être plus à l’écoute de vos clients et ainsi améliorer la prise de décisions stratégiques. La diversification des types de données, l’augmentation du volume de données (sous forme de texte ou de son) vont s’accélérer dans les prochaines années. C’est donc une source d’information capitale pour la relation client et la stratégie de l’entreprise.

AVISIA se tient donc à votre disposition pour vous aider à réaliser ces projets !

Articles en lien

Data Digital RSE & Impact

L’accessibilité numérique dans les métiers de la data

Caroline BAL

18 juillet 2024

Accessibilité numérique : de quoi parlons-nous? L’accessibilité numérique, c’est rendre les produits numériques (sites, applications mais aussi data visualisations) accessibles aux personnes en situation...

Lire l'article

Data Digital Événement

Hackathon Dat’AVISIA : L’accessibilité au coeur de la datavisualisation

Madeleine VALETTE

5 juillet 2024

Chez AVISIA, chaque année nous organisons un hackathon de datavisualisation, ce moment de créativité est conçu pour rassembler les experts mais également les moins aguerris...

Lire l'article

Data Intelligence Artificielle Retour d'expérience

Retour Client : Comment Bouygues Telecom a lancé son Self-Service Analytics

Marion JACOBSON

13 juin 2024

Contexte Lors du dernier salon Data & AI organisé par le Hub Institute, nous sommes venus témoigner auprès de notre client Bouygues Telecom sur la...

Lire l'article

Data Digital Retour d'expérience

Comment utiliser pleinement Google Analytics 4 pour construire une vue à 360° sur votre stratégie digitale ?

Marion JACOBSON

11 juin 2024

Régulièrement, nous vous faisons des retours d’expertises sur des sujets qui sont au coeur des problématiques Business. Aujourd’hui nous faisons le focus sur un sujet...

Lire l'article

Data Événement Retour d'expérience RSE & Impact

Retour salon Data & AI : Comment l’IA peut aider à répondre aux nouvelles obligations CSRD

Marion JACOBSON

7 juin 2024

Contexte Lors du dernier salon Data & AI 2024 organisé par le Hub Institute, AVISIA est intervenu sur un sujet d’actualité : la CSRD. Pour...

Lire l'article

Digital RSE & Impact

Green tracking : Révéler les coûts environnementaux cachés du tracking web

Salah Eddin El Aryani

3 juin 2024

Dans le paysage numérique contemporain, le web tracking s’est érigé en un phénomène incontournable. Employée par les entreprises et les annonceurs afin de collecter des...

Lire l'article

Data Intelligence Artificielle Retour d'expérience

IA Générative et assistants : repensez la relation client et boostez la productivité de votre organisation

Marion JACOBSON

21 mai 2024

La GEN AI : un passage Incontournable pour l’entreprise en 2024 Accélérer la productivité de son entreprise grâce à l’IA est devenu incontournable pour tous...

Lire l'article

Digital

Le Digital Analyst : Rôle essentiel et enjeux

Priscila LEON

19 avril 2024

L’ère du digital a fait naître de nombreuses pratiques, opportunités business et métiers notamment celui de Digital Analyst. Aujourd’hui, la stratégie digitale d’une entreprise repose...

Lire l'article

Intelligence Artificielle RSE & Impact

Comment la data et l’IA sont les alliés des entreprises pour la mise en place de la CSRD

Charlène DUPONT

29 mars 2024

La responsabilité sociétale des entreprises (RSE) est un sujet de plus en plus important pour les citoyens et les organisations, tant du point de vue...

Lire l'article

Digital Product

Tout savoir sur le tracking server-side

Ophélie NELLE

21 mars 2024

Si vous travaillez dans le domaine du digital analytics, les termes « Server-side » et « Client-side » ne vous sont certainement pas étrangers. Ces concepts se...

Lire l'article

Retour au blog