In Tribune expert

Nous entendons de plus en plus parler de Looker, ce nouvel outil acquis par Google en 2019, intégré dans sa suite Google Cloud au côté de modules déjà célèbres tels que Big Query ou Google Cloud Storage.

Google a investi sur Looker, probablement dans l’idée de remplacer au fur et à mesure Data Studio, l’outil de Data Visualisation de GCP, afin d’avoir un outil plus récent sur ce marché.

En effet, le marché de la Data Visualization est aujourd’hui extrêmement concurrentiel. Les plus gros acteurs de la Data tels que Microsoft, Amazon et donc Google ont tous développé leurs propres outils dans ce secteur avec respectivement Power BI, AWS Quicksight et Data Studio puis Looker. Nous pouvons de plus citer de nombreux autres outils à succès tels que Tableau ou bien Qlick par exemple.

C’est donc dans cet environnement extrêmement étroit que Looker doit se démarquer.

Embarquons ensemble pour découvrir un peu cet outil !

Description technique de l’outil

Comme bon nombre d’outils de Data Visualization, Looker est un outil assez simple et intuitif à l’utilisation pour des utilisateurs réguliers de ce type de solution. Cependant, pour des personnes n’étant pas familières avec la Data Visualization, il est vrai qu’il peut comporter certaines spécificités assez complexes sur lesquelles nous reviendrons ultérieurement.

Son interface

Il est nécessaire de différencier trois types d’espaces :

  • Develop : Il s’agit de configurer tous les paramètres que ce soit l’importation des données (depuis Big Query par exemple) ou bien sur le paramétrage de tous les KPI’S et des Explores (voir point ci-dessous). Pour ce faire, Looker met à disposition LookML, le langage de code de Looker, utilisant notamment du SQL.
  • Explore : Les Explores sont la partie où l’on développe les graphiques qui seront par la suite exportés sur le Dashboard. Dans cette section nous retrouvons des « Dimensions » (variables) et des « Measures » (calculs préétablis dans le Develop auparavant comme par exemple des ratios, variations etc …). …). Cette partie s’apparente à du « clic boutons », bien que Looker autorise l’accès à un générateur de code SQL et à des « Table Calculation » permettant à l’utilisateur de créer ses propres « Measures » en plus de celles déjà développées dans la partie Develop.


  • Dashboard : C’est ici la partie de visualisation pure où nous avons le choix de placer les graphiques importés de la partie Explore comme bon nous semble.


Un peu de terminologie

Il est de même nécessaire de faire une passe sur la terminologie des différentes variables mise à votre disposition dans la partie « Explore » lorsque vous construirez vos Dashboards. Vous aurez le choix entre trois principaux types de variables, à savoir les « Dimensions », les « Mesures » et le « Table Calculation ».

  • Dimensions : Dans Looker, une dimension est un champ groupable et peut être utilisée pour filtrer les résultats des requêtes. Elle peut être : un attribut qui a une association directe avec une colonne dans une table sous-jacente, un fait ou une valeur numérique, une valeur dérivée, calculée sur la base des valeurs d’autres champs dans une seule ligne.
  • Mesures : Une mesure est un champ qui utilise une fonction d’agrégation, telle que COUNT, SUM, AVG, MIN ou MAX. Tout champ calculé à partir des valeurs d’autres mesures est également une mesure. Les mesures peuvent être utilisées pour filtrer des valeurs groupées. Par exemple, les mesures pour une vue Ventes peuvent inclure le total des articles vendus (un compteur), le prix de vente total (une somme) et le prix de vente moyen (une moyenne).
  • Table Calculation : C’est une transformation que vous appliquez aux valeurs d’une visualisation (Dimension ou Measure). Elles sont calculées sur la base de ce qui se trouve actuellement dans la visualisation et ne tiennent pas compte des mesures ou des dimensions qui sont filtrées hors de la visualisation (de l’Explore).

Un langage propre : le LookML

Le LookML est le langage créé par Looker. Il représente une des grandes forces de l’outil pouvant le différencier de ces concurrents dans le marché.

Définition de la documentation officielle de Looker :

LookML est un langage permettant de décrire des dimensions, des agrégations, des calculs et des relations entre les données d’une base de données SQL. Looker utilise un modèle écrit en LookML pour composer des requêtes SQL portant sur une base de données particulière.

 

Ce langage s’utilise dans la partie « Develop » présentée précédemment et n’est donc accessible que pour les licences de types développeurs.

LookML permet de développer des besoins totalement personnalisés et personnalisables. Nous ne sommes donc pas bloqués avec les dispositions de bases proposées de l’outil que nous pouvons modeler en fonction de nos envies via LookML.

Il représente de plus de nombreux avantages que nous pouvons lister ci-dessous :

  1. LookML est axé sur la réutilisation. Une fois que vous avez défini une dimension ou une mesure, vous vous basez sur celle-ci plutôt que de la réécrire.
  2. Très facile à apprendre, étant donné que le langage est une version extrêmement rapprochée du SQL. Le LookML peut être assimilé en quelques heures par une personne familière avec le SQL.
  3. LookML intègre nativement le contrôle de version. Pour bien gérer les données, il faut savoir ce qui a été modifié, quand, par qui et pourquoi. Mais les langages graphiques ne permettent souvent pas ce type de contrôle de version moderne. LookML offre un contrôle de version à l’aide de Git.
  4. La Log est très efficace et claire donc très facile à débuguer en cas de problèmes avec la mise en évidence des erreurs, l’aide contextuelle et un validateur qui vous aide à corriger les erreurs.
  5. Outil très collaboratif pour faciliter le travail de groupe

LookML est un outil destiné aux analystes et aux développeurs et non aux utilisateurs finaux. En aidant les analystes à transmettre les connaissances sur la signification de leurs données et à les intégrer dans Looker, LookML met ces connaissances à la disposition de tous. Le “modèle de données” que Looker vous aide à construire permet aux utilisateurs non techniques de faire leur travail – construire des tableaux de bord, accéder aux détails au niveau des lignes et à des mesures complexes – sans avoir à se soucier de ce qui se trouve derrière le rideau.

 

Tous ce que nous avons expliqué précédemment sur le LookML s’inscrit dans la logique des « LookML Project » comme nous pouvons l’observer dans le tableau synthétique ci-dessous.

 

Looker vs Data Studio

Data Studio a intégré Google en 2016 et se retrouve challengé par Looker, ce dernier pouvant même être amené à le remplacer dans certains périmètres à terme.

Nous allons donc ici comparer ces deux outils de manière détaillée afin de voir ce que Looker apporte comme changement en comparaison à Data Studio :

  • Prix : Pour une utilisation personnelle, Google Data Studio a l’avantage d’avoir une version gratuite contrairement à Looker qui semble une solution coûteuse. Les tarifs officiels sont, comme pour beaucoup de solutions, discutés avec les équipes commerciales lors de démonstration à demander sur le site officiel : cependant les prix que l’on peut trouver dans des articles estiment le coût entre 3000 et 5000 $ par mois pour 10 utilisateurs.
  • Intégration de sources de données :
    1. Data Studio étant un produit Google, certaines intégrations des sources provenant de GCP (GA, BigQuery, Goggle Ads etc) sont donc natives. Un des avantages avec Data Studio est que nous pouvons créer nos propres connecteurs de données si les connecteurs préexistants ne nous conviennent pas. De plus, contrairement à plusieurs outils de BI qui nécessitent des bases SQL, il peut se connecter à des sources SQL et NO-SQL. Il offre aussi la possibilité de faire des connexions avec des bases ayant des sources différentes.
    2. Sur Looker, il est nécessaire que la base soit transformée au préalable en SQL. Actuellement, Looker prend en compte plus de 50 bases de données, notamment les leaders tel que BigQuery, Amazon Reshift et Snowflake. Il est aussi possible de fusionner des sources différentes sur Looker via les Explores.
  • Modélisation des données : La Data Studio reste un outil classique en terme de modélisation de données où l’on peut modifier manuellement les différentes caractéristiques de vos données. Looker a son propre langage le LookML qui permet d’avoir une très forte souplesse pour manipuler l’ensemble des données. De manière générale, Looker va aussi offrir des options avancées comme de la modélisation statistique, la lecture de langages tels que Python, R ou Ruby là où c’est beaucoup plus compliqué avec Data Studio. L’API de Looker intègre les données avec de nombreuses applications telles que Google Docs, Excel et d’autres applications tierces. La fonction Looker Blocks rationalise l’intégration en proposant un code préconstruit qui peut être intégré plus facilement dans des systèmes externes.

Synthèses de la comparaison :

Source : https://www.holistics.io/blog/google-data-studio-vs-looker/

Si vous souhaitez simplement un outil de BI gratuit où tout le monde peut créer des graphiques et tableaux de bord interactifs, Data Studio semble être une bonne solution. Cependant, si votre objectif est d’avoir un outil plus performant pour avoir des modélisations et gestions de données avancées ainsi que des options de visualisations personnalisées, Looker semble être un meilleur choix.

Looker vs Leaders sur le marché

Nous pouvons de même mettre 4 principaux points où Looker peut se distinguer en comparaison des Leaders du marché :

  1. Le LookML
  2. Fonctionnement entièrement WEB : Comparé à Power Bi et Tableau, Looker a une interface 100% web ; Cela signifie qu’il n’y a pas besoin de MAJ de logiciel, d’aller d’interfaces en interfaces etc
  3. Looker peut pointer directement sur les tables des SGBD amonts et donc nativement utiliser leur puissance de calcul. Cela peut-être un avantage concurrentiel par rapport à d’autres outils qui vont travailler sur des tables de staging et seront donc limité par ses ressources pour la manipulation de données.
  4. Pensé pour les développeurs (rollback sur les processus, code review, déploiement d’environnement de dev, staging et prod, versioning etc.) 

Bien évidemment, si vous travaillez sur GCP pour le traitement de vos données (avec Big Query par exemple), Looker faisant partie intégrante de GCP il est d’autant plus facile et intuitif de passer sur l’outil.

Conclusion

Cet article a pour but de vous initier à Looker, en vous présentant quelques clefs de compréhension sur le fonctionnement de l’outil et de quelle manière ce dernier peut se démarquer de la concurrence dans son domaine. Pour aller plus loin dans la compréhension, vous pouvez parcourir la documentation officielle, assez fournie en vidéos et tutoriels. 

Comme tout outil de Data Visualisation, Looker reste un outil assez intuitif comportant cependant des spécificités propres qui peuvent s’avérer peu évidentes dans son fonctionnement pour des non-initiés mais ouvrir un champ large de possibilités, comme nous l’avons exposé dans cet article.

Alors si vous souhaitez en savoir encore plus, si vous souhaitez vous lancer avec cet outil, nous serons ravis de vous accompagner !

 

Gaétan MICHENET & Florent COTTIN

Recent Posts
AVISIA