DinMo

Solutions

Produit

Ressources

L'adoption des Reverse ETLs dans les Modern Data Stack

L'adoption des Reverse ETLs dans les Modern Data Stack

7min • 1 déc. 2023

Alexandra Augusti

Alexandra Augusti

Strategy & Operations Manager

L'adoption des Reverse ETL

Développés à partir de 2018, les Reverse ETL font partie d'une nouvelle famille de software. Devenus réellement populaires à partir de 2021, les Reverse ETL transforment les habitudes et redéfinissent comment les entreprises peuvent tirer parti de leurs données.

Dans cet article, vous apprendrez ce que sont les Reverse ETL et comment ils peuvent vous faire gagner du temps et de l'argent en répondant à ces questions :

  • Qu'est-ce qu'un ETL ?

  • Qu'est-ce qu'un Reverse ETL

  • Comment les Reverse ETL fonctionnent-ils ?

  • Quelles sont les alternatives aux Reverse ETL ?

  • Quels sont les bénéfices d'un Reverse ETL ?

ETL vs. Reverse ETL

Pour comprendre ce qu'est un Reverse ETL, il faut déjà saisir ce qu'est un ETL (Extract, Transform, Load). Le processus d'Extraction, Transformation et Chargement est exactement ce que les ETL font. Ils extraient de la donnée depuis les différentes sources des entreprises, la transforment pour en construire des modèles et la chargent dans un data warehouse.

De nombreux outils d'ETL existent, en passant de Fivetran, AWS Glue à Hevo.

Les ETL permettent d'extraire de la donnée de plusieurs sources, de la transformer puis de la charge dans un data warehouse.

Illustration du processus ETL

💡 Le processus ELT existe ici. La différence entre les ETL et les ELT est bien plus profonde que le switch de 2 lettres. Cela détermine comment, quand et où la transformation de la donnée est faite.

Dans le cas du processus ETL, la donnée brute est transformée avant d'être transmise au data warehouse. Au contraire, le processus ELT implique de charger de la donnée brut dans le data warehouse puis de la transformer.

Depuis les années 2010, d'énormes investissements ont été réalisés dans l'infrastructure de données cloud. Des études récentes prévoient même un taux de croissance annuel de 22 % pour le stockage des données cloud.

Pourquoi ? Plusieurs raisons peuvent être avancées :

  • Évolutivité : Les data warehouse cloud s'adaptent aux besoins des entreprises et évolue avec l'utilisation qui en est faite

  • Rentabilité : Le modèle de paiement à l'utilisation réduit les dépenses.

  • Flexibilité et agilité : Les data warehouse cloud permettent un déploiement rapide et une intégration facile avec les outils existants.

  • Sécurité : Toutes les solutions prennent de mesures robustes, ont certifications de conformité et cryptent les données.

Avec des réglementations de plus en plus strictes sur les données de première partie, les data warehouse cloud peuvent être le moyen idéal de reprendre le contrôle de ses données pour répondre aux exigences des clients. Pourtant, la plupart de ces données centralisées dans des data warehouse sont aujourd'hui sous-utilisées : en 2021, seules 9 % des entreprises optimisaient leurs opérations marketing sur tous leurs canaux d'acquisition et tout au long du parcours client pour atteindre leurs résultats commerciaux (source).

En effet, une fois que les données résident dans le data warehouse, les récupérer et les utiliser dans les outils des équipes métiers devient un défi. C'est là que les Reverse ETL entrent en jeu...

Que sont les Reverse ETL ?

Le Reverse ETL est le processus de transfert de données d'un data warehouse vers des applications métier, utilisées par les équipes Marketing, Sales, Support, Opérations, etc.. Ce processus tire parti de la stack existante d'une entreprise et permet de mettre en place des expériences client personnalisées et automatisées.

La plupart du temps, quand les équipes métiers ont besoin de données dans leurs outils, ils ont besoin de créer des tickets auprès des équipes IT et doivent ensuite attendre longtemps avant de l'avoir à disposition. Les Reverse ETL font le lien entre les équipes data et les équipes opérationnelles.

Les Reverse ETL font le pont entre les données centralisées dans un data warehouse et les destinations métiers (marketing, sales, support, opérations, etc.)

Illustration du processus Reverse ETL

Les Reverse ETL font en effet le processus inverse des ETL, permettant de transférer des données centralisées dans le data warehouse vers toutes les applications de l'entreprise - telles que celles du marketing, les ventes, le service client, pour n'en citer que quelques-unes.

Les Reverse ETL ne sont pas seulement des pipelines. Au-delà du transfert de données, ils permettent aux organisations de modéliser et de transformer les données avant de les envoyer aux applications métier. Des fonctions telles que le nettoyage des données, la segmentation et la création d'audiences améliorent l'utilisabilité et la pertinence des données dans les différents systèmes opérationnels.

👉🏼 En résumé, les Reverse ETL permettent la synchronisation de la donnée entre différents systèmes et applications pour assurer précision et cohérence.

Comment fonctionnent les Reverse ETL ?

Les Reverse ETL fonctionnent en exécutant des requêtes dans votre data warehouse et en transférant les résultats aux outils que vous avez sélectionnés (que ce soit une destination marketing, un CRM ou une plateforme d'automatisation).

Il y a 5 composants principaux à un Reverse ETL :

  • Source : Fait référence au data warehouse (ou data lake) où toutes les données dont vous souhaitez tirer de la valeur sont stockées. Snowflake ou Google BigQuery figurent parmi les data warehouses les plus courants.

  • Modèles : Le modèle de données sert de représentation de vos données, définissant les données auxquelles vous souhaitez que vos équipes métier aient accès. Il est généralement créé et maintenu par un utilisateur expert en données familier avec le data warehouse. Une fois configuré, tout le monde peut l'utiliser facilement sans avoir à coder.

  • Segments : Un segment est un sous-ensemble du modèle de données. Par exemple, il est possible de créer un segment tel que "utilisateurs résidant en Europe" ou un segment de "utilisateurs ayant dépensé plus de 100€", à partir de l'entité Clients (définie dans le modèle).

  • Syncs : Cela fait référence au processus de synchronisation des données d'un segment avec un outil en aval selon un calendrier défini. Vous pouvez configurer plusieurs synchronisations à partir du même modèle de données vers différentes destinations, garantissant que toutes les équipes de votre entreprise travaillent à partir de la même donnée (grâce à une source unique de vérité).

  • Destinations : Une destination fait référence à tout outil externe ou service vers lequel vous pouvez envoyer des données source. C'est généralement là que les utilisateurs finaux (i.e. les équipes métier) accèdent et utilisent les données. Les destinations les plus courantes sont les plateformes publicitaires, les CRMs ou les plateformes d'automatisation marketing.

Composants principaux d'un Reverse ETL

Quelles sont les alternatives aux Reverse ETL

Le transfert des données peut se faire de différentes manières : téléchargements manuels de fichiers csv / excel, pipelines personnalisés ou autres outils tels que iPaaS ou CDP.

Reverse ETL vs. iPaaS

Les Integration Platform as a Service (iPaaS - littéralement Plateforme d'intégration en tant que service) sont des plateformes qui connectent des applications de manière à ce qu'un déclencheur spécifique dans un outil entraîne une réponse spécifique dans un autre. Par exemple, une soumission de formulaire sur Typeform peut automatiquement créer un nouveau contact dans Hubspot.

Les iPaaS peuvent connecter des applications via des API, ce qui facilite grandement la tâche pour des intégrations simples, c'est-à-dire de point à point et sans dépendances.

Les iPaaS populaires sont des outils tels que Workato, Zapier ou Boomi.

Une iPaaS connecte simplement des systèmes un-à-un et présente plusieurs limitations :

  • Elle génère un réseau complexe de pipelines et de workflow qui ne sont pas évolutifs.

  • À mesure que les workflows deviennent complexes, les utilisateurs ont besoin de connaissances en matière d'API, annulant l'avantage du "no code", car les équipes métier auront besoin d'aide de la part des équipes de données.

  • Elle n'est pas conçue pour les mises à jour en masse de gros volumes (ou est extrêmement coûteuse si vous vous y risquez).

  • Elle ne repose pas sur source unique de vérité et un profil unique pour un client (Customer 360) et peut donc entraîner des expériences client incohérentes.

  • Elle fonctionne comme une "boîte noire" et pose des problèmes de gouvernance et de qualité de la donnée.

iPaaS vs. Reverse ETL

Reverse ETL vs. CDP

Une Customer Data Platform (CDP) est une plateforme prête à l'emploi qui stocke et organise les données clients provenant de sources multiples afin de créer une source unique de vérité. En tant que telle, la CDP est une alternative au data warehouse. Cependant, la CDP offre des fonctionnalités avancées en plus des objectifs de BI :

  • Préparation des données pour les cas d'usage métiers : segmentation, création d'agrégats, de scores, etc.

  • Redistribution vers les applications des équipes métiers

En résumé, la CDP joue le même rôle que la combinaison d'un DWH et d'un ETL inversé.

Pourtant, depuis une dizaine d'années que les CDP existent, l'écosystème a considérablement évolué et les CDP ne sont plus si attrayant. Seulement 1 % des entreprises pensent que les CDP répondent réellement à leurs besoins actuels et futurs d'après cet article.

La CDP a en effet plusieurs défauts :

  • Rigidité : La CDP impose des modèles de données rigide et limite la création de modèles personnalisés.

  • Prix : La CDP est une solution coûteuse, inaccessible à la plupart des petites et moyennes entreprises.

  • Confidentialité et sécurité : Comme elle stocke les données, la CDP est une solution moins sûre et soulève une question de contrôle des données.

Le processus de Reverse ETL fait partie de la CDP composable, qui s'appuie sur un data warehouse cloud et active ces données vers de nombreuses destinations différentes.

CDP vs. Reverse ETL

Quels sont les bénéfices des Reverse ETL ?

Les Reverse ETL aident les entreprises à garantir que leurs données sont cohérentes et toujours à jour sur l'ensemble de leurs systèmes. Les données sont en effet partagées entre les applications opérationnelles et l'ensemble des équipes au sein de votre entreprise, garantissant que vos données ne restent pas silotées.

Avec ce type d'outil, vous pouvez obtenir :

  • Une vue à 360° de votre parcours client : L'équipe data se charge de rendre les données pertinentes accessibles et prêtes à être utilisées dans le data warehouse. Par la suite, les équipes métier peuvent mener de manière autonome leurs analyses pour obtenir des informations pertinentes en temps réel. Ceci permet d'améliorer l'expérience client tout au long du parcours.

  • Une prise de décision rapide et basée sur les données : Des informations toujours à jour peuvent être chargées rapidement dans les systèmes opérationnels. Ceci garantit que les équipes disposent de données pertinentes et précises, permettant une réactivité rapide face aux changements du marché, demandes des clients et opportunités émergentes.

  • Des contenus et campagnes marketing plus personnalisés :

    • Le Reverse ETL est particulièrement utile pour la publicité. Les équipes marketing ont souvent besoin de segmenter les données pour diverses raisons, comme la création d'audiences similaires (lookalike), l'exclusion de certains groupes de clients des campagnes, ou le ciblage de "top" clients. Avec le Reverse ETL, toutes les audiences peuvent être gérées de manière centralisée et synchronisées avec les plateformes marketing.

    • Le Reverse ETL permet également de transmettre des données first party, comme des attributs, des caractéristiques ou des métriques prédictives personnalisées, pour enrichir votre connaissance client dans votre CRM/outil de marketing du cycle de vie (par exemple Braze). Cela permet une personnalisation tout au long du parcours client.

  • Amélioration des opérations client :

    • Les outils des équipes commerciales peuvent être enrichis avec des informations supplémentaires (utilisation du produit, préférences de canal, etc.).

    • Les équipes de support peuvent également bénéficier du Reverse ETL, car il permet de synchroniser en temps réel les informations client dans leur système. Ceci permet de prioriser les actions de support en fonction de l'utilisation du produit et de la valeur du contrat du client.

Comment choisir son Reverse ETL ?

Avant d'acheter un outil Reverse ETL ou d'essayer de le construire vous-même, il est important de connaître les principales fonctionnalités à rechercher :

  • Compatibilité avec vos destinations préférées : La pertinence d'un outil Reverse ETL dépend largement de sa compatibilité avec vos destinations d’intérêt. Lors du choix d'un outil, pensez à vos besoins actuels et futurs. Certaines destinations ne sont pas encore disponibles sur la plupart des éditeurs. Par exemple, Batch est uniquement disponible avec DinMo.

  • Service de sync robuste : La synchronisation des données est un aspect crucial des outils Reverse ETL. Elle doit être rapide et fiable. Choisissez un fournisseur qui utilise une approche “différentielle” pour la synchronisation des données, qui n'envoie que les données nouvelles ou mises à jour. Cela peut économiser du temps et de l'argent.

  • Observabilité : Un outil Reverse ETL doit fournir des capacités d'observabilité pour une détection rapide des erreurs et doit aider à les résoudre. Des fonctionnalités d'alerte et des messages d'erreur clairs peuvent faire gagner du temps aux équipes techniques.

  • Sécurité : La protection des données est essentielle. Votre fournisseur doit répondre à toutes vos exigences pour garantir la sécurité de vos données sensibles. Cela comprend par exemple la conformité avec des réglementations telles que RGPD/CCPA, des pratiques sécurisées de stockage des données, et des méthodes robustes de cryptage des données.

  • Facilité d'utilisation : Les outils Reverse ETL sont conçus pour simplifier la gestion des données. Ils doivent donc être faciles à utiliser. Cherchez des fonctionnalités telles qu'un Segment Builder sans code, des interfaces utilisateurs intuitives, et des processus de mappage de données simples qui ne nécessitent pas de connaissances techniques avancées (par exemple sur les APIs sous-jacentes).

  • Facilité de mise en œuvre : Un bon outil Reverse ETL doit être facile à configurer. Le modèle de données doit être suffisamment flexible pour répondre à vos besoins spécifiques, et toute personne ayant accès au data warehouse doit être capable de configurer l'outil facilement.

  • Support : Des experts en activation de données et des ressources (comme une documentation de qualité et des tutoriels) doivent être disponibles pour aider votre équipe à surmonter des obstacles éventuels.

  • Tarification transparente et évolutive : Le prix est un facteur important à prendre en compte lors du choix d'un outil. Assurez-vous de comprendre la structure tarifaire de l'éditeur. Pensez également à comment le coût pourrait évoluer avec votre utilisation. Même si les prix initiaux semblent raisonnables, ils peuvent rapidement augmenter avec l'augmentation de vos besoins. Il est donc important de choisir une solution qui peut évoluer avec vous.

Conclusion

Alors que les entreprises s'efforcent de réussir leur transformation digitale, les Reverse ETL apparaissent comme un outil clé pour libérer le véritable potentiel des données centralisées dans un data warehouse. En envoyant les données aux applications de l'entreprise, les Reverse ETL sont des outils de choix dans le Modern Data Stack. En comprenant ses fonctions et ses avantages, les organisations peuvent s'engager sur la voie royale d'une stratégie data-driven.

👉🏼 Si vous avez envie d'améliorer votre Data Stack en adoptant des outils de première classe et souhaitez investir dans une solution de Reverse ETL actionnable en quelques minutes, réservez une démo avec nous.

💡 Si vous voulez en savoir plus sur les Reverse ETL ou avez besoin d'aide sur des sujets d'activation de la donnée, n'hésitez pas à me contacter : alexandra@dinmo.com.

À propos des auteurs

Alexandra Augusti

Alexandra Augusti

Strategy & Operations Manager

Diplômée de CentraleSupélec et de l'ESSEC, Alexandra est une spécialiste du monde de la data. Elle a travaillé comme Consultante en Data Marketing chez M13h, où elle a aidé plusieurs entreprises à exploiter leurs données internes en créant des plateformes dédiées. Chez DinMo, Alexandra optimise nos opérations et travaille en étroite collaboration avec notre CEO pour fournir des conseils stratégiques qui aideront chaque équipe à performer.

Table des matières

  • L'adoption des Reverse ETL
  • Que sont les Reverse ETL ?
  • Comment fonctionnent les Reverse ETL ?
  • Quelles sont les alternatives aux Reverse ETL
  • Quels sont les bénéfices des Reverse ETL ?
  • Comment choisir son Reverse ETL ?
  • Conclusion

Partager cet article

Mettez votre donnée en mouvement pour créer de la valeur

Vous aimerez aussi

Activez vos données et créez de la valeur