Snowflake est l’entrepôt de données le plus populaire du marché à l’heure actuelle. Sa croissance dans les 5 dernières années a été impressionnante (de $600K a $2.8B en 4 ans). Bien que les raisons de l’adoption de cet outil sont multiples, les principales forces de Snowflake résident dans 3 facteurs:
Si votre entreprise possède déjà une instance Snowflake, il est souvent judicieux d’y regrouper aussi les données de vos clients pour créer une vue 360. Voyons comment Snowflake vous facilite la vie pour centraliser vos données
Pour ingérer vos données dans Snowflake de manière automatisée, on procédera généralement de 2 manières: utiliser des connecteurs natifs, créés et maintenus par Snowflake, ou des connecteurs externes tiers, maintenus par des sociétés ou des communautés (parfois payants). Il est également possible de développer ses propres connecteurs, mais on se réfèrera à cette solution en dernier recours, car la maintenance d’APIs n’est généralement pas rentable sur le long terme.
Faisons un tour d’horizon des connecteurs que Snowflake possède nativement et gratuitement:
Snowflake possède des milliers de connecteurs ou de datasets publics pour enrichir votre entrepôt de données
De plus, grâce à des outils tiers (payants) comme Fivetran, il sera très facile de centraliser le reste de vos données dans Snowflake:
Il n’y a donc plus vraiment de problématiques techniques insurmontables pour centraliser vos données !
Snowflake a récemment publié une nouvelle corde “game-changer” à son arc: Le connecteur GA4 pour la donnée brute. Ce connecteur se charge de rapatrier quotidiennement la donnée brute de Google Analytics 4 depuis BigQuery et se met en place en quelques clics.
Cela veut dire que BigQuery est toujours nécessaire pour accueillir l’export brut de GA4 quotidien, cependant, il n’est plus nécessaire de mettre en place des exports complexes pour la renvoyer ailleurs.
Le processus est très simple: On ajuste quelques droits dans BigQuery, on installe une application dans Snowflake en quelques secondes, puis on copie-colle quelques valeurs entre les 2 systèmes. VOILA. Seule chose à savoir, ce connecteur n’est pas disponible sur les instances Snowflake hébergées sur GCP (Uniquement Azure et AWS)
On pourra sélectionner plusieurs propriétés très facilement si besoin
Quelle est la prochaine étape ?
Si vous possédez déjà Snowflake et Google Analytics 4, nous vous conseillons de démarrer par là. Le setup est très rapide. Il s’agit ensuite de transformer vos données GA4, et pour cela, chez adviso, nous utilisons l’outil numéro 1 du marché: dbt. Il permet d’adopter des pratiques modernes de transformation de données en SQL.
Si vous n’avez pas d’entrepôt de données, la première étape est d’identifier si vous en avez vraiment besoin et si oui, quelle est la meilleure plateforme technologique à mettre en place. Nous aidons quotidiennement nos clients à choisir la solution la plus adaptée à leurs besoins.