Brains Up AnalyticsBRAINSUPAnalytics
DatabricksLakehouseArchitecture

Architecture médaillon : le pattern qui organise votre Lakehouse

Comment les couches Bronze, Argent et Or transforment un data lake chaotique en une plateforme fiable et auditable.

L'architecture médaillon est probablement le pattern le plus utile que j'ai adopté sur des projets Lakehouse. Elle résout un vieux problème : comment garder un data lake organisé, fiable et auditable quand des dizaines de sources y déversent chaque jour des données de qualité variable ?

L'idée est simple — organiser les données en trois couches de qualité progressives : Bronze, Argent et Or.

Bronze — la vérité brute

La couche Bronze stocke les données exactement comme elles sont arrivées de la source, sans transformation. C'est votre enregistrement historique immuable. Si un pipeline en aval a un bug, vous pouvez toujours retraiter depuis le Bronze sans revenir à la source d'origine — qui n'existe peut-être plus.

Bonnes pratiques pour le Bronze :

  • Ingestion en append-only, préservant l'historique complet.
  • Ajoutez des métadonnées d'ingestion (timestamp, fichier source, hash).
  • N'imposez pas de schéma rigide — capturez d'abord, validez ensuite.

Argent — propre et conformé

Dans la couche Argent, les données sont nettoyées, dédupliquées, typées et conformées à un modèle cohérent. C'est ici que vous appliquez les règles de qualité, résolvez les clés et joignez les sources liées.

La couche Argent est l'endroit où la plupart des analytics engineers et data scientists devraient travailler. Elle est suffisamment fiable pour l'exploration, tout en restant granulaire.

Or — prêt pour le métier

La couche Or contient les agrégations et modèles dimensionnels prêts à la consommation : tables de faits, dimensions et métriques métier qui alimentent les tableaux de bord exécutifs. Elle est optimisée pour la lecture et la performance.

La règle d'or : chaque couche ne lit que la couche précédente. Le Bronze ne lit jamais l'Argent. Cela garde la traçabilité claire et le retraitement prévisible.

Pourquoi c'est important

Sur un projet multi-pays pour une grande entreprise industrielle, cette séparation est ce qui nous a permis d'étendre la plateforme de l'Allemagne et l'Espagne au Brésil, au Portugal, à l'Inde et à la Chine sans réécrire la logique métier. Les spécificités de chaque pays vivaient dans le Bronze et l'Argent ; la couche Or livrait des KPI cohérents à la direction mondiale.

L'architecture médaillon n'est pas une solution miracle, mais elle vous offre une chose rare en ingénierie de données : la prévisibilité. Et la prévisibilité, c'est ce qui permet de dormir tranquille quand le pipeline tourne à 3h du matin.

Articles liés

Vous avez aimé ? Découvrez les e-books pour du contenu approfondi.

E-books