Une des erreurs les plus répandues dans notre
métier est que les datamarts sont souvent définis par service. Nous avons vu
d'innombrables schémas d’entrepôts de données étiquetés "Datamart marketing", "Datamart vente", et "Datamart
finance". Après avoir examiné les exigences opérationnelles de ces services,
vous découvrirez inévitablement que ces trois services souhaitent les mêmes informations
de base, telles que les données des commandes. Plutôt que de construire un datamart "Marketing" qui comprend les commandes, puis un datamart "Vente" avec ces mêmes commandes, etc, vous devez construire un seul datamart "Commandes", détaillé, avec un accès pour les différents services.
En se concentrant sur les processus métiers plutôt
que sur les services, cela vous permet de fournir des informations plus cohérentes dans toute l'organisation. Si vous faites un datamart par service,
vous dupliquez les données. Peu importe que la source soit un système applicatif
ou un entrepôt de données centralisé, plusieurs flux de données pour différents
datamarts abouti toujours à des incohérences de données. La meilleure façon
d'assurer la cohérence est donc de publier les données une seule fois. De plus, cela
réduit également l'effort de développement ETL, la charge de traitement des
données, et l’espace de stockage sur le disque.
Nous comprenons qu'il peut être difficile de
construire un datamart centré sur les processus lorsque le financement est
assuré par un service. Vous pouvez alors promouvoir le concept de processus en mettant
en avant les dépenses inutiles liées à la mise en œuvre et à la maintenance des
mêmes (ou presque) tables de faits dans plusieurs datamarts. Même si les
organisations sont cloisonnées, la direction répond généralement favorablement à ces possibilités d’économies.
Maintenant, comment allez-vous identifier les principaux
processus métiers de votre organisation? La première étape consiste à écouter les utilisateurs. Les mesures de performance qu'ils souhaitent analyser sont
collectées ou générées par un processus métier. Quand vous faites le recueil des exigences, vous devez également enquêter sur les principaux systèmes applicatifs sources.
En fait, il est plus simple de commencer par définir les datamarts à partir des systèmes sources. Après avoir identifié les datamarts basés sur des processus et des systèmes sources uniques, vous pouvez vous concentrer sur les datamarts qui intègrent des données de différents processus, comme une chaîne d'approvisionnement, avec des entrées pour la rentabilité client ou la satisfaction client. Nous recommandons de vous attaquer à ces datamarts multi-processus dans une seconde phase.
En fait, il est plus simple de commencer par définir les datamarts à partir des systèmes sources. Après avoir identifié les datamarts basés sur des processus et des systèmes sources uniques, vous pouvez vous concentrer sur les datamarts qui intègrent des données de différents processus, comme une chaîne d'approvisionnement, avec des entrées pour la rentabilité client ou la satisfaction client. Nous recommandons de vous attaquer à ces datamarts multi-processus dans une seconde phase.
Bien sûr, il est inutile
de vous dire que vous devez utiliser des dimensions conformes au sein de ces
différents datamarts. De même, nous vous conseillons vivement de rédiger une matrice décisionnelle à l'avance pour établir et communiquer votre
stratégie globale concernant les différents datamarts. Enfin, veillez à ne pas intituler les lignes
de votre matrice "Marketing", "vente" et
"Finances".
Source originale: www.kimballgroup.com
Article original "Kimball Design Tip #3: Focus on business process, not business departments", publié le 30 janvier 2000.
Aucun commentaire:
Enregistrer un commentaire