Le secret pour construire un entrepôt de données distribué est d'utiliser des dimensions conformes. Dans un entrepôt distribué plusieurs sources de mesures différentes sont maintenues par différentes directions. Ces mesures sont habituellement présentées dans des tables de faits. Une direction peut suivre le nombre de produits fabriqués, une autre le nombre de produits dans le stock. Une troisième peut vouloir le nombre de produits vendus, et une quatrième le nombre de commentaires et plaintes liés à un produit. Clairement, toutes ces équipes ont un intérêt commun pour "le produit". Ainsi, nous pouvons construire un entrepôt de données distribué si nous parvenons à une définition unique du produit partagée par toutes les directions.
lundi 27 mai 2013
lundi 20 mai 2013
Conseil 18: La métaphore de l'édition
Dans cet article, je veux partager avec vous un point de vue que je prends très au sérieux, et qui est, d'une certaine façon, la base de tout mon travail sur les entrepôts de données. C'est la métaphore de l'édition.
Imaginez le scénario suivant: imaginez que vous avez été invité à prendre la tête d'un magazine de grande qualité. Vous avez été nommé rédacteur en chef et vous disposez d'une grande liberté pour gérer le contenu, le style et la distribution de ce magazine.
lundi 13 mai 2013
Conseil 17: Tables d'aides pour les hiérarchies
Cet article fait suite à l’article "Help for Hierarchies" de Ralph Kimball, publié en septembre 1998, qui traite des structures hiérarchiques de profondeur variable. Ces structures sont le plus souvent représentées dans les bases de données relationnelles comme des relations récursives.
Ci-dessous, la définition d’une dimension Entreprise simple qui contient ce type de relation récursive entre la clé étrangère PARENT_CLE et la clé primaire ENTREPRISE_CLE :
Create table ENTREPRISE(
ENTREPRISE_CLE INTEGER NOT NULL,
ENTREPRISE VARCHAR2(50),
PARENT_CLE INTEGER);
Bien que cela soit efficace pour stocker des informations sur les structures organisationnelles, il n'est pas possible de naviguer ou de cumuler des faits au sein de ces hiérarchies en utilisant le SQL généré par les outils d'interrogation du commerce. Pour résoudre ce problème, l’article original de Ralph décrit une table d'aide semblable à celle ci-dessous qui contient un enregistrement pour chaque chemin et pour chaque entreprise dans l'arbre de l'organisation elle-même et pour chaque filiale en dessous d’elle.
lundi 6 mai 2013
Conseil 16: Dimensions interchangeables
Le dix-huitième critère de la liste des critères dimensionnels sympas, définit une "dimension remplaçable à chaud" comme étant une dimension avec deux ou plusieurs versions alternatives. Si la dimension est interchangeable, alors n’importe laquelle des versions peut être choisie au moment de la requête.
Il existe un certain nombre de situations où l'usage des versions alternatives d’une même dimension peuvent être très utiles. En voici 3 :
Inscription à :
Articles (Atom)