lundi 25 novembre 2013

Conseil 46: Un autre regard sur les dimensions dégénérées

Nous parlons souvent des dimensions dégénérées dans nos ateliers de modélisation. Les dimensions dégénérées sont sources de confusion à cause du fait qu'elles ne ressemblent pas à des dimensions normales. Cela peut aider de se souvenir que les dimensions dégénérées se réfèrent à quelque chose qui 1) vient de la norme standard, ou 2) est mathématiquement plus simple.

Une dimension dégénérée agit comme une clé de dimension dans la table de faits, cependant elle n'est liée à aucune dimension parce que tous ces attributs dignes d'intérêts sont déjà dans d'autres dimensions. Parfois, les gens font références aux dimensions dégénérées comme des faits textuels, mais ce ne sont pas des faits parce que la clé primaire de la table de faits comprend la dimension dégénérée ainsi qu'une ou plusieurs autres clés étrangères de dimensions.

lundi 18 novembre 2013

Conseil 45: Techniques pour modéliser la connaissance

L'un des plus gros défis dans le déploiement d'analyses est que la connaissance reste cachée dans les outils qui sont utilisés pour construire les analyses. Une fois que la connaissance est emprisonnée dans l'un de ces outils, il devient difficile de partager cette logique de prise de décision avec les utilisateurs qui pourraient utiliser différents outils de requêtage et de reporting.

Je définis la connaissance comme les meilleures pratiques de l'entreprise pour une activité métier bien définie. Par exemple, quel est le meilleur moyen d'analyser l'introduction d'une nouvelle extension à une ligne de produit comme un nouveau gout pour un dentifrice, sur le marché des biens de consommation? Cela n'inclus pas seulement les données et les mesures, mais aussi ce qui constitue la performance normale pour chacun des métriques de support. Toute performance en dehors de 2 ou 3 déviations standard de la base pourrait être considéré comme exceptionnel. Je voudrais ensuite essayer de comprendre quel sont les mesures principales comme les écarts de prix par rapport à la concurrence, les ventes, la quantité et la qualité d'un support de vente, toute mesure de sortie de stock ou de distribution, d'inventaire, d'affichage, de coupons qui étaient en dehors des valeurs acceptables.

lundi 11 novembre 2013

Conseil 44: Ne soyez pas trop dépendant des métadonnées de vos outils d'accès aux données

"Oh, nous verrons cela dans l'outil" est le refrain que nous entendons parfois des équipes de conception. A la place, à chaque fois que c'est possible, nous suggérons d'investir les efforts pour construire une information descriptive plus flexible et plus riche directement dans les schémas dimensionnels plutôt que de nous appuyer sur les fonctionnalités de l'outil de métadonnées.

Les outils de business intelligence d'aujourd'hui fournissent des métadonnées solides pour supporter un grand nombre de fonctionnalités, comme la substitution de libellés, les calculs prédéfinis, et la navigation agrégée. Cela est utile pour vos utilisateurs. Mais, nous avons besoin d'être judicieux dans l'utilisation des fonctionnalités que ces outils fournissent. Trop souvent les équipes de conceptions prennent des raccourcis et comptent sur les métadonnées des outils d'accès aux données pour résoudre les problèmes qui seraient mieux traités dans nos modèles dimensionnels. Au final, les règles métiers sont intégrées dans les métadonnées de l'outils plutôt que dans nos schémas. Nous avons également vu des équipes utiliser les métadonnées des outils pour fournir le code des vues et des descriptions des indicateurs afin de conserver leur schéma plus petit.

lundi 4 novembre 2013

Conseil 43: Traiter les valeurs nulles dans le modèle dimensionnel

La plupart des bases de données relationnelles utilisent la valeur Null pour représenter une absence de données. Cette valeur peut perturber les développeurs d'entrepôts de données et les utilisateurs parce que la base de données traite les valeurs nulles différemment des valeurs à blanc ou des zéros, même si elles ressemblent à des blancs ou des zéros. Ce conseil explore trois exemples où nous trouvons des valeurs nulles dans notre source de données et faisons des recommandations sur la manière de faire face à chaque situation.