Nous allons décrire un exemple simple et classique d'attribution d'étiquette de comportement à des modèles complexes de micro-transactions découlant de processus qui interagissent avec les clients, tels que les centres d'appels, les visites de sites web, les systèmes de livraison, et les systèmes de réconciliation de paiement. Nous allons utiliser nos techniques de reporting d'entrepôt de données standard pour synthétiser trois indicateurs de comportement des clients: récence, fréquence et intensité. La récence mesure la façon dont nous avons récemment collaboré avec le client. Prenons un point de vue large et analysons toute transaction issue des processus que nous avons mentionné ci-dessus. La mesure réelle de récence est le nombre de jours écoulés depuis le dernier contact avec le client.
De même, la fréquence mesure combien de fois nous avons interagi avec le client, reprenant la même perspective que ci-dessus. Et enfin, l'intensité mesure la productivité des interactions qui ont eu lieu. La mesure la plus évidente de l'intensité est le montant total des achats, mais peut-être que le nombre total de pages Web visités est une bonne mesure de l'intensité également.
Toutes ces mesures de récence, fréquence et intensité peuvent être subdivisées en d'autres mesures distinctes pour chaque processus qui interagit avec les clients, mais nous conserverons cet exemple simple.
Maintenant pour chaque client, nous calculons ces mesures pour une période précise, comme par exemple le dernier mois. Le résultat est trois mesures. Nous imaginons stocker ces résultats dans un cube à trois dimensions ayant les axes Récence, Fréquence et Intensité.
Maintenant, nous appelons nos collègues du data-mining et leur demandons d'identifier les groupes naturels de clients dans ce cube. Nous ne voulons vraiment pas tous les résultats numériques: ce que nous voulons, ce sont des groupes de comportement qui sont significatifs pour notre service marketing. Après l'exécution de l'étape de data-mining d'identification des groupes, on trouve, par exemple, huit ensembles naturels de clients. Après avoir étudié où les groupes se trouvent dans notre cube, nous sommes en mesure d'assigner des descriptions de comportement pour chacun d'entre eux:
A: Client régulier, bonne réputation, quelques retours de produits
B: Client régulier, bonne réputation, mais beaucoup de retours de produits
C: Nouveau client, pas de réputation définie
D: Client occasionnel, bonne réputation
E: Client occasionnel, mauvaise réputation
F: Ancien bon client, pas vu récemment
G: Visiteur fréquent, surtout improductif
H: Autre
Nous pouvons voir les balises A à H comme des textes résumant les faits liés au comportement d'un client. Il n'y a pas beaucoup de faits texte dans les entrepôts de données, mais ces étiquettes de comportement semblent être un très bon exemple. Nous pouvons imaginer capter une séquence de mesures des étiquettes de comportement pour un client au fil du temps avec un enregistrement pour chaque mois:
John Doe: C C C D D A A A B B
Que pensez-vous de cette séquence? Nous avons converti avec succès John Doe qui est passé de nouveau client, à client occasionnel, puis est devenu un client régulier. Mais ces derniers mois, nous constatons une hausse des retours de produits. Non seulement ce comportement récent est coûteux, mais nous craignons que John délaisse nos produits et finisse par se retrouver dans la catégorie F.
Cette série chronologique est très révélatrice. Comment pouvons-nous structurer notre entrepôt de données pour sortir ces types de rapports? Et comment pouvons-nous poser des contraintes intéressantes sur les clients afin de voir uniquement ceux qui sont passés du groupe A au groupe B dans la période la plus récente?
Nous pouvons modéliser cette série chronologique d'étiquettes textuelles du comportement de plusieurs façons différentes. Chaque approche a un contenu d'information identique, mais ils diffèrent sensiblement par la facilité d'utilisation. Supposons que nous générons une nouvelle balise de comportement pour chaque client chaque mois. Voici trois approches:
1) Un enregistrement dans la table de faits pour chaque client pour chaque mois, avec l'étiquette de comportement comme un fait textuel.
2) Un enregistrement dans la dimension à évolution lente "Client" (type 2) avec l'étiquette de comportement comme un simple attribut. Un nouvel enregistrement client est créé pour chaque client chaque mois. Même nombre de nouveaux enregistrements chaque mois que le choix n°1.
3) Un seul enregistrement dans la dimension Client avec 24 attributs représentant une séquence de 24 mois; chaque attribut stocke l'étiquette de comportement du mois concerné.
Les choix 1 et 2 ont tous deux le problème que chaque étiquette de comportement successive pour un client donné est dans un enregistrement différent. Bien qu'un simple comptage se fera avec ces deux premières modélisations, les comparaisons et les contraintes sont difficiles. Par exemple, trouver les clients qui sont passés du groupe A au groupe B dans la dernière période serait difficile dans une base de données relationnelle, car il n'existe aucun moyen simple de réaliser une "contrainte de chevauchement" entre deux enregistrements.
Dans cet exemple, nous sommes très influencé par la périodicité prévisible des données. Chaque client est profilé chaque mois. Donc, même si l'étiquette de comportement est une sorte de fait textuel, la conception n°3 s'annonce comme très efficace. Stocker la séquence des étiquettes de comportement dans chaque enregistrement Client a trois grands avantages. Tout d'abord, le nombre d'enregistrement généré est considérablement réduit, car une nouvelle mesure d'étiquette de comportement n’entraîne pas la création d'un nouvel enregistrement. Deuxièmement, les contraintes de chevauchement complexes sont faciles parce que les champs concernés sont dans le même enregistrement. Et troisièmement, nous pouvons facilement associer les contraintes de chevauchement complexes à nos tables de faits comportementales des clients à l'aide d'une jointure simple avec la dimension Client.
Bien sûr, la modélisation des séquences chronologiques comme un ensemble spécifique de champs dans la dimension Client a le désavantage qu'une fois que vous avez épuisé les 24 champs, vous devrez probablement modifier la dimension Client pour ajouter d'autres champs. Mais, dans l'environnement actuel où les évolutions sont rapides, peut-être que cela vous donnera une excuse pour compléter le modèle d'une autre manière en même temps! Au moins ce changement est "propre" puisqu'il n'a aucune incidence sur les applications existantes.
Nous avons réussi à réduire des téraoctets de données transactionnelles sur les comportements à un simple jeu d'étiquettes, avec l'aide de nos collègues du data-mining. Nous avons ensuite rangés les étiquettes dans un format très compact et utile qui répond à nos exigences en matière de facilité d'utilisation et de développement d'application. Nous sommes maintenant prêts à fournir toute sorte d'analyse de comportement intéressante pour nos utilisateurs finaux du marketing.
Source originale: www.kimballgroup.com
Article original "Kimball Design Tip #33: Using CRM measures as behavior tags", publié le 10 février 2002.
Aucun commentaire:
Enregistrer un commentaire