mardi 4 janvier 2011

Datamining : de la donnée à la connaissance, de la connaissance à la décision.


Avant tout, je voudrais souhaiter aux lecteurs de ce blog une excellente année 2011, tant sur le plan personnel que professionnel !

A l’approche des fêtes, en recherchant quelques idées de cadeaux sur le site amazon.fr, j’ai une fois de plus été interpellé par la pertinence de leur système d’association de produits. S’il est assez facile de proposer à un lecteur de Mary Higgins Clark le dernier livre de Marc Levy, certaines associations sont parfois moins évidentes : le site est, par exemple, capable de déterminer quel jouet je suis le plus susceptible d’offrir à mes enfants pour Noël en fonction du dernier disque que j’ai acheté ! Cet exemple montre que l’utilisation de modèles statistiques pour prédire le comportement d’achat des internautes peut être un véritable déclencheur de logiques de cross selling ; il s’agit là de l’une des applications classiques du datamining dans le processus CRM mais il en existe bien d’autres.
Pour ce premier article de l’année, j’ai donc choisi d’évoquer les techniques de datamining en rappelant brièvement de quoi il s’agit, à quoi cela sert et comment mettre en place une telle démarche dans son entreprise.

Tout d’abord, il est important de bien distinguer informatique décisionnelle et datamining. La première cherche à constater un fait et à l’expliquer tandis que la seconde s’attache à le classer et à le prévoir : on ne veut plus simplement savoir « combien de clients on acheté quel produit pendant quelle période » mais « quel est leur profil ». On cherchera à savoir « quels autres produits les intéresseront » et « quand ils seront intéressés ». Les profils clients étant souvent bien plus compliqués à définir qu’une simple opposition hommes/femmes ou jeunes/seniors, il est généralement nécessaire d’avoir recours à des modèles statistiques pour les isoler.
C’est finalement de cette complexité que découle le datamining : afin de mieux connaitre leurs clients et leurs prospects, les entreprises ont cherché à obtenir un maximum d’informations et ont fini par accumuler une montagne de données qu’elles n’étaient plus capables d’exploiter ; elles ont de cette manière négligé l’approche globale de leurs clients. Le recours à la statistique et l’utilisation d’algorithmes est dès lors apparu comme un moyen de transformer ces informations brutes en connaissances client. En réduisant la quantité de données et en faisant ressortir les facteurs corrélés, le datamining s’est imposé comme une technique puissante d’aide à la décision qui permet, in fine, de dépenser moins pour un meilleur résultat.
Rappelons également que le datamining peut être soit descriptif soit prédictif. Les techniques descriptives (ou exploratoires) visent à mettre en évidences des informations présentes mais cachés par le volume de données. Les techniques prédictives, quant à elles, visent à extrapoler de nouvelles informations à partir des informations présentes.

Voyons maintenant à quoi peut servir le datamining. Les applications de ces techniques aux processus CRM d’entreprises sont multiples et peuvent apporter une vraie valeur ajoutée dans les domaines de la vente, du marketing et du service client. Elles permettent notamment d’identifier les facteurs qui déterminent le comportement du client et d’isoler les investissements les plus profitables.
D’un point de vue opérationnel, l’application typique du datamining descriptif dans la gestion de la relation client reste le score d’appétence, c'est-à-dire la probabilité pour un client d’être intéressé par un produit ou un service. C’est clairement l’exemple d’Amazon.fr qui utilise cette technique de datamining pour augmenter ses ventes croisées. Autre exemple surprenant qui montre à quel point ces techniques peuvent dégager des tendances difficilement déductibles : on s’est aperçu que statistiquement, les acheteurs de couches culottes le samedi après 18h sont souvent aussi des acheteurs de bière.
Comme on l’a vu, le datamining peut également, grâce à des techniques prédictives, apporter des informations client qui ne sont contenues nulle part dans la base de données. C’est l’exemple classique des techniques de scoring bancaire : même si je n’ai encore jamais contracté un emprunt, ma banque est capable d’estimer le risque que je ne puisse pas la rembourser en s’intéressant aux nombre de sinistres constatés par le passé sur des profils similaires au mien. Remarquons ici qu’une telle technique suppose d’avoir à sa disposition une base de données solide avec des datas fiables et un historique suffisant. De la même manière et sous les mêmes conditions, un opérateur sera capable de déterminer quels sont ses clients actuels susceptibles de passer à la concurrence dans le mois suivant et ceux ayant la plus grande probabilité d’acheter un nouveau forfait. D’une part, l’entreprise pourra alors mener des actions spécifiques uniquement sur certains clients pour réduire le taux de churn à moindre coût et d’autre part mener des actions de fidélisation ou adapter la tarification sur les clients qui ont le plus gros potentiel de développement indépendamment de ce qu’ils rapportent à l’instant t.
Dans le cadre de l’envoi d’une campagne mailing, la datamining peut également prédire un taux de réponse en fonction des différents profils client. En adressant le mail uniquement aux clients dont le taux de réponse est le plus élevé, on cible mieux la campagne et on réduit donc son coût tout en améliorant ses résultats.
Dans le cadre de l’amélioration de la performance d’un centre d’appel, les techniques de datamining permettent également de suggérer aux opérateurs des réponses « toutes faites » lors d’un appel téléphonique en fonction du dernier point de contact avec ce client (cf textmining http://crmissues.blogspot.com/2010/12/ecouter-la-voix-du-client-pour-definir.html).
Enfin, dernier exemple, le datamining est également particulièrement efficace pour détecter les comportements anormaux ou frauduleux notamment sur un site web. En s’appuyant sur des techniques prédictives, il est possible de détecter automatiquement et en temps réel une fraude en la rapprochant de la typologie des fraudes avérées par le passé. De cette manière, Amazon a réussi à réduire son taux de fraude de 50% en 6 mois. De la même manière, lors d’un vol de téléphone, il est possible de repérer rapidement les appels d’une durée inhabituelle ou passés depuis une zone inhabituelle.

Voyons maintenant comment mettre en place une démarche de datamining. Tout d’abord, il faut absolument mobiliser des connaissances sur trois grands domaines :
-         des connaissances statistiques pour analyser et mettre en forme les données
-         des connaissances informatiques pour extraire les données, constituer une base et programmer les modèles statistiques dans un environnement informatique de production
-         des connaissances métiers pour orienter les actions en fonction des spécificités du secteur et de l’expérience que l’on a de ses clients  

Il existe aujourd’hui sur le marché de nombreux logiciels capable de tirer profit des techniques de datamining dans le cadre d’une démarche CRM. Ces outils permettent d’accroître votre efficacité, de réduire vos coûts ou de limiter vos risques en exploitant au mieux les informations cachées dans les bases de données de l’entreprise. Concrètement, ils permettent de construire des indicateurs et restituent de manière très visuelle les connaissances stratégiques et opérationnelles à partir des informations du datawarehouse.

Une fois qu’elle dispose d’outils performants, l’entreprise va devoir passer par différentes phases pour mettre en œuvre sa stratégie datamining :
-         La compréhension métier : au démarrage, le chef de projet doit pouvoir formaliser les enjeux métiers à adresser (segmentation client, réduction du churn…) et déterminer les facteurs clés de succès de la démarche datamining
-         La compréhension des données : une fois l’objectif clairement défini, il faut collecter d’une part les données clients (informations sociodémographiques…) et d’autre part les données liées aux phénomènes à prédire (ex : propension à consommer, impayés…). Cette phase de collecte des données est essentielle dans la mesure où bien évidemment si les données en bases ne sont pas fiables, les résultats du datamining seront faussés. Lors de cette phase, il est possible d’émettre les premières hypothèses sur les modèles cachés
-         La préparation des données : Afin d’être exploitables d’un point de vue statistique, il faut alors procéder à un prétraitement des données en supprimant les informations non pertinentes et en complétant les données non renseignées. Cette phase est largement facilité par la plupart des logiciels de dataming : à chaque étape, les résultats de la transformation sont affichés automatiquement ; le contrôle de la validité est simplifié et les risques d’erreur réduits.
-         La modélisation : il faut, à ce stade sélectionner le modèle statistique adéquat, c'est-à-dire celui qui va servir au mieux l’objectif métier fixé en aval (arbre de décision, réseaux neuronaux…). Les logiciels de datamining vous fournissent en natif une très large palette de modèles et de méthodes statistiques directement applicables.
-         L’évaluation : C’est à ce moment que l’on s’assure en environnement de test (avec un échantillon de données) de la validité du modèle choisi avant de le déployer en environnement de production.
-         Le déploiement : Cette phase consiste à appliquer le modèle statistique testé à l’ensemble des données de la base. Cette partie peut être automatisée par les logiciels de datamining qui appliquent toutes les règles, calculs et transformations nécessaires sur la totalité de la population étudiée.

Reste alors peut-être le plus difficile : interpréter les résultats et en tirer les conclusions pour décliner des orientations stratégiques et opérationnelles…


Bookmark and Share
Si vous avez aimé cet article, souscrivez au feed rss du blog afin de rester au courant des mises à jour.

3 commentaires:

  1. A tester immédiatement pour mettre directement cet article en pratique, je vous recommande :
    http://oorook-crm.scanandtarget.com/

    Je viens de tomber dessus, c'est juste magique !!!

    RépondreSupprimer
  2. Bonjour,

    Votre blog est très agréable à lire.

    Cordialement,

    http://www.lesitedesdataminers.fr/

    RépondreSupprimer
  3. Bonjour,

    Effectuant un exposé sur le data mining, j'ai trouvé votre article très bien écrit et très intéressant

    Merci

    RépondreSupprimer