Geek&Tech

Données clients : quelle réalité révèlent-elles ?

Femme devant écran de données clients

Les données reflètent-elles notre vie ?, photo : This is engineering/Pexels

Les données clients livrent une masse d’informations sur les consommateurs. Donnent-elles pour autant une vue exacte d’un client ? Ce n’est pas évident. Elles n’échappent pas non plus aux critiques portées aux études quantitatives et leurs méthodes. Elles font malgré tout la fortune des GAFAM tant leur diversité est grande et leur volume incommensurable.

Les données clients : des chiffres, des lettres et des signes

Les données clients, ce sont avant tout des combinaisons de lettres, de chiffres et de signes par lignes et colonnes entières de fichiers informatiques ou papier : numéros, dates, codes, noms… Leur origine est multiple : tableurs, bases de données, CRM, sites internet, mais aussi tickets de caisse, cartes de fidélité, billetterie, trajets en magasin, en ville, en région, etc.

Ces données subissent plusieurs traitements avant d’être exploitées : anonymisation, stockage, formatage, recherche de cohérence, suppression des doublons, des valeurs aberrantes, incomplètes, etc.

En outre, au moment de leur récolte et de leur exploitation, ces données de masse connaissent de nombreux biais. Les biais d’étude, connus dans les enquêtes quantitatives : biais de confirmation, d’échantillonnage, etc. Les biais propres à l’intelligence artificielle, dont on se sert pour les exploiter : biais de l’algorithme d’apprentissage, biais de sélection…

Après toutes ces transformations, peut-on parler encore de client ? Plus vraiment, il est impossible de discuter avec des données, mais on peut les faire parler, c’est-à-dire en tirer des informations.

Et c’est bien l’objectif de ces transformations : obtenir des données de qualité, fiables, exploitables, accessibles, conformes aux règlements. Devenues des informations, elles éclaireront les décisions et la construction de stratégies marketing efficaces.

Les données clients ne sont pas mon client

Afin de mener des analyses pertinentes, le marketing dispose de plusieurs moyens. Les études quantitatives, les statistiques et la modélisation en font partie. Mais on reproche à ces dernières de ne pas toujours refléter la réalité.

Ainsi, en statistique, on parle d’un « échantillon représentatif d’une population ». Ce dernier n’englobe pas toute la population réelle, mais une infime partie. Les statisticiens en dégagent néanmoins des tendances, des estimations et des hypothèses.

Un autre argument est de considérer les données clients comme une représentation des clients. C’est le cas, par exemple, lors de la modélisation des données. Or la modélisation simplifie la réalité. Si variées que soient les variables et puissant l’ordinateur, la modélisation exclut une part du réel : le détail, l’exception, le secondaire, l’incomplet…

Enfin, des questions pratiques se posent. En effet, l’étude et l’analyse de ces volumes de données demandent une connaissance de la modélisation statistique et de la statistique descriptive. Ces deux disciplines suivent des méthodes rigoureuses, longues et exigent de vérifier de nombreuses hypothèses avant de valider les résultats. Sont-elles réellement suivies ? Et par ailleurs, des non-spécialistes n’auraient-ils pas tendance à prendre en compte les résultats d’un logiciel sans vraiment maîtriser toutes ces démarches et calculs ?

Que ce soit un échantillon, une représentation, une image, les données clients ne sont pas vraiment mon client.

Ecran de portabe avec des graphiques de web analyse

Le web marketing repose sur les données clients, photo : Myriam Jessier-Evel/Unsplash

Une exploitation qui suscite de nombreux débats

Malgré tout, en marketing, les cas d’usage de l’analyse des données clients sont connus et efficaces : segmentation, parcours client, fidélisation, analyse prédictive. Ils donnent une connaissance client plus fine, une vision sur ses moments de vie et ses comportements. Il est ainsi plus facile d’anticiper ses besoins et de lui proposer des produits adéquats.

A des femmes qui achètent des tests de grossesse, des magasins peuvent proposer des produits pour bébé. Dès lors, n’est-il pas vain de refuser les cookies quand les tickets de caisse fournissent des informations aussi pertinentes ?

Finalement, même incomplètes, même transformées, ces données en disent beaucoup sur les clients, surtout si les analystes croisent des fichiers. Voilà pourquoi de nombreux consommateurs refusent qu’elles soient récoltées, des institutions les protègent et des entreprises les exploitent.

C’est peut-être là le changement majeur de ces vingt dernières années : une accumulation croissante de ces données et une rapidité de calcul pour les exploiter. Des plateformes et des Etats en savent plus sur nous que nous-mêmes, anticipent nos décisions et nos actions mieux que nous. Ces sujets animent régulièrement des débats techniques, sociaux et philosophiques.

Et vous, que comment analysez-vous vos données clients ?

En remerciant Karine Benoit et Fabien Haury pour leurs suggestions.