Les articles, dossiers, tables rondes et conférences sur le big data se sont multipliés depuis quelques mois. De plus en plus de sociétés s’emparent du phénomène de mode pour revendiquer leur expertise du sujet et s’accaparer les centaines de millions, voire les milliards de dollars promis sur ce « nouveau » marché.
Les modes se suivent et se ressemblent : le « tout CRM » à la fin des années 90, le « 1 to 1 » début 2000, le « web 2 »… A chaque fois, ces expressions sont synonymes d’avancées concrètes, d’outils innovants mais aussi de sur-promesses et de raccourcis.
Il y a beaucoup de confusion et de fantasmes derrière l’expression « big data ». Cette expression n’est pas suffisamment bien définie. C’est dommage car il est vrai que les données se multiplient et il est vrai qu’il faut apprendre à les collecter, à les extraire, à les exploiter et à les interpréter. Et surtout, il est vrai que cela génère du business et de la rentabilité : des chercheurs du MIT ont récemment réalisé une étude sur 330 entreprises. Elle montre clairement que les entreprises qui exploitent intelligemment les données ont en moyenne une productivité supérieure de 5% et une rentabilité supérieure de 6 % par rapport à leurs concurrentes (Harvard Business Review de Novembre).
Mais le flou est entretenu et personne ne sait vraiment de quelles données on parle quand on parle de « big data ». Mais de toutes bien sûr ! Comme si on pouvait traiter de la même manière :
Certaines de ces données sont nominatives, d’autres statistiques, d’autres encore liées à un identifiant (cookie, DNS…). Ces données sont complétement hétérogènes. Elles ne sont pas organisées de la même manière, n’ont pas les mêmes rythmes de réactualisation, etc. Surtout, elles ne font pas référence aux mêmes types de réalités et ne signifient parfois pas grand-chose sorties de leur contexte de création et/ou d’usage.
Il y a aussi beaucoup de confusion autour des objectifs et des finalités du « big data » :
Les données explosent. Leur volume, leur variété et la vitesse à laquelle elles sont renouvelées modifient profondément la manière de les collecter, de les exploiter et de les interpréter. Le champ des possibles est extraordinaire notamment pour le marketing. Le marketing de demain exploitera de plus en plus les data pour mieux connaître les consommateurs et permettre une interaction personnalisée et en temps réel entre eux et la marque. Mais nous sommes aujourd’hui très loin du graal promis par beaucoup d’enchanteurs du Big Data. Certains marketeurs se prennent pour des magiciens et cela n’est pas bon, ni pour les marques, ni pour les prestataires (dont certains font du « big data » depuis 15 à 20 ans sans le savoir), ni pour le marché en général. Il y a un potentiel extraordinaire dans l’exploitation de la data, à condition de bien distinguer les données, les objectifs et du coup les expertises !
Il est plus qu’urgent de revenir à certains fondamentaux. A cet égard, il me semble essentiel de rappeler plusieurs points clés :
Pour conclure, j’utiliserai la métaphore du lagon que j’emprunte à Pierre Bellanger dans un texte sur la « marque sociale ». Le lagon est comme un lac calme et serein en pleine mer car plus ou moins protégé par une barrière de corail. Il y a cependant, et c’est important, des échanges entre le lagon et la mer. Le lagon, c’est l’ensemble des données collectées et structurées nécessaires aux besoins d’une organisation et/ou à la réalisation d’objectifs. La mer, ce sont toutes les données disponibles, c’est le « big data », c’est riche mais chaotique et inexploitable en tant que tel. Entre les deux, les dispositifs de data management forment la barrière corallienne nécessaire à l’exploitation opérationnelle des données. De la mer vers le lagon, on passe d’un amas chaotique à l’organisation puis à l’intelligence. C’est l’objet du data management et du datamining : collecter et organiser les données pour trouver un ordre là où il n’y avait que chaos. Cela veut dire identifier des causes, trouver des variables explicatives, déterminer des liens que l’on pourra exploiter ensuite de manière opérationnelle. Le « big data » n’a aucun intérêt si l’on ne reconnait pas la nécessité de ce travail de fond. De fait, chaque entreprise doit avoir à cœur de mettre en place son lagon de données et veiller à ne pas se noyer dans le « big data ». Le « big data » est une opportunité à condition de savoir en extraire de l’ordre, de l’efficacité, bref, de la valeur ! A ce titre, il serait plus opportun de parler de « Valued Data » car c’est bien cela qui intéresse les organisations : non pas la donnée pour la donnée mais la donnée utile, la donnée comme moyen de parvenir à ses fins et non comme fin en soi.
Yan Claeyssen
Co-président d'ETO
pour suivre son blog http://mdm.typepad.com/
Paris 22 mai - 17 juillet - 23 septembre - 14 novembre - 16 décembre
Paris 20 juin - 18 juillet - 13 septembre - 23 octobre - 26 novembre 2013
Paris 9 juillet - 19 septembre - 29 octobre - 2 décembre 2013
Paris les 3 & 4 juin - 2 & 3 septembre - 10 & 11 octobre - 19 & 20 novembre 2013
Paris 24 mai - 2 octobre - 13 décembre 2013
Paris 31 mai - 26 juin - 9 octobre - 14 novembre - 10 décembre 2013
Paris 27 mai - 27 septembre - 18 novembre 2013
Paris 14 juin - 17 septembre - 24 octobre - 28 novembre 2013
Paris 21 juin - 16 septembre - 18 novembre - 6 décembre 2013
Paris 19 juin - 24 septembre - 4 novembre - 12 décembre 2013
Paris 3 juin - 7 octobre - 19 novembre 2013
Londres 29 mai - 28 juin - 8 octobre - 12 novembre - 4 décembre 2013
![]() |