Pourquoi le Big Data est vraiment Big ?

Le Big Data est sur toutes les lèvres, mais est-ce que le Big Data est un phénomène vraiment nouveau ? N’est-ce pas tout simplement une évolution prévisible et attendue ? La réponse est non : il ne s’agit pas d’un simple changement d’échelle, mais bien d’une transformation profonde de la nature même de la technologie.

Une évolution attendue de la Data ?

Est-ce que le Big Data n’est pas qu’une évolution normale de la taille des mémoires ? La « Loi de Moore », énoncée dès les années 60, prédit en effet que la capacité de la technologie double toutes les années et demie. De fait, en matière de mémoire informatique, les ordinateurs disposaient au début des années 80 d’environ 64 kilobits, au début des années 90, d’environ 16 mégabits (1 mégabit étant équivalent à 1000 kilobit), et dans les années 2000 on comptait déjà en gigabits (1 millier de mégabit.)

Dans ces conditions, la Data n’était-elle pas condamnée à devenir « Big » ?

Les réseaux : un changement de nature des échanges informatiques 

En réalité, plusieurs changements profonds du monde digital ont transformé la nature même des données. Avec le Web 2.0, les utilisateurs eux-mêmes ont commencé à générer des contenus. Les réseaux sociaux ont permis aux utilisateurs de s’échanger ces contenus. Et l’avènement du machine to machine a amplifié cette dynamique.

Quel est le point commun entre ces phénomènes ? L’architecture en réseau. 

Là où la donnée était auparavant typiquement générée entre un individu et un service (par exemple quand nous contactons notre banque), le nombre de transactions générées (et donc de données), était proportionnel au nombre d’individus. Si 100 personnes contactent leur banque, il existe 100 transactions.

Dans une organisation en réseau, le nombre de transactions potentielles est proportionnel au carré du nombre d’individus. Si 100 personnes sont dans un réseau, chaque individu peut contacter les 99 autres membres. Il en résulte que si chaque personne veut contacter ses amis, on peut arriver à 9900 échanges, donc presque 10000, c'est-à-dire 100 au carré… Le fait que les utilisateurs eux-mêmes puissent générer des contenus et les échanger entre eux a bouleversé la vitesse de génération de la data.

Dans un monde ou environ 2 milliards d’internautes sont connectés, le nombre de transactions potentielles est gigantesque puisqu’il augmente de façon exponentielle avec la croissance du réseau. Et, en plus de leur taille, ces échanges nous permettent d’étudier des comportements, des opinions ou des besoins qui n’avaient jamais pu être observés auparavant.

Le « Machine to Machine » : l’infini en perspective

Cette dynamique de réseau ne se limite d’ailleurs pas aux être humains, puisque, par exemple, de nombreux capteurs peuvent être placés sur des moteurs d’avions afin qu’il soit possible de mesurer en permanence l’état des différentes composantes de l’engin. Ces mesures sont envoyées à des ordinateurs qui permettent de surveiller continuellement l’ensemble d’une flotte d’avions. Les ordinateurs communiquant eux-mêmes avec d’autres types de capteurs et de systèmes automatiques. 

Toutes ces mesures sont à leur tour utilisées pour optimiser des processus mais aussi à des fins commerciales, de sécurité, de santé, etc.

Le machine to machine fait exploser les limites imposées par la démographie, en croissance presque nulle dans nos pays, puisque le nombre de machines peut lui augmenter sans limite. Quand on conçoit que le nombre d’échanges résultant est exponentiel, les perspectives sont ahurissantes…

Le Big Data : une accélération exponentielle de la quantité de donnée, dû à un changement profond de nature 

Il ne faut pas se tromper, les réseaux ont bien totalement transformé la vitesse à laquelle les données sont générées. Si on ajoute à ce constat d’accélération du volume, celui du changement considérable de la nature des données - on peut désormais mesurer des comportements ou des phénomènes qui n’étaient pas observables auparavant - force est de constater que le Big Data est vraiment Big ! 


Cet article a été publié pour la première fois sur le site de l'Adetem le 28 Février 2014.

Comments