Le Big data : la statistique c’est vous, les bénéfices c’est eux !

Le « Big data », mégadonnées ou données massives, est un concept assez complexe à imaginer. Il s’agit en fait de l’ensemble des données qui circulent et sont stockées de par le monde. C’est aussi très récent puisque le Big data est né avec l’ère d’Internet et l’envolée des capacités de stockage…

Il y a 20 ans, les clés USB culminaient à 2 Go et les disques durs à 60 Go. En 2022, ce chiffre a été multiplié par 1000. En 10 ans, la quantité de données numériques créée annuellement dans le monde est passée de 2,8 zettaoctets* à plus de 50. On compte dans ce chiffre les données des particuliers (photos, enregistrement vidéo), mais il s’agit pour une très grande majorité de données enregistrées provenant de sources très variées : messages, e-mails, données météo, de trafics routiers, de GPS, de données médicales, de télescopes, d’achat en ligne, de pièces jointes, de VoIP, de cloud, de sondages en ligne, de compteurs Linky, de péages, etc.

*1 Zo = 1 milliard de To (1000 milliards de Go)

bigdata
Le plus anodin de vos gestes est enregistré puis stocké dans le but d’être traité pour qui aura les moyens de le faire.

Une quantité de données inimaginable

Il y a tellement de source qu’il est impossible de toutes les lister ou même de les imaginer. Mais la quantité de données n’est rien s’il est impossible de traiter tout ça. C’est ici qu’entre en jeu la capacité de calcul. Car elle aussi a été multipliée par 1000 en quelques années. D’autres paramètres entrent en ligne de compte : la qualité des données, la rapidité à laquelle ces données sont mises à jour et leur variété. Ce sont les trois V : Volume, Vélocité et Variété. Pour tirer quelque chose du Big data, il faut donc des outils qui vont prendre en considération ces trois V pour intégrer, gérer et analyser.

Pour rendre le monde meilleur…

Mais à quoi ce Big data peut-il bien servir ? À plein de choses en fait : améliorer les conditions sur les routes, optimiser les échanges sur Internet, corriger les bugs, réguler les entrées dans les hôpitaux, développer de nouveaux produits, empêcher les fraudes, gérer les risques, lutter contre la criminalité… Les domaines concernés sont variés : commerce, écologie, politique, enseignement, socioculturel, etc. Bref, le Big data c’est pour « rendre le monde meilleur ». Bien sûr, c’est plus compliqué que ça, surtout quand les entreprises privées s’en mêlent.

…ou pour vous vendre tout un tas de cochonneries

Car on se doute bien que les GAFAM utilisent cet outil incroyable : Amazon va vous proposer des produits en fonction de ce que vous avez commandé, mais aussi en fonction de ce que les autres clients ont choisi. Ils utilisent des tas de données pour optimiser les transactions. Plus le temps entre le moment où le client choisit un produit et le moment où il paye est court, et plus la transaction a de chance de réussir. Amazon mise énormément là-dessus. Google se sert de l’historique de vos recherches et de votre emplacement pour mieux comprendre vos attentes et proposer de la publicité ciblée.

Saviez-vous qu’il n’y a pas une page d’accueil Netflix identique à une autre ? En effet, Netflix va afficher des recommandations en fonctions de vos recherches antérieures, mais aussi d’un cocktail de paramètres liés à vos activités en ligne. McDonald’s va utiliser des données pour vous afficher des offres ou des promos en fonction de vos goûts. Et là on ne parle que de données « internes », car, en ajoutant des données externes, il est possible de bien mieux vous cibler : avez-vous une voiture, une maison ou un appartement, quels types de biens consommez-vous ? On ne va pas essayer de vendre une piscine à un type seul qui a une Twingo de 2001 (données des assurances ou des recherches Internet sur les pièces de rechange), qui mange des boîtes de conserve (données de votre carte de fidélité Auchan) et qui vit dans un HLM.

Vous êtes déjà dans la matrice

Bien sûr, les utilisateurs conscients ont l’impression de voir leurs données leur échapper. Mais qui peut se passer de smartphone, de compte bancaire, de voiture, de carte vitale ? Cela pose aussi le problème des failles de sécurité, de piratage, mais aussi de l’endroit où elles sont hébergées. Comment sont protégées ces données ? Autre souci : la différence entre les grosses entreprises qui peuvent acheter des outils ou louer les services de spécialistes dans le domaine du Big data et les PME qui n’ont pas accès à cette mine d’informations. Cela entrave la libre concurrence. Les gros seront encore plus gros…

Laisser un commentaire