Quand les médias évoquent le Big Data, on comprend qu'il s'agit d'une masse importante d'informations, mais on sait peu d'où celles-ci proviennent, comment elles sont gérées, et ce qu'elles peuvent apporter ou coûter à l'humanité. Définition.
Avec l'émergence des "Nouvelles" Technologies de l'Information et de la Communication, l'Homme a construit la Société de l'Information, où les données deviennent peu à peu la matière première dominante de nos économies. Rapidement, nous avons du ré-apprendre à gérer l'information : recherche, production, stock, tri, partage, analyse, croisement, synthèse, sauvegarde, etc.
Baptisées "le pétrole du XXIème siècle", les données informatiques sont produites en permanence et à une vitesse croissante : elles proviennent de tous les secteurs (ex : recherche scientifique), et notamment de notre utilisation d'Internet : recherches web, commentaires sur les réseaux sociaux, produits consultés sur les sites de e-commerce, notations des vidéos en streaming, géolocalisation mobile, etc. sont autant d'informations que les internautes communiquent – souvent à leur insu – et qui en disent long sur leurs goûts, leurs centres d'intérêt, leurs habitudes, etc. Et autant de données qui sont analysées avec le plus de pertinence possible.
Le Big Data, c'est donc non seulement une masse considérable de données, mais c'est aussi une spectaculaire force de calcul informatique mise en œuvre pour les analyser, dans le but d'en retirer une valeur ajoutée supplémentaire : dépistage de risques sanitaires, découvertes spatiales, renseignement policier, développement de nouveaux modèles économiques, prévisions climatiques, nouveaux procédés marketing, etc.
La question de la confidentialité des données
Techniquement, le Big Data invite à relever de nombreux défis, notamment concernant les capacités de stockage et d'analyse. Pour exemple, la NSA créé en ce moment même un gigantesque entrepôt sous-terrain capable de stocker des millions de Yottabits (Stellar Wind, le Big Brother de demain).
Mais sur le plan sociétal, c'est le thème de la confidentialité des données qui est préoccupant : plus nous vivons dans un univers connecté, dématérialisé et urbain, et plus nous sommes sujets à la collecte de données : informations web, cartes bancaires, géolocalisation, caméras de surveillance, titres de transport, etc. Ces données, qui peuvent être considérées comme personnelles, rejoignent la masse hétérogène du Big Data, et sont potentiellement utilisées, analysées, etc.
Aujourd'hui, un véritable (mais difficile) combat est mené par des acteurs comme l'Union Européenne ou des associations de consommateurs, non pas pour interdire la collecte et l'analyse de données, mais pour que les utilisateurs/consommateurs/citoyens puissent avoir le contrôle sur leurs propres informations. Bref, intégrer au Big Data certaines règles de confidentialité, de respect et de bonne intelligence. Pas sûr que l'Homme parvienne à programmer une machine qui soit ce que lui n'a pas réussi à devenir…
Quelques chiffres sur le Big Data
- Le trafic IP va quadrupler d'ici 2015
- En 2015, 3 milliards de personnes produiront 8 zettabytes de données
- 30 milliards de contenus sont ajoutés mensuellement sur Facebook par plus de 600 millions d'utilisateurs
- 90% des données mondiales ont été créées ces deux dernières années
Articles Panoptinet connexes
Sources : lepoint.fr / Infographie de BBVAtech
Image : Flickr / bionicteaching / CC BY-NC 2.0
Laisser un commentaire