Accueil / Numérique / Big Data / Comment les Big data sauveront nos vies

Comment les Big data sauveront nos vies

Lorsque nous nous connectons à Internet, notre navigation laisse de nombreux indices sur notre vie personnelle. Au-delà du flot de détails intimes que nous livrons volontairement sur les réseaux sociaux ou les différents sites, le moindre de notre comportement sur la Toile est traqué. Ces métadonnées appelées "Big data" constituent un gisement impressionnant de renseignements sur nos besoins, nos envies. Les géants du numérique (Amazon, Facebook, Google, Apple) utilisent ces données pour améliorer la qualité des services proposés mais également pour les revendre à des sociétés commerciales.

Cependant, l'exploitation innovante de ces Big data permet, par le croisement de corrélations complexes, d'anticiper certains phénomènes comme, par exemple, une épidémie de grippe. Bientôt, notre connexion permanente à Internet autorisera d'identifier des possibles facteurs de risques sanitaires selon notre comportement et nos habitudes de navigation. Ces Big data permettront à grande échelle la diffusion non commerciale de messages de santé publique afin de prévenir les risques de maladies chroniques dans le monde.

Lire : numérique & santé, le baron perché.

Notre empreinte numérique : d'Altamira à Altavista

La Lettre de GaliléeDes peintures rupestres d'Altamira, première peinture préhistorique importante connue, au premier moteur de recherche textuel Altavista, l'Homme n'a cessé de laisser son empreinte, sciemment ou non. Ce défi à la postérité marque la volonté d'exister, d'anthropiser l'espace vécu. Il s’agit d’une évolution qui place l’Homme comme un être conscient de sa finitude.

Aujourd'hui encore, les choses n’ont peut-être pas beaucoup changé : grâce à Facebook, l’Homme dépeint sur son "mur" des scènes de son quotidien et livre quantité de détails sur sa vie personnelle. Max Schrems, un étudiant autrichien s’appuyant sur le droit européen, a réclamé à Facebook l’ensemble des données personnelles stockées par le réseau social pendant 3 ans : il a reçu près de 1200 pages en pdf, soit 900Mo, dont des informations personnelles qu’il avait effacées.

Nous confions une grande part de notre vie privée sur la Toile et l’essor des nouvelles technologies contribue à nous lier davantage à Internet : dans ce flux d’informations qui envahit notre quotidien et brouille les frontières entre sphère publique et intimité, nous entrons dans le monde de la "connexion permanente". Et ce ne sont pas tant les données que nous livrons volontairement que notre propre comportement qui génère une empreinte digitale.

Lire : Quand Google nous vaccinera.

Cette connexion permanente renseigne bien plus sur notre comportement que les confidences que nous livrons à nos amis sur les réseaux sociaux : l’ensemble de ces méta-données constitue un important magot pour cerner les attentes des internautes. Selon une étude américaine, les données personnelles des Européens représentent en 2012 un trésor de 315 milliards de dollars.

Pour Jean-François Fogel et Bruno Patino, auteurs de la Condition Numérique, "depuis 2007, un internaute est dépassé par son ombre numérique. Autrement dit : la majorité des données stockées sur Internet qui le concernent n’ont pas été produites par lui de façon volontaire. Ses messages, ses photos et vidéos, ses écrits sur son blog, ses contributions sur les forums de consommateurs, ses requêtes aux moteurs de recherche, ses commentaires, ses références transmises aux sites de rencontres ou d’achats et ses contributions aux réseaux sociaux ne forment que la production artisanale, forcément limitée, d’un individu. Cela pèse moins que les données produites par les systèmes qui enregistrent et analysent ses visites sur les sites, son usage des applications ; le contenu de ses messages, ses interactions, sans oublier le recensement de ses mouvements dans le monde physique réalisé par les caisses enregistreuses des magasins, les caméras de surveillance, les réseaux de téléphonie mobile ou les systèmes informatiques des entreprises. L’ombre numérique, cette part des données dues à la seule action des machines, n’est pas seulement plus importante, elle grandit également plus vite que les données créées par les humains. Partout se trouvent des traces de pas numériques laissées par le passage d’un humain qui ignore à quel point son parcours abonde en brisées. (pp.34-35)"

Lire : Données de santé, l'irrésistible aspiration de l'État

L’activité que nous générons en naviguant en permanence sur Internet constitue une ombre infinie et insaisissable, bien au-delà de ce que nous pensons. Ces vastes méta-données constituent des Big data qui peuvent révéler d’intéressants secrets.

La richesse des données d’Internet : de Cassandre à Assange

Dans la mythologie grecque, Cassandre, fille du roi de Troie, Priam, était réputée pour sa capacité à prédire l’avenir. Julian Assange, fondateur de Wikileaks, prédit une révolution aux États-Unis dans 5 ans en raison de leur instrumentalisation des réseaux sociaux. La tentation est grande de voir dans l’exploitation de ces immenses masses de données la possibilité de prévoir le comportement des individus ou des États. Le destin de chacun est-il détenu par ces nouveaux dieux numériques ?

Alors que les pythonisses lisaient dans les écuelles pour prédire les auspices, les entreprises et les institutions s’entourent désormais de "data scientist" capables de traiter à grande échelle le bruyant tourbillon des Big data. L’objectif de ces spécialistes du marketing numérique est de découvrir dans ce flot d’informations le comportement des internautes et d’anticiper leurs envies afin de proposer des contenus individualisés et adaptés à leurs besoins spécifiques. L’exemple le plus illustratif est celui de Google : "le moteur [de recherche] aide l’utilisateur, sans que celui-ci ait à effectuer une transaction financière, en échange de la prise de connaissance de ses données, parfois limitées à la demande elle-même. (…) Le tarif correspond à un troc : service for data, un service contre des données." Tout passe au filtre de sa capture de données : les courriers, les documents, les photos géolocalisées, les requêtes formulées autant que les choix effectués parmi ces requêtes. "Quand nous recherchons, quand nous partageons, quand nous hébergeons sur un site pour mettre à disposition, nous payons. En échange de la recherche, du partage ou de la copie, nous laissons un peu de nous mêmes : des renseignements sur notre identité, nos goûts, nos modes de vie, nos liens. De l’éphémère souvent, du plus durable parfois. Cela semble sans valeur. Élevés dans l’univers économique traditionnel de la valeur travail, nous ne percevons pas que nous transmettons ainsi une part de notre capital. Cette part, ce sont nos données, personnelles et comportementales, qui deviennent des "métadonnées", de l’information sur l’information qui nourrit une connaissance à très haute valeur des comportements individuels. (pp.137-138)".

L’utilisation de ces métadonnées, de ces Big data, a pour objectif de répondre aux attentes des internautes le plus finement possible. Le comportement de l’utilisateur induit une boucle vertueuse qui revient vers lui pour proposer un contenu sans cesse plus pertinent. Il s'agit d'un service qui observe en détail le comportement de chaque internaute en passant en revue le moindre de ses faits et gestes sur la Toile. En échange de ce service, quelques géants du numériques comme Google, Apple ou Facebook exploitent commercialement l’ensemble de ces Big data. Ils font de ces données des biens privés qu'ils revendent.

Hubert Guillaud, dans un excellent article sur les Big data, tiré de sa lecture de l'ouvrage de Viktor Mayer-Schönberger et Kenneth Cukier, intitulé Big Data: A Revolution That Will Transform How We Live, Work and Think, nous rappelle comment l'analyse innovante des Big data permet la prédiction. L'analyse de cette masse de métadonnées, d'informations sur l'information, permet d'établir des algorithmes prédictifs. Le traitement à grande échelle des Big data autorise, par exemple, d'anticiper l'épidémie de grippe : c'est ce que réalise Google Flu en combinant des termes de recherche dans le moteur de recherche Google en corrélation avec les prédictions sanitaires existantes. "Leur logiciel a trouvé une combinaison de 45 termes de recherches qui, quand ils sont utilisés ensemble selon un modèle mathématique, forment une forte corrélation entre les prédictions et les chiffres officiels". L'analyse des Big data crée une valeur ajoutée, une corrélation que nous ne pouvions, à petite échelle, observer auparavant. "Le but n'est pas de comprendre le pourquoi mais uniquement le comment". Les algorithmes ainsi construits ne sont pas basés sur la causalité mais sur des corrélations jusque-là inobservées.

Nous entrons dans un monde de prédictions basées sur des constantes qui pourraient ne pas être en mesure d'expliquer les raisons de nos décisions

De la prédiction à la prévention

brazil45

Image tirée du film Brazil réalisé par Terry Gilliam en 1985

 

Néanmoins, les auteurs, rappelle Hubert Guillaud, préviennent des dérives possibles engendrées par ces algorithmes prédictifs à partir de l'utilisation secondaire de nos données personnelles. "Le principal risque des Big Data ne porte pas tant sur la vie privée que sur le risque que nous soyons amené à juger les gens non pas sur leur comportement réel, mais sur leur propension à avoir le comportement que les données leur prêtent. Le monde social n'est pas né avec les Big Data, mais celles-ci pourraient bien nous y enfermer. Certes, concèdent les auteurs, le Prométhé moderne, l'homme capable de gérer son destin est une profonde illusion. Si nous ne croyons plus au déterminisme de nos ancêtres, notre capacité à façonner notre destin pourrait bien être altéré par la technologie. Car notre potentialité risque d'être demain abattu sur l'autel de la probabilité. Selon votre milieu social, vos résultats scolaires, votre cercle de relations... votre avenir pourra être tracé par les algorithmes. (...) Le risque est bien demain qu'on punisse les gens pour leurs penchants, pour leurs relations, plutôt que pour leur action."

S'il est indéniable que les corrélations établies par ces algorithmes peuvent être hasardeuses voire dangereuses, elles constituent un puissant outil de santé publique. Si les géants du numérique ont acquis grâce à ces algorithmes une connaissance extrêmement poussée et fine des attentes de leurs internautes, il est tout à fait possible de proposer une prévention des risques sanitaires par des messages informatifs, des publicités ciblées, etc.

Aujourd'hui, ce ciblage marketing est réalisé uniquement dans une optique commerciale. Les Big data sont un patrimoine privé, très lucratif pour les quelques géants du numérique qui se partagent ce magot. Mais on peut très bien imaginer, sur la base des travaux du prix Nobel d'économie, Elinor Ostrom, "La Gouvernance des Biens Communs", des arrangements institutionnels pour transformer ces données privées en bien commun. Loin d'organiser une traque à la déviance des individus, l'utilisation institutionnelle des données comportementales des internautes permettrait de cibler les messages de santé publique auprès des populations à risque.

On peut imaginer une étude scientifique analysant à très grande échelle le comportement sur Internet des personnes atteintes de maladies chroniques comme le diabète afin d'identifier -ou pas- les corrélations possibles entre les habitudes de navigation et les facteurs de risque. Lorsque l'on sait, par exemple, selon une étude sur la connaissance du diabète dans le monde arabe (Algérie, Égypte, Iran, Irak, Jordanie,  Liban, Maroc, Arabie Saoudite, Tunisie et Emirats Arabes Unis) réalisée par Novo Nordisk en novembre 2010, que 74 % des gens diabétiquement à risque ne le savaient pas et 40% considérant le diabète comme une maladie bénigne. La prévention comportementale constitue un puissant levier de santé public pour combler ce fossé informationnel.

Selon un récent sondage OpinionWay-Le Figaro, si 88% des Français sont conscients qu'exercer une activité physique est essentielle pour sa santé et la gestion de son poids, seulement 12% disent pratiquer plus de 2 heures par semaine (parmi lesquels majoritairement des populations jeunes, diplômées et disposant de hauts revenus). La géolocalisation permanente des applications et des supports (téléphones, tablettes, ordinateur) pourrait permettre d'affiner la compréhension des habitudes de vie des internautes et leur proposer le téléchargement d'applications incitant à exercer une activité physique, des spots d'information sur la valeur calorique des aliments souvent sous-estimée, etc. Depuis le début du mois, Google propose aux États-Unis l'adjonction de la valeur nutritionnelle des aliments recherchés dans son moteur.

La connexion permanente que nous entretenons avec Internet mais également avec le monde de la consommation, toutes nos habitudes de vie peuvent être analysées, décortiquées. En ce sens, les tickets de caisse pourraient faire figurer la valeur nutritionnelle de nos achats, nos applications de téléphone nous guider vers des habitudes plus saines.

Alors que nous recevons en permanence des liens sponsorisés (sur Twitter par exemple), des publicités ciblées sur nos comportements (sur Google ou Facebook), voire parfois des mails commerciaux dans notre boîte aux lettres, pourquoi ne pas imaginer une collaboration étroite avec les géants du numérique et les instances gouvernementales de santé publique pour relever le défi de la prévention comportementale à partir de l'exploitation secondaire et non-commerciale des données personnelles des internautes ? Les Big data permettent de prédire une épidémie de grippe à partir des comportements de recherche des internautes; les métadonnées permettront très rapidement de sauver des vies et améliorer les conditions de vie ainsi que les habitudes dans la vraie vie des internautes.

Si, face à l'essor des nouvelles technologies, tout le monde s'accorde à penser le changement de paradigme de santé publique, personne ne sait encore lire de manière innovante cette rupture. C'est certainement l'utilisation innovante et humaine de ces Big data qui permettront de relever les défis que pose cette rupture paradigmatique. Mais comme le soulignent les auteurs de Big data cités par Hubert Guillaud : "Dans un monde de grands volumes de données, ce sont nos traits les plus humains (les moins rationnels) qui doivent être encouragés : notre créativité, l'intuition, l'ambition et notre ingéniosité. Comme aurait pu le dire Henry Ford, si on avait interrogé les algorithmes et les données pour savoir ce que les clients voulaient, les Big Data auraient répondu "un cheval plus rapide" : elles n'auraient pas inventé la voiture ! Les Big Data sont une ressource et un outil. Elles sont destiné à informer plutôt qu'expliquer. (...) Tout éblouissantes soient-elles, toutes puissantes soient-elles, nous ne devons jamais nous laisser séduire par leur lumière et en oublier leurs imperfections inhérentes."

Crédits photos : Grasset, Imdb.

À propos de Vincent Fromentin

Blogueur santé et directeur de publication de La Lettre de Galilée. Voir tous ses articles.
  • La médecine personnalisée de demain, un magnifique argument marketing pour des vendeurs de soupe ?

    L’arrivée à grand renfort de puissants arguments marketing d’une nouvelle médecine
    personnalisée ou de précision grâce à l’omique et l’analyse de centaines de milliards de données n’est-elle pas un effet de mode, comme on a eu celle de la thérapie génique il y a 20 ans, et qui n’a guerre sauvé que quelques bébés bulles … N’est-il pas temps de réagir vis à vis des vendeurs de rêve et parfois de soupe, de manière parfois aussi excessive que ces derniers !

    Le clonage du génome humain en 2003 a-t-il réellement changé de manière radicale
    la donne en terme de prédiction et prévention de maladies ?

    Le cancer va-t-il réellement être vaincu compte-tenu de son pouvoir malin à s’adapter à cause de la médecine personnalisée ? Ou bien plutôt par les
    méthodes radicales de suppression des facteurs de risque comme le tabac,
    l’alcool ou l’exposition à la pollution, et la détection précoce améliorée ?

    Les big datas générées seront-elles fiables ? Exploitables ? Interopérables ? Transformables en valeur ajoutée ? Accessibles ? Et appartenant à qui ?

    Les outils informatiques comme Watson seront incontestablement capables de
    traiter plus vite et mieux que des centaines de médecins toutes les données
    pour mieux nous traiter, encore faudra-t-il être sûr que les études utilisées
    sont fiables et reproduites (ce qui est loin d’être le cas, avec par exemple
    l’initiative internationale actuelle et ses difficultés à reproduire 50 très grandes
    études internationales déjà publiées), et qu’on aura éliminé tous les biais,
    liés en particulier à la non publication des études négatives !

    Enfin, comment sera financée cette médecine personnalisée ou de précision, car
    c’est un leurre de faire croire qu’elle fera diminuer les couts ! Economiquement
    et probablement médicalement, c’est plus faisable et utile de donner des
    médicaments au grand nombre, plus vite amortis que développer des médicaments
    pour peu à des prix incompatibles avec la survie de notre modèle social !

    Enfin, le problème éthique de la médecine des riches et des pauvres devra être
    abordé, car seuls les premiers pourront se l’offrir si jamais ces promesses se
    réalisent …

    Soigner les gens sur des bases individuelles est ce que nous sommes censés faire comme professionnels de santé depuis la nuit des temps, abordant avec empathie chaque cas particulier de la meilleure façon possible, en utilisant les techniques de
    la médecine basée sur des preuves, avec ses bons et ses mauvais côtés, bien
    sur ! Et les progrès mondiaux en terme de santé publique ont été obtenus
    jusqu’à aujourd’hui par des améliorations socio-économiques et des avancées
    médicales (comme la vaccination ou les antibiotiques) réalisées pour l’ensemble
    de la population, par pour certains …

    Halte à un certain terrorisme intellectuel dicté mélangé à du conflit d’intérêt
    tellement visible qu’il en est risible le plus souvent …

x

Lisez-aussi

La Lettre de Galilée

Polnareff, Cannes et l’avenir de la santé

Éditorial de la 359 Éric Le Boucher n'avait certainement pas tort la ...

En continuant à utiliser le site, vous acceptez l’utilisation des cookies. Plus d’informations

Les paramètres des cookies sur ce site sont définis sur « accepter les cookies » pour vous offrir la meilleure expérience de navigation possible. Si vous continuez à utiliser ce site sans changer vos paramètres de cookies ou si vous cliquez sur "Accepter" ci-dessous, vous consentez à cela.

Fermer