Un milliard de requêtes sont lancées chaque jour sur Google. C’est en analysant cette matière brute que le moteur de recherche a lancé l’année dernière Google Flu Trends, un service cartographique qui suit en temps réel la progression de la grippe saisonnière. Il se limitait jusqu’à présent aux Etats-Unis. Aujourd’hui, 8 octobre, le moteur de recherche étend cet outil de veille sanitaire à une vingtaine de pays. En France, le service est baptisé Google.org : suivi de la grippe.
Le processus d’élaboration utilisé par Google est sujet à discussion et reste expérimental. Le moteur de recherche part du principe que les recherches effectuées par les internautes sur le thème de la santé sont bien souvent le reflet des pathologies qu’ils présentent. La preuve en est que l’expression « coup de soleil » connaît un pic d’utilisation en été, de même que le mot « grippe » en hiver.
Identifier les mots-clés
Naturellement, une équipe d’une dizaine d’ingénieurs et de statisticiens a travaillé à affiner et à modéliser ce constat général. La première difficulté est d’arriver à isoler les mots-clés utilisés par les gens atteints des symptômes de la grippe.
« Les internautes ont des profils variés, ils n’emploient pas le même vocabulaire qu’un médecin, il n’est pas facile de déceler les phrases qu’ils vont employer », reconnaît Corrie Conrad, chef de projet du Suivi de la grippe au sein de Google.org.
Les chercheurs ont donc sélectionné une palette de mots-clés liés à la grippe (« toux », « fièvre », « éternuements »…) et ont modélisé leur fréquence d’utilisation, sur plusieurs années, sous forme de courbes.
Ces graphiques sont ensuite mis en parallèle avec les données fournies par des organismes de veille sanitaire. En France, Google a utilisé les statistiques établies par le réseau Sentinelle de l’Institut national de la santé et de la recherche médicale (Inserm), un système qui recueille et analyse les données épidémiologiques émanant de milliers de médecins.
Google a ainsi pu sélectionner les mots-clés qui connaissent des pics de fréquence d’utilisation identiques à ceux de la progression de la grippe saisonnière. Ce sont eux qui servent de marqueurs pour évaluer la progression de l’activité virale. Leur fréquence dans les requêtes des internautes, croisée avec des données de géolocalisation obtenues avec l’adresse IP de l’internaute, sert à déterminer si un pays ou une région se situe en zone de propagation minimale, basse, modérée, élevée ou très élevée. La mise à jour est quotidienne.
L’exposition médiatique, source d’erreurs
Le système a ses failles. Il est en effet difficile de distinguer les requêtes effectuées par une personne infectée de celles d’une autre cherchant simplement à s’informer sur la maladie.
Google reconnaît aussi que l’exposition médiatique du virus de la grippe peut fausser les données. « En 2005, nous avons enregistré un pic de requêtes liées à la grippe alors qu’il n’y avait pas d’épidémie. Cela correspondait à la médiatisation de la grippe porcine », explique Corrie Conrad.
Au fil des saisons, Google va vérifier que ses prévisions sont cohérentes avec les données chiffrées fournies par les organismes de surveillance officiels et faire évoluer son modèle statistique en fonction des résultats.
Reste une inconnue. Quel est le réel intérêt de cet outil cartographique ? Google le présente comme un complément des services de veille classique, qui a l’avantage de détecter précocement les épidémies de grippe grâce à une mise à jour quasiment en temps réel. Les services de santé publique pourraient ainsi réagir plus rapidement aux épidémies.
Mais Google le destine aussi au grand public et met ses données en libre accès sur un site Web avec force explications sur le modèle de calcul développé. Voilà qui risque de favoriser certaines psychoses, hormis dans le Limousin et l’Auvergne, exclus pour l’instant du système faute d’avoir obtenu des résultats probants.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.