Le N3C, d’autre part, est auditable par des milliers de chercheurs dans des centaines d’institutions participantes et est responsable devant eux, en mettant fortement l’accent sur la transparence et la reproductibilité. Tout ce que les utilisateurs font dans l’interface, qui utilise GovCloud de Palantir plate-forme, est soigneusement préservé, afin que toute personne ayant accès puisse revenir sur ses pas.
« Ce n’est pas sorcier, et ce n’est pas vraiment nouveau. C’est juste un travail difficile. C’est fastidieux, cela doit être fait avec soin et nous devons valider chaque étape », explique Christopher Chute, professeur de médecine à Johns Hopkins qui co-dirige également N3C. « La pire chose que nous puissions faire est de transformer méthodiquement les données en déchets qui nous donneraient de mauvaises réponses. »
Force brute
Haendel souligne que ces efforts n’ont pas été faciles. « La diversité de l’expertise qu’il a fallu pour que cela se produise, la persévérance, le dévouement et, franchement, la force brute, sont tout simplement sans précédent », dit-elle.
Cette force brute est venue de nombreux domaines différents, dont beaucoup ne font pas traditionnellement partie de la recherche médicale.
« Avoir tout le monde à bord de tous les aspects de la science a vraiment aidé. Pendant le covid, les gens étaient beaucoup plus disposés à collaborer », explique Mary Boland, professeur d’informatique à l’Université de Pennsylvanie. « Vous pourriez avoir des ingénieurs, vous pourriez avoir des informaticiens, des physiciens, toutes ces personnes qui ne participent pas normalement à la recherche en santé publique. »
Boland fait partie d’un groupe utilisant les données du N3C pour déterminer si le covid augmente les saignements irréguliers chez les femmes atteintes du syndrome des ovaires polykystiques. En dehors de covid, la plupart des chercheurs doivent utiliser les données des réclamations d’assurance pour obtenir une base de données suffisamment grande pour les analyses au niveau de la population, dit-elle.
Les données sur les réclamations peuvent répondre à certaines questions sur l’efficacité des médicaments dans le monde réel, par exemple. Mais ces bases de données manquent d’énormes quantités d’informations, y compris les résultats de laboratoire, les symptômes signalés par les personnes et même si les patients meurent.
Collecte et nettoyage
En dehors des bases de données de réclamations d’assurance, la plupart des collaborations de données de santé aux États-Unis utilisent un modèle fédéré. Les participants à ces études acceptent tous de formater leurs propres ensembles de données dans un format commun, puis d’exécuter des requêtes auprès du collectif, telles que la proportion de cas graves de covid par groupe d’âge. Plusieurs collectifs internationaux de recherche sur le covid, dont le Sciences et informatique des données de santé observationnelles (OHDSI, prononcé « Odyssée »), fonctionnent de cette manière, en évitant les problèmes juridiques et politiques avec les données transfrontalières des patients.
L’OHDSI, qui a été fondé en 2014, compte des chercheurs de 30 pays, qui détiennent ensemble les dossiers de 600 millions de patients.
« Cela permet à chaque institution de conserver ses données derrière ses propres pare-feu, avec ses propres protections de données en place. Il n’est pas nécessaire de déplacer les données des patients d’un côté à l’autre », explique Boland. « C’est réconfortant pour beaucoup d’endroits, surtout avec tout le piratage qui a eu lieu ces derniers temps. »
L’article Il a fallu une pandémie, mais les États-Unis ont enfin (quelques) données médicales centralisées est apparu en premier sur zimo news.