11 millioner til udvikling af syntetiske sundhedsdatasæt
Et forskningsprojekt med forskere fra Københavns Universitet og Aalborg Universitet har modtaget 11,3 millioner kroner fra Novo Nordisk Fonden til at udvikle og teste metoder til at skabe syntetiske sundhedsdatasæt, en lovende metode, der hjælper med at beskytte patienters privatliv.
Novo Nordisk Fonden har givet 11,3 millioner kroner til et projekt, der fokuserer på syntetiske sundhedsdatasæt. Forskningen vil forhåbentlig hjælpe prototyper og træning af datamodeller inden for sundhedsdatavidenskab hurtigere på vej. De syntetiske sundhedsdatasæt er datasæt, der ikke bygger på faktiske patientdata, men er ikke-følsomme computer-generede data, der lettere kan deles og bruges til test og udvikling af modeller.
Projektet hedder ”SE3D: Synthetic health data: ethical development and deployment via deep learning approaches” og er et samarbejde mellem Københavns Universitet og Aalborg Universitet. Det er en del af Novo Nordisk Fondens Foundation Collaborative Research Programme i data science.
Om projektet
Hvad handler projektet om, og hvorfor er det vigtigt?
Vores projekt handler om at udvikle og teste metoder til at skabe syntetiske sundhedsdatasæt, en lovende tilgang til at dele indsigter kodet i personlige sundhedsdata samtidig med at beskytte patienters privatliv. Selvom vi ikke forventer, at syntetiske datasæt vil erstatte følsomme datasæt til understøttelse af forskningsresultater, håber vi, at vi kan lette designet af projekter i den tidligere fase og i hypotesegenereringen. Og så håber vi, at det kan give metoder til en mere effektiv ansøgningsproces til data adgang og gøre udviklingen af prototyper og træningen af datamodeller inden for sundhedsvidenskab hurtigere.
Hvad giver bevillingen mulighed for?
Bevillingen støtter et 4-årigt samarbejde mellem forskere på Aalborg Universitet og Københavns Universitet, der specialiserer sig i biostatistik og præcisionsmedicin, generativ modellering og regulatoriske forhold samt GDPR. Vi vil derudover ansætte flere ph.d.er og postdocs til at udvikle syntetiske datasæt og evaluere privatlivsmetrikker, vurdere privatlivsrisikoen fra et reguleringsmæssigt perspektiv og foretage grundige sammenligninger af disse faktorer på tværs af forskellige benchmark-datasæt for at etablere retningslinjer for brugen af syntetiske sundhedsdatasæt.
Hvad håber I, at bevillingen vil ændre for fremtidig forskning?
Vi håber at kunne tilbyde nye beregningsmetoder til oprettelse af syntetiske datasæt, som bedre kan imødekomme de udfordringer, der er ved at arbejde med ”rigtige” sundhedsdata, og at de er godt konstruerede til GDPR-overholdelse. Og vi håber, at vi kan producere syntetiske datasæt, der egner sig til god dataforskning og modelprototyper. Vi vil gerne beskytte patienternes privatliv og samtidig realisere potentialet for syntetiske datasæt til at støtte datadrevet forskning inden for sundhedssektoren.
Om forskerne
Anders Krogh
Anders Krogh er professor ved Institut for Datalogi og leder af Center for Health Data Science (HeaDS) på Det Sundhedsvidenskabelige Fakultet på KU. Han har arbejdet inden for mange områder af bioinformatik og maskinlæring, både med teori og anvendelse. Anders er sandsynligvis mest kendt for sit tidlige arbejde med skjulte Markov-modeller for biologiske sekvenser. I de senere år har Anders fokuseret på dybe generative modeller og anvendt dem på genekspressionsdata og andre bio-/medicinske data.
Jennifer Bartell
Jennifer Bartell er datalog og projektkoordinator ved Center for Health Data Science (HeaDS). Hun har en ph.d. i biomedical engineering fra University of Virginia. Hendes primære rolle hos HeaDS er ledelsen af National Health Data Science Sandbox, et trænings- og forskningscomputational infrastrukturprojekt med det formål at øge fleksibiliteten inden for sundhedsdatavidenskab blandt studerende og undervisere på fem danske universiteter. Hun arbejdede tæt sammen med professor Martin Bøgsted med at udvikle SE3D-projektet for at løse udfordringerne, som Sandbox-teamet stod over for med hensyn til forskningsvenlige ”rigtige” sundhedsdatasæt.
Kontakt
Professor Anders Krogh
anders.krogh@sund.ku.dk
Specialkonsulent Jennifer Bartell
bartell@sund.ku.dk
Pressekonsulent Sascha Kael Rasmussen
sascha.kael.rasmussen@sund.ku.dk
+45 93 56 51 68