20. december 2019

Ny bevilling til forskning i syntetiske sundhedsdata

Data

Nu skal et nyt forskningsprojekt arbejde hen imod en metode, som kan generere syntetiske data ud fra originale data. Projektet er støttet af Novo Nordisk Fonden.

Billede af koderEt nyt forskningsprojekt forankret på Københavns Universitet skal forske i syntetiske sundhedsdata. Projektet vil udvikle og forfine en metode, som kan generere syntetiske datasæt ud fra originale data. Novo Nordisk Fonden støtter projektet med 7,5 millioner kroner.

”Data skal bruges til det formål, de er indsamlet til. Det er et godt udgangspunkt, for vi skal vide, hvad vores data bliver brugt til. Samtidig ser vi et stort behov hos sundhedssektoren for at udvikle nye løsninger, hvilket imidlertid kræver, at det bliver muligt at dele data på en mere smidig måde. Syntetiske data kan hjælpe med at opfylde dette behov, fordi de baserer sig på originale data, men er renset for alle detaljer, der kan føres tilbage til de originale data og dermed de personer, som afgav dem,” siger Henning Langberg, Professor ved Institut for Folkesundhedsvidenskab, Københavns Universitet, og modtager af bevillingen fra Novo Nordisk Fonden.

Open source-tilgang skal sikre kvaliteten

Projektet, som hedder Synthetic Health And Research Data (SHARED), er et proof of concept-projekt, der skal vise, om det er muligt at finde en metode, som faktisk kan transformere originale data til syntetiske data på en måde, så det bliver umuligt at spore dem tilbage til ophavspersonerne. De syntetiske data bliver skabt ved, at et originalt datasæt køres igennem et matematisk program, som lægger støj på datasættet på en måde, så de syntetiske data ikke kan henføres til konkrete personer og samtidig bibeholder en spredning og sammenhæng, som gør dem statistisk valide. Det giver mulighed for at dele data uden at gå på kompromis med datasikkerheden.

”En gennemarbejdet og sikker model, der kan generere syntetiske data, kan hjælpe med at udnytte det store potentiale, der ligger i at udlede nye sammenhænge fra vores fælles sundhedsdata på en forsvarlig og sikker måde. Resultaterne fra projektet kan få stor betydning for både forebyggelse og behandling, ikke bare i den danske sundhedssektor, men i hele Norden,” siger Niels-Henrik von Holstein-Rathlou, Head of Biomed, Novo Nordisk Fonden.

Sammen med de finske samarbejdspartnere Turku University Hospital og Institute for Molecular Medicine Finland (FIMM) skal Henning Langberg både arbejde med at udvikle en matematiskmetode, som kan omdanne de originale data til syntetiske data, og med at afprøve de udviklede metoder og modeller i et såkaldt testbatteri, hvor det er muligt at teste, hvor godt de syntetiske data ligner de oprindelige data.

”Den store udfordring for os er at få så mange parametre som muligt med i programmet, så vi får mulighed for at bevare sammenhængen mellem data. Samtidig er det vigtigt for os at have en open source-tilgang til udviklingen af metoden, så det akademiske samfund undervejs kan stille relevante spørgsmål til metoden. Det er nødvendigt, når vi arbejder med et så følsomt og reguleret område, som sundhedsdata er,” forklarer Henning Langberg.