Drevet af data – Københavns Universitet

29. januar 2015

Drevet af data

Forskerprofil

Som fysiker blev Søren Brunak skolet i en grundlæggende forståelse af universets mindste dele – og ikke mindst deres betydning for den store sammenhæng. I sin aktuelle forskning surfer han over alle skalaer ved at kombinere molekylære data om kroppens byggesten med kliniske data til gigantiske meta-studier, der kan forudsige en hel befolknings sygdomsforløb.

Professor Søren Brunak57-årige Søren Brunak er professor på The Novo Nordisk Foundation Center for Protein Research, Københavns Universitet. Han er uddannet cand.scient. i fysik, men var tidligt ude med trendy tværfaglighed, da specialet delvist blev til på Neurofysiologisk Institut på Københavns Universitet. I 1991 fik Søren Brunak en ph.d.-grad i beregningsbiologi fra Danmarks Tekniske Universitet, hvor han også i dag er tilknyttet som professor.

Som pionér inden for bioinformatik var Søren Brunak én af de første i Danmark til at introducere de såkaldte neurale netværk – computermodeller inspireret af hjernens opbygning der bliver til algoritmer skabt på basis af en stor mængde data-input. 

Hvorfor er din forskning vigtig for samfundet?

Der er sket en rivende udvikling inden for datadrevet forskning i de senere år. Først og fremmest fordi det er blevet langt billigere at få adgang til data via industrialiserede eksperimentelle metoder.   Kortlægningen af det første humane genom kostede 20 milliarder kroner, men i dag er DNA-sekventering udviklet til strømlinet perfektion. Tidligere tiders biologisk forskning var oftest drevet af få personer i laboratoriekittel, der knækkede reagensrør og skrev rapporter – i dag er der tale om store internationale teams udstyret med gigantisk computerregnekraft til dataanalyse.

Min forskning foregår på en slags metaniveau, hvor det handler om at kombinere molekylære data med kliniske data for at blive klogere på sygdomsudviklingen i det enkelte menneske. Nogle mutationer driver sygdomme, andre rejser med som en slags blinde passagerer. Vores analyser med udgangspunkt i Integrativ Systembiologi kan gøre det muligt at spotte overordnede sygdomsmønstre i et uoverskueligt data-kaos.

På sigt vil individualiseret behandling vinde frem – altså behandling der tager bedre højde for hele den enkelte patients genetiske sammensætning. Det ville være nemmere at være læge, hvis vi var kloner, men alle arveanlæg varierer, og alle sygdomme er i princippet variationer over en genetisk baggrund. Perspektivet er, at du vil få ting at vide ved hjælp af bioinformatik, der kan bruges til at fortælle om sygdoms- og sundhedsforløb gennem livet. Vi kan spare mange penge som samfund, hvis vi giver folk en behandling, der er mere effektiv og målrettet.

Fortæl om et karrieremæssigt højdepunkt?

Der var stor skepsis over for vores forskningsområde i de tidlige år – både fra biologer og ikke mindst i de datalogiske forskningsmiljøer. Folk ville ikke tro på, at en computer med en data-drevet algoritme i sig selv kunne sige noget fornuftigt om nye data. Man foretrak, at den slags blev baseret på logiske slutninger: Hvis vi ved det og det om et bestemt protein, kan vi slutte, at det vil gøre sådan og sådan.

Vi var blandt de første, der brugte neurale netværk til at analysere sekvensdata. Vi kunne så at sige ’træne’ en algoritme ved at fodre den med proteinsekvenser frem for at konstruere den ud fra logiske regler og principper. Computeren arbejder intuitivt, og data kan være modstridende og ulogiske. Man kan sammenligne det med evnen til at bestemme kønnet ud fra ansigtet, som ikke er medfødt hos det lille barn. Det er en kompetence, som børn tilegner sig over tid i kraft af eksempler.

Som pionér inden for bioinformatik var Søren Brunak én af de første i Danmark til at introducere de såkaldte neurale netværk

Som pionér inden for bioinformatik var Søren Brunak én af de første i Danmark til at introducere de såkaldte neurale netværk.

Vi var først med at forudsige proteinernes postnumre – de såkaldte signalpeptider – ved hjælp af neurale netværk og såkaldt machine learning, men  metoden og resultaterne blev ikke bredt anerkendt øjeblikkeligt. I dag er vores videnskabelige artikler om emnet citeret mere end ti tusinde gange.

Hvorfor og hvornår valgte du at blive forsker?

Jeg har altid godt kunnet lide at gå i skole, og det stod derfor ret hurtigt klart for mig, at jeg skulle have en boglig uddannelse. Mine forældre var henholdsvis skolelærer og finansdirektør, så en forskerkarriere lå ikke lige for, selvom der var flere videnskabsfolk i omgangskredsen. Alsidighed er sund – min farfar var mejerist, min ældste søn er møbelsnedker. Familiens faglighed spænder altså vidt. Selv malede jeg drivhuse for erhvervsgartnere i løbet af studietiden – det var jeg faktisk ret ferm til.

Hvorfor har du valgt en universitetskarriere?

Som universitetsforsker har man stor frihed til at beskæftige sig med det, man synes er allermest interessant. Men jeg har haft masser af kontakt til industrien i løbet af karrieren – fx ved at sidde i mange scientific advisory boards i konkrete virksomheder. De metoder vi har været med til at udvikle har over 30 millioner sidevisninger på internettet per år. Titusindvis af forskere anvender dem. Man kan sige, at det er en slags e-handel uden indtjening. Til gengæld tjener universitetet så stort i form af citationer og faglig indflydelse.

Hvad laver du, når du har fri?

Jeg har fire børn på 13, 16, 20 og 30, er gift med Pernelle og bor i Ryvangskvarteret ganske tæt på mit barndomshjem ved Emdrup sø. Min kone er maler og tekstildesigner. Æstetik og indretning er – yderligere forstærket  af hende – en del af min privatperson. Jeg scanner gerne loppemarkeder i både ind- og udland. I en periode samlede jeg på gamle amerikanske køkkenmaskiner, men det er ikke must, at mine loppefund har en brugsværdi. Jeg har også en svaghed for Mercedes-biler af (lidt vel) ældre dato. Når der er tid, kan jeg godt lide at reparere og restaurere både hus og sommerhus – jeg slapper godt af med manuelt arbejde.