Lars Juhl Jensen – Københavns Universitet

Det Sundhedsvidenskabelige Fakultet ved Københavns Universitet
Resize Print Bookmark and Share

Sundhedsvidenskab > Månedens profil > Lars Juhl Jensen

01. december 2010

Lars Juhl Jensen

Avancerede computer-programmer, enorme databaser og proteiner

Bevæbnet med en moderne computer og sin viden om matematik og molekylær biologi arbejder Lars Juhl Jensen på at lave brugbare forudsigelser af, hvordan kroppens byggeklodser, proteinerne vekselvirker med hinanden i store komplekse netværk. Bioinformatik drejer sig netop om at lade moderne computerkraft regne på enorme biologiske datasæt, og her er hans arbejde så fremragende, at Lundbeckfonden giver ham årets Yngre Forsker 2010 pris.

Af Malene Steen Nielsen Flagga  

Lars Juhl Jensens gymnasietid gjorde ham interesseret i naturvidenskab og matematik, og især i kemi. "Jeg havde det nok hjemmefra," husker han," for min mor er uddannet farmaceut. Efter gymnasiet var det mest et spørgsmål om, hvilket kemistudie jeg skulle vælge. "

Lars Juhl Jensen så sig om i det uddannelsesmæssige landskab, og da han ikke var helt sikker på, hvilken kemisk vej han ville gå, valgte han DTU: "Her var mest fleksibilitet," fortæller han. "Den gang betød studieordningen, at man efter første år stort set ikke havde nogen faste fag. Og i forhold til andre uddannelser, så havde DTU lidt mere matematik på kemi-uddannelsen - og det kunne jeg godt lide. Matematik er nødvendigt, hvis du vil lave kemiske modeller og simulationer."

Nemmere at forudsige reaktioner i organisk kemi 

Fra start fokuserede Lars Juhl Jensen på uorganisk kemi, men i løbet af studiets første del gled han stille og roligt forbi organisk kemi og biokemi til molekylær biologi: "Uorganisk kemi er en masse udenadslære om hvilke forbindelser, der gør hvad, for stofferne er så forskellige. I organisk kemi, i kulstofkemi, minder forbindelserne om hinanden, du kan kigge på en struktur og forudsige, hvad den vil gøre. Så da jeg nåede til midtvejsprojektet skrev jeg i emnet bioinformatik hos professor Søren Brunak. Det fag drejer sig dybest set om at bruge en computer til at analysere biologiske datasæt; og da moderne laboratorier er fulde af tekniske, eksperimentelle metoder og apparater, der kan producere større og større mængder data, får vi mere og mere behov for computermetoder til at analysere al den data. For der er simpelthen for meget til at man kan kigge på det manuelt."

Midvejsprojekt om regulering af DNA

Da alle celler i kroppen indeholder det samme DNA, har forskellige celler forskellige "bogmærker", som bliver sat ind ved de gener, der skal være aktive i en bestemt celle.

"En levercelle skal jo lave noget andet end en muskelcelle," fortæller Lars Juhl Jensen. "Men hvordan ved bogmærkerne, hvor de skal sidde henne? Det afhænger i et vist omfang af, hvad der "står" lige før genet. Derfor er der nogle sekvenser af nukleotider, G'erne, A'erne, T'erne og C'erne, nogle områder, typisk kort før generne, som proteiner kan binde til. Når det sker, så bliver genet udtrykt, det vil sige, genet laver det protein, som det koder for. Mit midtvejsprojekt gik så ud på at forudsige, hvilken sekvens af nukleotider et givet bogmærke binder til. Jeg kiggede på et antal gener, som vi ved, laver noget sammen, og som derfor skal udtrykkes på ca. samme tidspunkt. De har nok en regulatorisk sekvens til fælles, og bliver reguleret af den samme type bogmærke."

Sådan får man overblik over tusindvis af gener

Midtvejsprojektet gjorde Lars Juhl Jensen så interesseret i bioinformatik, at han bagefter tog flere matematiske fag. Hans speciale var både en fortsættelse af forsøget med at forudsige regulatoriske sekvenser, og en visualisering af bakterielle genomer, som var blandt de eneste, der i sen-90'erne var blevet kortlagt.

"Dengang som nu gælder det om at få et overblik over et genom. Hvordan håndterer man tusindvis af gener, så man kan se det store, samlede billede? Et E. coli genom er 4,6 mio. bogstaver (G, A, T og C) langt og cirkulært, som hos andre bakterier. Jeg fokuserede på grundlæggende egenskaber som antallet af A'er og T'er i forhold til G'er og C'er, samt kendte metoder, der viser, hvor fleksibelt DNA er. Til sidst får du computeren til at visualisere genomet med forskellige farveskalaer, så man kan se, om nogle regioner skiller sig ud."

Kan vi forudsige proteiners egenskaber udfra sekvensen? 

Og så var Lars Juhl Jensen uddannet kemiingeniør. "Det ændrede ikke så meget," fortsætter han." For inden jeg afleverede specialet, havde jeg besluttet at forsætte med en phd, også hos Søren Brunak. Jeg ville lære noget nyt igen, så jeg hoppede over på et andet projekt, et forsøg på at forudsige funktionen af proteiner, hvor alle andre metoder har fejlet." Forskerne kan tage et protein og sammenholde det med viden i store databaser, som i dag er tilgængelige, og lede efter noget, der ligner. Proteiner med samme strukturelle opbygning har ofte samme type biologiske funktion, da naturen elsker genbrug.

"Men hvad med de proteiner, hvor den metode ikke virker?", spørger han. "Når et givet protein hverken ligner noget som helst andet, eller kun ligner andre, ukendte proteiner? Det er ofte tilfældet. Faktisk er det de færreste proteiner, hvis funktion vi kender fuldt ud selv i dag. Vi ved måske, at et protein sætter fosfatgrupper på andre proteiner - og altså er en kinase - men så ved vi ikke, hvilke proteiner, det sætter fosfatgrupper på, og så videre."

Lars Juhl Jensen startede så et phd-projekt, som skulle studere helt ukendte proteiner. "Kan vi prøve at putte dem ned i nogle brede kasser måske? Ideen var igen at kigge på egenskaber, fx hvor bøjeligt er det, hvor stort, ligner det noget, der sidder i cellens membran, eller noget der flyder rundt inde i cellen? Har det pladser på overfladen, hvor der kunne blive sat fosfatgrupper på? Det kan man lave forudsigelser af, ved at se på proteinets sekvens af aminosyrer. Ikke for at sammenligne den med andre sekvenser, men derimod kigge på selve proteiners egenskaber med analysemetoder, som allerede fandtes. Har du først et program, som kan genkende fx fosforylerings-sites på proteiner, så kan du starte med at bruge programmet på en masse kendte proteiner, som allerede er puttet i de brede kasser. På den måde kan man finde nogle trends. Dem i kasse A er mindre end gennemsnittet. Dem i kasse B sidder ofte i membraner. Dem i kasse C har ofte et fosforylerings-site i slutningen. Og så videre. Og når man så har fundet de egenskaber, som proteiner i de forskellige kasser har til fælles, så kan man bruge programmet på et helt ukendt protein. På den måde kan man forudsige de forskellige egenskaber, som det ukendte protein nok har, og få det puttet ned i nogle af kasserne. Det gjorde jeg til min phd."

Biologisk signallering er komplekse netværk af proteiner 

Derefter valgt Lars Juhl Jensen at fortsætte med proteinerne. "Men nu ville jeg studere, hvordan de vekselvirker med hinanden," siger han. "Og det er faktisk det, jeg stadig arbejder med. Der er mange udfordringer ved at forstå protein-vekselvirkninger, for et protein arbejder ikke alene, men er del af et kompleks, et netværk. Skal vi forstå de biologiske processer, må vi zoome lidt ud, og forstå de større sammenhænge mellem proteinerne."

Lars Juhl Jensen så sig om i verden efter steder, hvor forskere arbejde med bioinformatik på proteinnetværk. "De rigtigt gode steder kunne tælles på én hånd," husker han.  Der var to grupper i USA og så Peer Bork's gruppe på European Molecular Biology Laboratory, Europas molekylærbiologiske flagskib i Heidelberg, Tyskland.

"Jeg havde ikke lige lyst til at flytte til USA, så jeg startede som postdoc hos Peer i 2003, og gik i gang med at se på protein-interaktions-netværk.  Formålet var at udvikle og kombinere metoder, der kunne forudsige nogle af protein-vekselvirkningerne. Den database er fortsat og videreudviklet lige siden. Man kan fx spørge databasen om et protein, og få at vide, hvilke andre proteiner det sandsynligvis vekselvirker med. Jeg lavede også text-mining for at trække oplysninger om proteinvekselvirkninger ud fra millioner af artikler - de oplysninger findes også i databasen. Det er et enormt arbejde, og udviklingen af databasen er i dag et samarbejde mellem os her i København, en gruppe på Zürich Universitet og Peer Bork's gruppe. Samtidig arbejdede jeg med at afbillede et tidsligt aspekt af en celles cyklus, og brugte netop interaktionsnetværk i kombination med data om, hvornår i cellens cyklus, at bestemte gener var udtrykt - altså systembiologi."

NNF Center for Protein Research - på det helt rigtige tidspunkt 

Lars Juhl Jensen tilbragte tre år i Heidelberg og var udnævnt til Staff Scientist, da han begyndte at lede efter en gruppelederstilling. "Jeg var i begyndelsen af 30'erne, havde CV'et til det, og pludselig modtog Københavns Universitet 600 mio. til et spritnyt forskningscenter i proteiner, som bl.a. skulle bruge en gruppe, der beskæftigede sig med præcis det, jeg gik rundt og lavede. Det var ret god timing for mig, der som dansker, og opvokset i Københavnsområdet, tænkte på, at danne min egen gruppe et sted."

Som professor m.s.o. på Novo Nordisk Foundation Center for Protein Research er Lars Juhl Jensen vejleder for 12 phd-studerende. "Hvis studerende vil skrive phd hos mig, så er det klart en fordel, hvis de ikke er dumme med en computer. Matematiske fag er ikke et krav, men det er naturligvis en kæmpemæssig fordel, hvis folk ved, hvordan man programmerer. De folk hænger desværre ikke på træerne i dag. Vi kan godt tage folk, der ikke før har programmeret, de skal bare være villige til at lægge den ekstra arbejdsindsats der er i at lære det, og det tager nok omkring ½ år." ´

Forudsigelse af aktørerne i biokemiske netværk

Selv arbejder Lars Juhl Jensen videre med metoder, til at forstå cellens signaleringsnetværk. "Vi bruger den type data, som vi får fra fx Jesper Olsens gruppe, der laver proteomics massespektroskopi. Metoden skaffer viden om proteinerne ved, dybest set, at slå dem i stykker og veje stumperne på en meget præcis vægt, og kan give info om fosforyleringssites, altså identificere de steder i et protein, hvor det er modificeret. Hvorvidt et enzym er aktivt eller passivt styres fx af, om der sidder en fosfat på eller ej. Det kan styre hvor i cellen det befinder sig, eller om proteinet bliver nedbrudt. Med et enkelt eksperiment kan deherrer inde ved siden af finde over 10 000 fosforyleringssites. Og da der er hele 500 forskellige kinaser, som kan sætte fosfatgrupper på andre proteiner, ville det mildest talt tage sin tid hvis man skulle gå dem alle igennem i laboratoriet for hvert eneste fosforylering på hvert eneste protein - derfor har vi brug for forudsigelsesmetoder.

Det jeg havde arbejdet med tidligere var netop en metode til at forudsige, hvilke af de 500 kinaser, der så gør det i en given interaktion. Jeg bruger sådan set samme idé, som da jeg kiggede på, hvor DNA'et sætter sine bogmærker ind ved bestemte gener: jeg ser på sekvensen, nu af aminosyrer rundt om det sted på protein, hvor en fosfatgruppe kan sættes fast. Og givet det netværk af proteiner, som proteinet arbejder sammen med, kan vi så komme med et gæt på, hvilken kinase rent faktisk sætter fosfatgruppen på? Og svaret er "ja". For bestemte kinaser foretrækker bestemte sekvenser af aminosyrer."

Grundforskning, dre kan bruges af lægemiddelindustrien

I bund og grund kigger Lars Juhl Jensen og hans gruppe på regulering af proteiner. "Det er grundforskning i ordets virkelige forstand," fortæller han. "Men samtidig er netop kinaser og cellernes biokemiske antenner, receptorerne, de to største klasser af targets for lægemidler. Langt de fleste sygdomme har noget med regulering at gøre. Ved du præcist hvor et givet stof sætter sig i kroppen, og hvilke biologiske processer det så påvirker, bliver det nemmere at komme med bud på potentielle lægemidlers bivirkninger. De opstår jo både ved, at lægemidlet kan binde til flere forskellige proteiner, men også fordi, selvom det binder præcist til det protein, du ønsker, og du får påvirket det, du vil, så regulerer proteinet måske også andre processer. Lukker du en proces ned i kroppen, lukker du også for en masse andre processer. Vi leder længere nede i signaleringskaskaden - som et givet biokemiske netværk kaldes - så vi bliver mere målrettede, når vi påvirker noget."

Text-mining kan afsløre ukendte bivirkninger 

Et helt tredje projekt, som Lars Juhl Jensen og Søren Brunak arbejder på, søger desuden at finde hidtil ukendte bivirkninger. Tusindvis af patientjournaler bliver text-minet, for at se, om hyppigt brugte stoffer kan kædes sammen med effekter, som ingen har opdaget endnu.

"Da psykofarmaka nok er en af de lægemiddelgrupper, der har flest bivirkninger, kigger vi på psykiatriske patienter, der har været indlagt på Skt. Hans i længere perioder, og hvor deres patientjournaler er ret omfattede. Vi har genotypedata på patienterne, så vi kender til mutationerne i deres genomer. Vi håber fx at identificere mutationer, der får et lægemiddel til at virke bedre eller give færre bivirkninger, så vi på sigt kan forudsige, hvilken type medicin er bedst for en given patient. Det vil nok være et samspil af mange mutationer, men hvis jeg nu kendte sekvensen af dit genom, og derfor kunne forudsige, hvilke lægemidler, der sikkert vil virke godt på dig, og hvilke der ikke vil virke, eller hvilke, der vil give dig slemme bivirkninger, så kan man pludselig tilpasse behandlingen til dig."
Og i takt med at DNA-sekventeringen bliver billigere, vil der ikke gå mange år før alle har råd til at få sekventeret deres genom, og har det indlæst, fx på sygesikringskortet. "Så vil data-mining pludselig få en meget direkte betydning for behandling af den enkelte patient," siger Lars Juhl Jensen. 

Han modtager Lundbeckfondens Forskerpris for Yngre Forskere 2010, der hvert år uddeles til en forsker under 40 år, som har præsteret fremragende forskning i Danmark indenfor sundheds- og naturvidenskab. Prisen er en personlig hæderspris på 300.000 kr.

Mere info:
NNF Center for Protein Research >
Department of Disease Systems Biology >