PLoS ONE: Signaturer av Selection i Fusion transkripsjoner som følge av translokasjon i Human Cancer

Abstract

Bakgrunn

tilbakefall og ikke-tilfeldig fordeling av transstoppunkter i humane svulster er vanligvis tilskrevet lokale sekvens funksjoner til stede i nærheten av de svake punktene. Men det har også vært antydet at funksjonelle begrensninger kan bidra til å avgrense posisjonen til transstoppunkter i løpet av de genene som er involvert, men har manglet en kvantitativ analyse av et slikt bidrag.

Metodikk

Vi har analysert to kjente signaturer av funksjonell utvalg, som for eksempel leseramme kompatibilitet og ikke-tilfeldige kombinasjoner av protein domener, på en omfattende datasett av fusjonsproteiner som følge av translokasjon i kreft.

Konklusjoner

Våre data tilveiebringe sterk eksperimentell støtte for konseptet at plasseringen av transstoppunkter i genomet av kreftceller er bestemt, til en stor grad av behovet for å kombinere visse proteindomener og for å holde et intakt leseramme i fusjons transkripter. I tillegg er informasjon som vi har samlet gir en global oversikt over de onkogene mekanismer og domene arkitekturer som brukes av fusjonsproteiner. Dette kan brukes til å vurdere den funksjonelle effekten av nye translokasjon og å forutsi plasseringen av stoppunkter i de aktuelle genene

Citation. Ortiz de Mendibil jeg, Vizmanos JL, Novo FJ (2009) Signaturer av Utvalg i Fusion transkripsjoner som følge av translokasjon i human Cancer. PLoS ONE 4 (3): e4805. doi: 10,1371 /journal.pone.0004805

Redaktør: Michael J. Pazin, National Institute on Aging (NIA), National Institutes of Health (NIH), USA

mottatt: 8 oktober 2008; Godkjent: 30 januar 2009; Publisert: 12 mars 2009

Copyright: © 2009 Ortiz de Mendibil et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet har blitt finansiert ved hjelp av Institute of Health Carlos III (FIS PI040037), spanske departementet for utdanning og forskning (SAF 2007-62473), den PIUNA Program ved University of Navarra og Caja Navarra Foundation gjennom programmet «Du velger bestemmer deg «(Prosjekt 10,830). F.J.N er mottaker av en «Jerónimo de Ayanz» -prisen fra regjeringen i Navarra. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

De fleste kreftceller vise noen form for kromosom omorganisering. Mens solide svulster vanligvis vise komplekse Karyotyper med mange forskjellige typer kromosomavvik rearrangements, mange hematologiske maligniteter og viss sarkomer skjermen bare én eller noen få avvik, vanligvis balanserte translokasjon, som i noen tilfeller har vist seg å være den innledende hendelsen i tumorutvikling [ ,,,0],1], [2]. Av denne grunn, translokasjon er teknisk lettere å karakterisere i hematologiske kreftformer. Omfattende analyse av translokasjon i humane kreftformer i løpet av de siste tre tiårene har avdekket to hoved utfall der slike rearrangements driver kreft progresjon: i) promoter exchange (hovedsakelig i lymfoide neoplasmer), og ii) opprettelse av kimærgenene som er oversatt som fusjonsproteiner (myeloide leukemier og noen solide tumorer) [3]. Likeledes er konsensus utledet fra disse studiene tyder på at translokasjon er et resultat av misrepaired DNA-dobbeltstrengbrudd (DSB) i somatiske celler [4] – [7]. Translokasjon som resulterer i kimære fusion transkripsjoner utgjør en viktig gruppe av resiproke trans som står for 20% av kreft sykelighet hos mennesker [3], og har potensial til å initiere tumorvekst fordi deres proteinprodukter inneholder domener fra begge fusjonspartnere. Tilstedeværelsen av heterologe proteindomener i samme kimære protein resulterer i deregulerte biologiske aktiviteter som til slutt fører til kreftutvikling.

Noen av de balanserte translokasjon som finnes i svulster er tilbakevendende, i den forstand at de er tilstede i forskjellig pasienter med den samme tumortypen, eller til og med i forskjellige tumortyper [8]. Videre har karakterisering av fusjonssekvenser på molekylnivå i forskjellige pasientprøver viser at, i det minste for noen gener, brytningspunkt har en tendens til å klynge i spesifikke regioner. Som følge av fordelingen av transbrytningspunkter som finnes i tumorprøver følger en ikke-tilfeldig mønster, med noen få steder, hvor de svake punktene er hyppigere enn ventet ved en tilfeldighet. Selv om flere studier har adressert den potensielle rolle nucleotide motiver og lokale sekvens funksjoner som årsak for slike tilbakefall [9] – [14], viktigheten av funksjonelle faktorer i avgrense posisjonen til transbrytningspunkter er ikke testet eksperimentelt. I denne forbindelse kan en global analyse av kimeriske fusjons transkripter vise hvorvidt knekkpunkt gjentakelse kan være et resultat av celle seleksjon for de funksjonene som kodes av spesifikke domener som er tilstede i de respektive fusjonsproteiner. Videre kan kravet om å holde et intakt leseramme i fusjonsprodukt også bidra til å forklare den ikke-tilfeldig fordeling av transstoppunkter på tvers av disse gener.

For å teste denne hypotese, har vi analysert et omfattende sett av translokasjon som skaper onkogene fusjonsproteiner i humane maligniteter, på jakt etter signaturer av funksjonell utvalg. Vi utarbeidet en katalog over proteindomener kodet av disse fusjonsproteiner og visualisert dem som et nettverk av samvirkende noder, få en global oversikt over proteindomener som bringes sammen til de samme fusjonsproteiner. Vi har også analysert leserammen av fusjons transkripter, for å bekrefte at de opprinnelige leserammer av de samarbeidende gener ble oppbevart i-ramme fusjon transkripsjoner i en mengde høyere enn ventet ved en tilfeldighet.

Materialer og Metoder

Fusion sekvensene ble hentet fra TICdb versjon 2.1 (oktober 2007). TICdb er et fritt tilgjengelig database av gen-kartlagt transbrytningspunkt i kreft, som beskriver den genomiske plasseringen av 1,445 transbrytningspunkt, svarende til 310 forskjellige gener, i hematologiske, mesenchymale og epiteliale kreftformer. Databasen ble opprettet ved hjelp av informasjon fra

Mitelman Database av kromosomavvik i Cancer

(tilgjengelig ved Kreft Genome Anatomy Prosjekt), to publiserte kataloger av gener omorganiseres i kreft og våre egne søk [15]. Forbindelses sekvenser av resiproke trans ble kartlagt på referansesekvens av det humane genom ved hjelp av BLAST. Alle transstoppunkter blir dermed henvist til nøyaktig nukleotid stillinger eller genfragmenter (introner eller eksoner) innen spesifikke

Ensembl

transkripsjoner (Ensembl 38.36).

Prosedyren ble fulgt er oppsummert i figur 1. Fra TICdb vi innhentet informasjon om 699 ulike onkogene Genfusjonene, unntatt fra videre analyse alle de trans der onkogene mekanismen har vist seg å være gen de-regulering av arrangøren utveksling i stedet for etableringen av et fusjonsprotein. Likeledes, 116 fusjoner hvor minst en av de samarbeidende gener ikke bidra med en gjenkjennelig protein domene til fusjonsproteinet ble uinformative for analyse av protein domene co-forekomster, og ble således utelatt fra datasettet fordi de ikke er kvalifisert for studere. Totalt analyserte vi 583 Genfusjonene der begge partner genene bidro en annotert protein domene til kimære fusjonsprotein som genereres av trans. To tredjedeler (66%) av disse fusjonene ble rapportert i hematologiske maligniteter, 26% i mesenkymale kreft og 8% i epiteltumorer.

For hver fusjon i TICdb (øverste rektangelet viser en del av skjermbilde av et søk etter trans involverer ETV6) gikk vi til «Protein view» side av de respektive transkripsjoner (ENST00000266427 og ENST00000381652 i dette eksemplet). Den nederste venstre boksen viser ETV6 protein med aminosyrene kodet av hver ekson (blokker med vekslende farger), plasseringen av proteindomener kommenterte i flere databaser (SMART, SUPERFAMILY, PFAM, Prosite og trykk), plasseringen av stoppunkt (vertikal stiplet linje) og den delen av peptidet som er bidratt til fusjonsproteinet (horisontal linje med dobbel pilspissen). Det samme er vist for JAK2 lavt i høyre boksen. I begge tilfeller er det exon som flankerer fusjons markert (rødt rektangel), med sin startet og sluttet leserammer er vist i en boks ( «Skjøteinformasjon»).

TICdb viser posisjonen av hvert stoppunkt tilordnes en bestemt intron eller exon av en bestemt Ensembl transkripsjon. Dermed kunne vi bruke Ensembl «Protein view», som gir en grafisk fremstilling av protein og av alle domener kommenterte i SMART, PFAM, Prosite og utskrifter databaser, for å trekke ut, for hvert gen fusjon, den PFAM og Prosite domener som bidro til fusjonsproteinet ved hver og en av de samarbeidende gener. Når PFAM og Prosite domener overlappet og /eller hadde samme Interpro sjonsnummer, vi vurderte PFAM angivelse. Unike Prosite domener uten Interpro merknader ble ignorert; disse inkluderer lav kompleksitet regioner som prolin-rike, serin-rik eller glutamin rike regioner. Kveilet spiral regioner ble inkludert i analysen, siden de er viktige oligomeriseringsprosessen domener som brukes i mange fusjonsproteiner.

En viktig faktor om proteindomener i egne proteiner er at mange domener er generelt funnet i kombinasjon med andre domener i samme protein. Dette betyr at fusjonsproteiner vil vanligvis motta to eller flere domener fra hver av de transpartnere. I disse tilfeller er det vanskelig å fastslå om bare én (og hvilke) av domenene er ansvarlige for den onkogene egenskaper av fusjonsproteinet, eller hvorvidt det er den spesielle kombinasjonen av domener som er ansvarlig for onkogen aktivitet. Av denne grunn, gruppert vi domener i domene arkitekturer, det vil si grupper av domener som er funnet sammen i samme native proteiner ifølge Pfam merknader. To arkitekturer, EAD og COIL, var spesielt vanskelig å tildele. Den første omfatter EWS aktiveringsdomenet, som ikke er kommentert som et protein domene i PFAM men har vist seg å være ansvarlig for å transformere potensialet av fusjonsproteiner inneholdende denne del av EWS proteinet. Interessant nok er dette domenet også detektert, av sekvenslikhet, i FUS og TAF15 proteiner, som danner fusjonsproteiner med arkitekturer som finnes i EWS fusjoner. Med hensyn til kveiler spolen domene, er det til stede i mange proteiner, men mangler også en kommentar i proteindomene databaser. Det vises i fusjonsproteiner som enten alene eller i kombinasjon med andre domener, så det er ikke alltid klart om trans potensialet av fusjonsproteinet er på grunn av de oligomerisering egenskaper av det viklede spole eller den kombinerte tilstedeværelse av dette domene med andre proteindomener . Av denne grunn er laget vi en arkitektur (coil) for disse fusjonsproteiner der den kveilede spolen er den eneste domene til stede, i tillegg til forskjellige andre arkitekturer (COIL /andre) for de tilfeller der andre domener finnes i kombinasjon med viklede spoler. Den NUP arkitekturen består av GLFG gjentakelser av NUP protein.

Vi så genereres en liste over domene arkitekturer som er samlet til samme fusjonsprotein. Disse parene av domene arkitekturer ble visualisert som nett i hvilke noder som representerer en arkitektur domene, og kantene knytte de arkitekturer som er til stede i den samme fusjonsprotein. Networks ble opprettet ved hjelp Cytoscape 2,5 (https://cytoscape.org/). Analyse av nettverksparametere ble utført ved hjelp av NetworkAnalyzer plugin [16]. Supplerende Tabell S1 viser alle arkitekturer med domenene som utgjør hver arkitektur.

Ensembl «Protein view» viser også leseramme der hver koding ekson starter og slutter (bokser vist i figur 1). Ettersom alle trans i TICdb tilordnes bestemte introner eller eksoner, var vi i stand til å sjekke om de eksoner flankerer en transstoppunkt har kompatible leserammer, det vil si, hvis den siste ekson av 5 «partner genet ender i samme leseramme i som den første ekson av den 3 «partner gen starter. Som vist i figur 1, kan dette brukes til å utlede hvorvidt fusjonsgenet som resulterer fra trans ville holde leserammen fra begge partner genene, og dermed settes som et i-ramme-fusjonsprotein. Siden de fleste av fusjons sekvenser analyseres er hentet fra fusion transkripsjoner (spleisede mRNA), disse sekvensene allerede tar hensyn til potensialet exon hoppe eller alternative spleise hendelser. I 43 av de 583 Genfusjonene analysert, leserammen både eksoner virket uforenlig med en in-frame fusjon produkt, så vi gikk tilbake til den opprinnelige sekvensen for å sjekke om andre mekanismer hadde gjenopprettet leserammen i fusjonen karakterutskriften.

Resultater

Reading ramme bevaring

etter strategi forklart i Methods, vi analysert leseramme kompatibiliteten eksoner flankerer transbrytningspunkt, i 583 Genfusjonene koding for en potensiell fusjonsprotein som med begge partner gener bidrar en annotert protein domene. Interessant, den endelige leserammen til 5′-exon og utgangsleserammen til 3′-exon var kompatible i 540 av fusjonene ble analysert, noe som bekrefter at en i-ramme-fusjonsprotein ble dannet i 93% av tilfellene. I noen translokasjoner, stoppunkt falt i midten av en ekson, men også slik at leserammen var holdt på tvers av fusjon. Dette illustreres ved et sett av genfusjoner mellom

FIP1L1 plakater (5′-genet) og

PDGFRA plakater (3′-genet) der forskjellige eksoner av

FIP1L1

er kondensert til avkortede versjoner av ekson 12 av

PDGFRA plakater (Ensembl transkripsjon ENST00000381354). Slettinger i denne ekson alltid resultere i en kompatibel leseramme med de tilsvarende eksoner av

FIP1L1 plakater (eksoner 10, 11, 12 og 13 i

FIP1L1

avskrift ENST00000358575, som ender i leserammer +3 henholdsvis 1, 2 og 3, i versjon 38.36 av Ensembl), som fører til i-frame fusjon transkripsjoner i alle fire konfigurasjoner.

i de resterende 43 fusjoner leserammer flankerer eksoner var ikke kompatibel , slik at de ikke ville forventes å gi en i-ramme-fusjonsprotein. I slike tilfeller gikk tilbake til den opprinnelige fusjon sekvens og funnet at i 31 av disse (72%) leserammen var gjenopprettet ved hjelp av forskjellige mekanismer som alternativ spleising, innsetting av intronic regioner, innsetting av ikke-malbasert nukleotider eller sletting av exonic nukleotider. Dette var spesielt vanlig i fusjonsproteiner som involverer

EWSR1

,

FUS Hotell og

TAF15

, siden 48% av slike fusjoner hadde uforenlige leserammer som ble behandlet av en av disse mekanismene (24 ut av 50 genfusjoner analysert for disse genene). Etter nøye vurdering av de resterende 12 fusjoner hvor leserammer var ikke kompatibel (2% av de totale 583 fusjoner), antok vi at et funksjonelt protein produkt ikke kan genereres i disse tilfellene.

Oppdagelsen av at 98% av genet fusjoner generere utskrifter som kan oversettes som i-frame proteinprodukter bekrefter at leseramme bevaring er av stor funksjonell betydning i onkogene fusjonsproteiner, siden den forventede frekvensen av kompatible leserammer mellom to tilfeldige eksoner (forutsatt like frekvenser på 1, 2 og +3 leserammer) er en tredjedel. Dette er en klar signatur av den sterke seleksjonspress i somatiske celler som favoriserer de fusjonsprodukter som kan kjøre onkogene transformasjon, og den har viktige implikasjoner i diskusjonen om identiteten til de faktorene som styrer plasseringen av transstoppunkter i kreftceller (se nedenfor).

protein domene arkitekturer som er tilstede i den samme fusjonsproteinet

Et nettverk graf av genene som er involvert i translokasjon som genererer fusjonsproteiner (figur Tilsetnings S1) viser tre uavhengige klynger, pluss noen mindre grafer som ikke er koblet til noen av hovedkomponentene [15], [17]. Disse ble analysert som beskrevet i metodedelen, for å skape et globalt nettverk av domene arkitekturer som er brakt sammen til de samme fusjonsproteiner i kreft (figur 2 og Supplerende tekst S1). Topologiske parametere som grad fordelingen viser at nettverket av Genfusjonene og nettverket av domene arkitekturer er begge kompatible med skala-fri eller små-verden, men ikke tilfeldig, topologier. Antall noder (114) i nettverket av domene arkitekturer (figur 2) er mindre enn halvparten av antall gener som omarrangert i de translokasjoner (235 noder i fig S1), noe som indikerer at de samme arkitekturer blir brukt i forskjellige genet fusjonsbegivenheter. Likeledes har nettverket av domene arkitekturer en mindre diameter (8 vs 13) og en mindre karakteristisk veilengde (3,66 vs. 4,83); som et resultat av nettverks tetthet i nettverket av domene arkitekturer er mer enn to ganger tettheten til nettverket av genfusjoner (0,0019 vs. 0,0008). Disse parametrene reflekterer mindre komplekse nettverket av domene arkitekturer med hensyn til nettverket av genfusjoner. En mer inngående drøfting av disse nettverkene kan bli funnet i Tilleggs Tekst S1, Supplerende Figur S2, Supplerende Figur S3, Supplerende Figur S4 og analytiker figur S5.

Alle domene arkitekturer ble slått sammen, noe som resulterer i en enkelt stor komponent pluss 6 andre mindre grafer. Ni noder med mer enn 5 naboer (nav) er vist i blått. De tre viktigste genet fusjons nettverk vist i Tilleggs figur S1 er godt synlig i navene tilsvarer TK, NUP og pole /HZ arkitekturer. Størrelsen på hver node er et tegn på sin grad (antall naboer).

To interessante funksjonene er tydelige i nettverket av domene arkitekturer. Først må alle arkitekturer som stammer fra de tre hoved gen-fusjons nettverk vises som en stor enkelt diagram, noe som indikerer at noen domene arkitekturer er felles for alle gen nettverk. Likeledes, noen av arkitekturer fra de 21 små genet fusion grafer er også inkludert i denne store komponent, slik at bare seks små komponenter forbli frakoblet til hovednettverket av domene arkitekturer. Det andre, mer forbundne nodene (nav with≥5 naboer, som er vist i blått på figur 2) identifisere de viktigste klassene av fusjonsproteiner som finnes i kreft, det vil si de som involverer tyrosin-kinase (TK) domene, EWS aktiveringsdomenet (EAD ), det Runt domene, det ligandbindende domene av atom hormon reseptor (HRMN), aT-krok DNA-bindende domene (hOOK og COIL /HZ), de GLFG gjentar (NUP) og kveilet spoler (coil). Dette tyder på at nettverket fanger opp de viktigste biologiske typer som i dag er kjent for å bli brukt av fusjonsproteinene i kreft.

Oppdagelsen av at bare visse kombinasjoner av proteindomener er til stede i onkogene fusjonsproteiner, som danner et nettverk av ikke- -Random topologi, innebærer at slike kombinasjoner er et resultat av forskjellige funksjonelle begrensninger. Som nevnt ovenfor, er dette en signatur av mobiltelefonseleksjonstrykk som dikterer som translokasjon er til stede i kreftceller.

For å kunne forutse hvordan dette nettverket vil bli påvirket av oppdagelsen av nye trans, analyserte vi kromosom trans som ble publisert etter begynnelsen av dette arbeidet (oktober 2007) og dermed ennå ikke inkludert i TICdb på den tiden [18] – [33]. Vi har samlet 17 Genfusjonene som genererer et fusjonsprotein med kommenterte proteindomener, som beskriver 9 nye gener og 7 nye domene arkitekturer (to av de nye genene bidro en allerede beskrevet arkitektur). Vi har også observert to nye kombinasjoner av tidligere beskrevet domene arkitekturer. I tillegg, i ett tilfelle en 3 «partner-genet

(TCF3)

, tidligere beskrevet som 5′ fusjonspartner, bidrar en distinkt domene arkitektur i dette ny sak. Analysen av disse nye fusjoner tyder på at nettverket av domene arkitekturer, selv om ikke komplett enda, inneholder de fleste arkitekturer som brukes av onkogene fusjonsproteiner, og vokser i et saktere tempo enn nettverket av Genfusjonene.

diskusjon

Vi har utført en objektiv undersøkelse av litteraturen og av alle offentlige data tilgjengelig for oss om translokasjon som skaper fusjonsproteiner i kreft hos mennesker. Fusions som ikke var informativt for denne analysen ble ekskludert, nemlig de som er involvert i promoter utveksling (som ikke skaper fusjonsproteiner) og de hvor en av partner gener ikke bidra med en gjenkjennelig domene til fusjonsproteinet (som ikke er informativ for analysen av domene co-forekomst). Derfor må det tas i betraktning at dataene som presenteres her, gjelder for translokasjon som genererer fusjonsproteiner som inneholder proteindomener kommenterte i Pfam. Vår analyse avdekket to signaturer av funksjonelle valg: leseramme kompatibilitet og ikke-tilfeldig Samtidig forekomst av proteindomener. Begge funksjonene kan være viktige faktorer som bestemmer plasseringen av transstoppunkter i kreftceller. I tillegg kan våre data bidra til å forutsi nye trans og å vurdere den funksjonelle relevansen av nye Genfusjonene oppdaget i hematologiske og solide tumorer.

Rolle funksjonelle valg i plasseringen av transstoppunkter i kreftceller

de to underskrifter fra funksjonell utvalg som vi har analysert i fusion transkripsjoner (nemlig, leseramme bevaring og ikke-tilfeldige kombinasjoner av proteindomener) tyder på at slike krefter kan være viktige faktorer i å bestemme den ikke-tilfeldig fordeling av transstoppunkter som er sett i kreft hos mennesker. I denne forbindelse, utbredt oppfatning at lokale sekvens faktorer er ansvarlig for tilstedeværelsen av transstoppunkter på bestemte genomiske områder er avhengig av antagelsen om at transstoppunkter avsløre plasseringen av alle DSB sin generert i disse cellene. Dermed, siden transstoppunkt er ikke-tilfeldig fordelt, er den slutning gjort at DSB sin er startet ikke tilfeldig. Men sekvenselementer som er ansvarlige for generering av DSB sin (kort sekvens motiver, topoisomerase II-områder, spredt gjentar, intronic transkripsjonsinitieringen nettsteder, kors strukturer, etc) er ganske vanlig i hele genomet, så det er rimelig å anta at de fleste av DSB sin som er opprettet på tvers av genomet løpet av levetiden til en somatisk celle har blitt skikkelig reparert og at bare en liten del av misrepaired DSB sin vil resultere i onkogene fusjoner og vil til slutt bli funnet i tumorprøver. I denne forbindelse må det tas i betraktning at analysen av tumorprøvene representerer et ekstremt tilfelle av konstater skjevhet: per definisjon, vil det bare være translokasjoner som har vært viktige for tumorvekst påvises, mens mange andre mulige translokasjoner som ikke gir en proliferativ fordel til cellen vil ikke. Noen av translokasjoner, for eksempel, ville være forventet å være skadelige for cellen, ettersom to forskjellige gener alleler (ett allel av hvert gen) er blitt inaktivert ved pauser, slik at celler som bærer disse trans vil til slutt forsvinne fra vevet. Andre rearrangementer vil være funksjonelt nøytral og det resulterende fusjonsgenet ikke vil ha en fordelaktig biologisk funksjon. Til slutt, de translokasjoner som finnes i tumorprøver er et resultat av klonal ekspansjon av celler som havn trans med potensiale til å fremme tumorvekst fordi de skaper onkogene fusjonsgen. De spesifikke brytningspunkter næret ved disse trans utgjør undergruppe av ikke-tilfeldig transbrytningspunkt som er funnet i kreftceller.

Dette er illustrert i figur 3, som viser to gener som teoretisk er i stand til å delta i en gjensidig trans med onkogene egenskaper, på grunn av de domenene som er til stede i sine respektive proteiner. Selv om de første DSB ble fordelt jevnt over de gener [34], er det åpenbart at ikke alle mulige trans vil skape et fusjonsgenet med onkogene potensial. Etter plasseringen av områdene som koder for de nødvendige proteindomener, og med tanke på leserammene til de forskjellige eksoner som er involvert, blir det klart at en onkogen fusjonsprotein vil bare bli generert hvis brytningspunkter befinner seg innenfor visse introner. Andre mulige kombinasjoner stoppunkt ville føre til tap av en viktig funksjonelt domene i fusjonsproteinet, eller til en ut-av-ramme-produktet, og vil ikke bli favorisert i tumorprøver. En klar konsekvens av dette er at det som oppfattes som «non-vilkårlighet» i den genomiske fordelingen av transstoppunkter ikke nødvendigvis er knyttet til den første lokaliseringen av DSB, men kan være et resultat av utvelgelsesprosessen ved hvor kun noen få av disse DSB sin eventuelt overleve i cellene i en svulst.

Tre eksoner av to hypotetiske gener blir vist (eksoner A, B og C i blått, eksoner 1, 2 og 3 i oransje). Den innledende og avsluttende leserammen til hvert ekson er vist (1, 2 eller 3). Eksoner A og B av den øverste gen koder for et protein domene (rød linje), mens ekson 3 av de nederste gen koder for et annet protein domene (grønn bar). Selv om dobbel-strand pauser (DSB sin, gule lyn symboler) ble opprettet jevnt over sekvensen av både gener, bare de stoppunkt kombinasjoner som fører til i-frame fusjonsproteiner som koder for både proteindomener vil vise onkogene potensial. Som et resultat, vil transstoppunkter som finnes i tumorprøver klynge til bestemte genområder (vertikale blå piler).

Tippe av nye fusjonsproteiner i hematologisk og solide svulster

Hvis de to signaturer identifisert i dette arbeidet er viktige determinanter av stoppunkt lokalisering, så våre resultater bør være nyttig for prediksjon av Genfusjonene som ennå ikke er funnet i tumorer. Først kan det informasjon om hvilke domene arkitekturer er til stede i samme fusjonsprotein brukes til å velge alle genene som koder for et bestemt par av domene arkitekturer. Dette vil forutsi flere genfusjoner som er potensielt onkogene. Informasjon om leserammer av eksonene som hører til disse genene bør identifisere hvilke spesifikke fusjoner (hvis noen) er i stand til å generere et i-ramme-fusjonsprotein som inneholder den nødvendige kombinasjon av proteindomener. Enda viktigere, bør denne analysen også identifisere hvilke introner er mest sannsynlig å inneholde de svake punktene, og således bidra til konstruksjonen av molekylære strategier for deteksjon av de mulige fusjons transkripter.

En åpenbar konsekvens fra vårt arbeid er at mange potensielle genfusjoner kan generere den samme kombinasjonen av domene arkitekturer, fordi hver enkelt arkitektur er vanligvis kodet av flere gener. Imidlertid er det generelt antatt at de fleste av translokasjon som er ansvarlige for utviklingen av kreft hos mennesker er allerede blitt beskrevet [8], [17]. Selv om noen nye tilfeller publiseres hvert år, de fleste av dem rapporterer nye stoppunkter i tidligere kjente Genfusjonene eller nye fusjoner mellom gener som tidligere var blitt funnet smeltet til andre partnere. Det er ikke klart hvorfor mange av de potensielle nye Genfusjonene ikke har blitt oppdaget. En sannsynlig forklaring er at gener som er involvert ikke oppfyller noen av kriteriene som kreves for et gjensidig trans å finne sted, som for eksempel nærhet innenfor nukleær plass eller co-transkripsjon i de samme atom transkripsjon fabrikker [35] – [39] . Alternativt kan noen av disse nye Genfusjonene forbli uoppdaget fordi de aldri ble søkt etter, siden de fleste studier fokuserer på deteksjon av kjente trans. I denne forbindelse er det interessant å vurdere nylige studier hvori genomet til forskjellige typer kreftceller er avlest på en objektiv måte [40] – [43]. I tilfelle av en diploid prøve fra en leukemipasient, massivt parallell sekvense avdekket nye punktmutasjoner, men ikke genomiske rearrangementer [40]. Slutt Sequence Profilering av cellelinjer fra solide tumorer avdekket mange somatiske genomiske rearrangementer, men bare et fåtall av disse var Genfusjonene. For eksempel, Campbell et al. [41] anvendes massivt parallell med parvise ende sekvensering i to lungekreft cellelinjer og fant 22 somatiske interchromosomal rearrangementer i NCI-H2171 cellelinjen, men ingen i NCI-H1770. Av disse bare en uttrykt fusjon avskrift ble identifisert, selv om det ble spådd å være ute av rammen. Raphael et al. [42] fant en fusjon mellom

HYDIN

genet og en anonym genet i MCF7- metastatisk brystkreft cellelinje. En annen fusjon mellom

SCL12A2

og et uttrykk sekvens tag ble funnet bare i høy passasje MCF7 celler. I denne samme cellelinje, der kromosomavvik har tidligere blitt beskrevet av Spectral karyotypering (SKY) og matrise-komparativ genomisk hybridisering (CGH), Hampton et al. [43] fant 10 Genfusjonene hjelp end-sekvens profilering med massivt parallell sekvensering. Av disse er det bare fire ble funnet å bli uttrykt, men deres onkogeniske potensiale ble ikke direkte testet. Tatt i betraktning at disse studiene ble utført på cellelinjer, er antall nye uttrykt Genfusjonene relativt lav.

Disse nyere data er også relevant for dagens debatt om «driver» og «passasjer» mutasjoner i kreft genomer. På grunn av den iboende ustabilitet av genomer og klonal natur tumorigent prosessen, er mange avvik forventes å finnes når kreft genomer blir avhørt på en objektiv måte, de fleste som vil være passasjer avvik uten funksjonell betydning for onkogene prosessen . I denne sammenheng er det et stort behov for nye tilnærminger som kan skille disse genomiske endringene som driver tumor initiering eller progresjon fra nøytrale endringene som har blitt kjøpt opp av klonen, men har ingen funksjonell innvirkning. Våre resultater understreke to funksjoner som kan være nyttige i denne sammenheng.

Legg att eit svar