PLoS ONE: klonal ekspansjon Analyse av transposon Innsett av høy gjennomstrømming sekvense Identifiserer Kandidat kreftgener i en PiggyBac Mutagenese Screen

Abstract

Somatiske transposon mutagenese i mus er en effektiv strategi for å undersøke de genetiske mekanismene for tumorigenesis. Identifiseringen av tumor kjøring transposon innsett tradisjonelt krever generering av store tumor årskull for å få informasjon om vanlige innstikkssteder. Tumorkjøreinnsettinger er også karakterisert ved deres klonal ekspansjon i tumorvev, et fenomen som blir lettet ved den langsomme og utviklende transformasjonsprosessen av transposon-mutagenese. Vi beskriver her en forbedret metode for påvisning av tumor drivende innsettinger som vurderer klonal ekspansjon av insersjoner ved å kvantifisere den relative andel av sekvens lesninger oppnådd i enkelte svulster. For å oppnå dette, har vi utviklet en protokoll for innstikkstedet sekvensering som benytter akustisk klipping av svulst DNA og Illumina sekvensering. Vi analyserte ulike faste tumorer som er generert av PiggyBac mutagenese, og for hver tumor 10

6 leser svarende til 10

4 innstikk ble oppnådd. I hver tumor, 9 til 25 innsetninger skilte seg ut ved sin anrikede sekvens leses frekvenser sammenlignet med frekvenser som oppnås fra halen DNA kontroller. Disse beriket innsett er potensielle clonally utvidede svulst kjøreinnsett, og dermed identifisere kandidatkreftgener. Kandidaten kreftgener i vår studie omfattet mange etablerte kreftgener, men også nye kandidatgener som Mastermind-like1 (

Mamld1

) og Diacylglycerolkinase delta (

Dgkd

). Vi viser at klonal ekspansjon analyse av high-throughput-sekvensering er en robust metode for identifikasjon av kandidatkreftgener i insertional mutageneseteknikker skjermer på nivået av den enkelte tumorer

relasjon:. Friedel RH, Friedel CC, Bonfert T, Shi R, Rad R, Soriano P (2013) klonal ekspansjon Analyse av transposon Innsett av høy gjennomstrømming sekvense Identifiserer Kandidat kreftgener i en PiggyBac Mutagenese Screen. PLoS ONE åtte (8): e72338. doi: 10,1371 /journal.pone.0072338

Redaktør: Andrew C. Wilber, Southern Illinois University School of Medicine, USA

mottatt: 04.03.2013; Godkjent: 08.07.2013; Publisert: 05.08.2013

Copyright: © 2013 Friedel et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av tilskuddet HD24875 fra National Institute of Child Health and human Development til PS, med bistandsmidler fra Tisch Cancer Institute, Mount Sinai School of Medicine, til RF og PS: og ved DFG bevilgning FR2938 /1-1 til C.F. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Somatisk mutagenese av DNA transposoner i mus undersøker de underliggende genetikk tumorigenesis. Transposoner skjuler gen-aktiverende eller gen-fangst kassetter kan aktivere onkogener eller forstyrre tumor dempere, dermed kjører tumorvekst [1]. I tillegg til sin rolle i å oppdage nye kreftgener, transposon-mutagenese letter også mer detaljerte studier av genetisk og cellulære mekanismer for tumordannelse ved å benytte sensibiliserende bakgrunns mutasjoner og celletype-spesifikk transposonet aktiverings [2]. To transposon systemer har blitt brukt i kreft skjermer i musen: Sleeping Beauty [2-4] og PiggyBac [5,6]. Transposoninsersjon områder er identifisert ved sekvensekoblings fragmenter av transposon ender og flankerer genomisk DNA. Tumor kjører kandidatkreftgener blir så identifisert ved felles innstikkstedet (CIS) analyse, en prosess med kartlegging innsetting av flere svulster og analyse av gener som ofte treffer på uavhengige utvalg. CIS-analyse har vist seg å være en vellykket metode for identifisering av kandidatgener, men det krever et betydelig antall tumorprøver (50-100 i de fleste studier), og det gir svært lite informasjon om mutasjon mønstre i enkelte svulster.

en viktig egenskap ved transformasjon av transposoner er den kontinuerlige mobilisering i og ut av innstikk. Denne mekanismen forenkler positiv seleksjon og klonal ekspansjon av tumor-kjøreinnsett under svulst utvikling over nøytrale passasjer innsettinger. Klonal ekspansjon av transposon innsettinger kan vurderes ved å analysere de relative andeler av sekvens lesninger oppnådd fra innsettinger i de enkelte tumorer. Imidlertid har tidligere transposon tumor skjermene ikke utnyttes klonal ekspansjon analyse, sannsynligvis på grunn av begrensninger i antall sekvens leser kommet ved 454 pyrosekvensering tilnærming brukt i disse studiene. I tillegg standardprotokoller for tumor-DNA-fremstilling innebære fragmentering ved restriksjonsspaltninger, som introduserer skjevheter for innsetting representert ved kortere restriksjonsfragmenter som er mer effektivt amplifisert ved PCR [7]. En alternativ fremgangsmåte for DNA-fragmentering, akustisk skjær, kan redusere PCR skjevheter, som hvert innføringssted er representert ved et sett av fragmenter med lengde lik intervallet [8].

For å oppnå en bedre kvantitativ representasjon av innstikk av deres rekkefølge lese tall, vi kombinert to tekniske fremskritt av de siste rapportene – Illumina sekvense å få 10

6 leser per prøve [7], og akustisk klipping å redusere PCR skjevheter [7,8] – og utviklet en protokoll for effektiv high-throughput-sekvensering av transposon innsettinger. Vi har søkt vår protokoll for analyse av elleve forskjellige faste tumorer som vi hadde generert ved mutagenese med den PiggyBac transposon matrisen ATP1-S2 [5]. For hver innsetting i hver svulst, vi beregnet en relativ lesefrekvens, noe som gjorde oss i stand til å identifisere mellom 9-25 innsett per svulst som representerer clonally utvidet kreftkjøreinnsettinger. Blant de genene mutert ved clonally utvidede innsett var mange etablerte kreftgener, og også flere nye kandidat kreftgener.

Vi viser her at high-throughput sekvensering av innsetting språk biblioteker identifiserer clonally utvidede mutasjoner i enkelt svulster. Denne tilnærmingen vil vesentlig forbedre kvaliteten på kandidaten kreft genet spådommer om insertional mutagenese skjermer, og det vil lette identifiseringen av nettverk av samarbeidende mutasjoner i enkelte svulster.

Resultater

PiggyBac transposon mutagenese

en transposon mutagenese skjermen ble utført på mus som bærer en allestedsnærværende uttrykt PiggyBac transposase (ROSA26-PBase) og en transgen PiggyBac transposon array (ATP1-S2) [5]. Den ATP1-S2 matrise inneholder 20 kopier av transposonet ATP1, som er utstyrt med skjøte akseptorer for oppfanging av tumorsuppressorgener og en CAG promoter for aktivering av onkogener. Disse elementene gjør det mulig ATP1 å bevirke faste tumorer ved innarbeiding [5]. Vi avlet en test kohort av 27 mus som bar ROSA26-PBase og ATP1-S2, og en kontroll kohort av 27 mus med ATP1-S2 alene. Kohorter var alderen, og mens ingen tumorer ble observert i kontrollgruppen, observerte vi 11 makroskopiske svulster blant 8 mus inne i test kohort mellom 59 til 85 uker (Figur 1a). Tre dyr gjennomført tumorer ved to uavhengige områder, og i ett tilfelle, genetisk analyse av innstikk indikerte at begge tumorer har en felles opprinnelse (se nedenfor), mens alle andre tumorer tilsynelatende oppsto uavhengig av hverandre. Tumortyper består plateepitelkarsinom i huden, solide tumorer i lunge og tarm, og follikulært lymfom av milten. Innholdet av tumorceller i de dissekerte prøver varierte 30-100%, som bedømt ved histopatologisk analyse av hematoksylin og eosin farget seksjoner (figur S1). Vi isolert DNA for analyse av transposoninsersjon nettsteder fra alle 11 svulster. For å kontrollere for tilfeldige innsetting av PiggyBac i ikke-kreftvev, isolert vi også DNA fra 6 hale tuppen av svulst bærende mus.

A) Kaplan-Meier overlevelses tomt på kohorter bærer enten PiggyBac rekke alene (ATP1-S2 ) eller PiggyBac matrise og konstituerende transposase (ATP1-S2, R26-PBase). Røde piler indikerer svulst forekomst. Merker betegnes som sensurert dyr (ingen svulst observert på tidspunktet for offer).

B) Justeringer av Illumina genomisk sekvens leser avslutte i posisjonene som genereres av akustisk klipping. PB3 /PB5, PiggyBac 3 «/5» terminal gjentar; SA, spleise akseptor; P, CAG promoter.

C) Eksempel på kartlagt sekvens leser for Pb3 og PB5 sider av en PiggyBac innsetting, så i UCSC genom nettleser. Legg merke til at akustisk klipping forårsaker tilfeldige DNA brytepunkter som Splinkerette adaptere er ligert, noe som fører til en trapp-lignende mønster av sekvenssammenstillinger. Den konstante slutten av justeringer til høyre og venstre er forårsaket av ufravikelig sekvens lese lengden på Illumina system.

D) Kvantitativ oversikt over rekkefølgen leser, kartlagt leser, og unike innstikk fra halen og tumorprøver.

High-throughput sekvensering av transposon innsett

Vi utnyttet Illumina high-throughput sekvensering for å oppnå helhetlig lese dekning av transposon innsettinger i enkelte tumorprøver. I de fleste tidligere transposon-mutagenese-skjermer, er tumor-DNA spaltet med restriksjonsenzymer, som genererer fragmenter av en konstant størrelse for de enkelte innsettinger. Som PCR forsterker kortere fragmenter mer effektivt enn lengre fragmenter, er en skjevhet innføres under den påfølgende PCR-amplifisering for innsettinger som er representert ved korte restriksjonsfragmenter [7,8]. For å oppnå en mer proporsjonal representasjon av innsettinger, vi fragmentert svulst DNA ved akustisk klipping i fragmenter av 200-400 bp størrelse (se Metoder S1 for en detaljert protokoll). Dermed er innsett representert ved fragment bassenger med tilsvarende størrelse. Shearing ble etterfulgt av DNA slutten reparasjon, A-tailing av 3′-ender, og ligering til Splinkerette adaptere med 3′-T-overheng (figur S2). I separate reaksjoner, sammenbindingsfragmenter for de 3 «og 5» endene av den PiggyBac transposonet (PB3 og PB5) ble deretter amplifisert i to påfølgende PCR-runder for å generere PB3 og PB5 biblioteker for hver prøve. PCR-primerne inneholdt terminaladapter sekvenser for Illumina fast-fase amplifikasjon og sekvensering og en 6-base-strekkoden for å skjelne prøver i multipleks sekvensering. Vi har utarbeidet to bassenger av Pb3 og PB5 biblioteker, og hvert basseng ble sekvensert på ett kjørefelt av en Illumina HiSeq2000 enhet med 100 baser lese lengde. Sequence leser ble demultiplekset henhold til deres strekkode og kartlagt til musen genomet med Bow tie-algoritmen [9].

justering av sekvens leser i UCSC genom nettleser bekreftet objektiv karakter av DNA fragmentering av akustisk klipping. Den tilfeldige fordeling av DNA brytepunkter forårsaket sekvens leser fra transposon innsettinger for å justere i et trappelignende mønster rundt den sentrale TTAA sekvensen til PiggyBac innførings (figur 1 B, C). For hver prøve, fikk vi i gjennomsnitt ~ 5×10

6 bar-kodet leser, med tilsvarende tall for svulster og hale kontroller (figur 1D; Tabell S1).

Om 19,3% av lyder fra tumorprøver kunne tilordnes til musegenomet. For hale prøver, kan 15,3% av lyder kartlegges. Disse leser representerer nye innsetting av den ATP1 transposon utenfor sin donor array. Dette moderat andel av kartleggbart leser skyldtes hovedsakelig en høy andel av lyder som inneholdt plasmid sekvens flankerer unmobilized transposoner på donor matrise, og dermed kunne ikke kartlagt. For å bestemme brøkdel av ATP1 transposoner som forblir i ATP1-S2 donor array, utførte vi Southern blot analyse av haler av ROSA26-PBase; ATP1-S2 mus og funnet at omtrent 40% av ATP1-S2 transposoner ikke ble mobilisert fra tabellen (fig S3). Denne ufullstendige mobilisering av ATP1 kan være forårsaket av den spesifikke in vivo kromatin status for ATP1-S2 matrise. Som DNA metylering ved CpG områder kan være hemmende for PiggyBac innarbeiding [10], vi analyserte metylering status for ATP1-S2 ved Southern blot med en metylering følsom restriksjonskutting. CpG metylering av ATP1-S2 matrise ble oppdaget, noe som gir en mulig forklaring på den moderate innarbeiding rate (Figur S3). En ytterligere faktor som reduserer nye transposon innsett er tap av transposoner under innarbeiding (dvs. fjerning uten å følge reintegrering), og en tidligere studie viste at omtrent halvparten av alle ATP1 transposon kopiene er tapt under trans aktivitet [5]. Til tross for den moderate brøkdel av kartleggbart sekvens leser, vår high-throughput sekvensering protokollen tillater oss å gjenopprette et betydelig antall av leser for målene for vår studie med ~ 1×10

6 leser kartlagt i gjennomsnitt for tumorprøver og ~ 0.7×10

6 leser for hale kontroller (figur 1D).

ensidig og tosidig lese dekning av innsett

til sammen fant vi 4210 nye innstikkssteder i tumor og hale prøvene kombinert som ble støttet av lesekartlegginger på begge sider av PiggyBac transposoninsersjon (PB3 og PB5). De fleste innsettinger, ble imidlertid identifisert ved kartlagt leser på bare en side av transposonet (314,970 innsett med leser på bare PB3 eller PB5 side). Interessant er det store flertallet av innsettinger i vår undersøkelse, spesielt de med lesninger tilordnet til kun en side av transposonet, representert ved små lese tall (Figur S4). En lignende observasjon om den høye andelen av sjeldne innsett har blitt gjort i en Sleeping Beauty studie [7]. Det er tenkelig at disse sjeldne innsetting unngå å bli oppdaget på begge sider av transposonet grunn av deres lave overflod, noe som resulterer i den høye andelen av innsetninger som dekkes på den ene siden. Interessant, har vi også observert flere innsett med høye lese tall som ble dekket bare på den ene siden (figur S4). Mulige årsaker til ensidig lese dekning i disse tilfellene inkluderer flankerer repetitive eller lav kompleksitet DNA strekninger som hindrer kartlegging, eller små DNA rearrangements (slettinger, inversjoner) forårsaket av transposoninsersjon. For omfattende analyse, vi inkludert i vår studie alle innstikk kombinerer innstikk med ensidig og med tosidig sekvens lese dekning, noe som resulterte i ~ 2×10

4 unike transposon innsett i gjennomsnitt per prøve (figur 1D).

PiggyBac muterer genomet jevnt

data om det kromosomale fordelingen av ATP1 innsettinger viste at ATP1 PiggyBac transposonet muterer kromosomer jevnt fordelt i forhold til deres TTAA innhold, både i tumorer og haler (figur 2A) . Dette mønster er i samsvar med tidligere data som rapporteres for innføring mønster for det tilknyttede ATP2 transposonet [5]. Unntaket fra den proporsjonale fordeling av innsettinger ble den proksimale enden av kromosom 10, som huser den ATP1-S2 donor matrise. Her, observerte vi en anriking av innsetninger i området fra ~ 2 Mb ved den proksimale ende av kromosom 10 (figur 2B). Denne forspenningen er sannsynligvis forårsaket av en lokal sprang effekt av PiggyBac transposonet i nærheten av donor array, og innsettinger på dette området ble derfor ekskludert fra videre analyse.

A) Relativ fordeling av PiggyBac innstikk spissen kromosomer , sammenlignet med andelen av TTAA steder på kromosomer. Legg merke til overrepresentasjon av kromosom 10, som bærer transposon donor array. Kromosom Y, som består hovedsakelig av svært repetitive elementer, viste en svak preferanse for PiggyBac innsettinger.

B) Lokal sprang effekt på kromosom 10. Histogram av innsetting tetthet på kromosom 10 viser en positiv forspenning for innsetting ved proksimale enden (piler), der ATP1-S2 donor matrise ligger

C) Fordeling av PiggyBac innsetting i genomiske regioner. Arrangøren (10 kb oppstrøms av TSS), eksoner, introner, og intergeniske regioner

.

Vi har også sammenlignet fordelingen av innstikk i genområder (promoter, ekson, intron) og intergeniske regioner. Totalt sett, både halen og tumorprøver viste en fordeling av innsettinger som lignet den gjennomsnittlige andelen av genområder i musegenomet, selv om PiggyBac innsett ble observert i noe høyere tall enn ventet i intergeniske regioner (Figur 2C).

klonal ekspansjon av transposon innsett

Vår analyse av transposon innsett viste ingen vesentlige forskjeller i innføringsmønstre PiggyBac transposoner i tumor og haleprøver i form av kromosom distribusjon og genområder. Vi neste analysert kvantitative forskjeller i sekvens leser tall for innsetting i enkeltprøver. Den underliggende antakelsen er at clonally utvidet innsetting er til stede i et flertall av celler av en prøve, og bør være representert ved høyere lese tall enn nøytrale innsett som bare er til stede i en mindre del av prøven.

For å justere for variasjoner i sekvensen leses dekning av forskjellige prøver, vi først genererte relative lese frekvenser ved å normal PB3 og PB5 side lese tall for det totale antall leser fra de respektive prøve biblioteket. Som PB3 og PB5 lese frekvensene ble avledet fra uavhengig utarbeidet PCR biblioteker, en perfekt korrelasjon mellom PB3 og PB5 lese frekvenser kan ikke forventes. Likevel, observerte vi en robust sammenheng mellom PB3 og PB5 lese frekvenser for PiggyBac innsett (figur S5). Å kombinere informasjon fra lese frekvensene til Pb3 og PB5 sider av hver innsetting, vi deretter beregnet for hver innsetting den gjennomsnittlige lesefrekvensen fra sin PB3 og PB5 lese frekvenser. For innsettinger som var representert ved leser på bare en side, er lik den gjennomsnittlige frekvens 0,5 av den respektive ensidig frekvens.

for en komparativ analyse av lesefrekvensfordelinger i tumor og haleprøver, plottet vi den gjennomsnittlige lese frekvenser av alle innstikk i et boksplott diagram (figur 3). Dette diagrammet viser at mer enn 99% av innsettinger i tumorer og haler var representert ved en liten brøkdel av lyder med lese frekvenser under 0,1%. Interessant, men når vi fokusert på de beste uteliggere av hver prøve, observerte vi at tumorprøver inneholdt et lite antall uteliggere med beriket lese frekvenser som var klart høyere enn de sterkeste uteliggere av halen prøver. Disse høyfrekvente innsett er sannsynlig å være clonally utvidet innsett som har blitt positivt selektert for i løpet av tumorvekst.

Box plot av gjennomsnittlig lese frekvensene av transposon innsettinger i svulster og hale kontroller. Dots vise de beste 1% innsetting av hver prøve, rangert etter gjennomsnittlig leste frekvenser. Vertikal linje angir fordelingen av 2-25% persentil gruppe, og boksene angir fordelingen av den nedre 75% av innsettinger. En terskel for uteliggere (stiplet horisontal linje) ble beregnet ved å ta gjennomsnittet lese frekvensene av de 10 beste innsetting av hver hale prøve.

I fravær av en effektiv statistisk metode for å skille sanne uteliggere fra tilfeldig beriket innsett bestemte vi oss for å definere klonal ekspansjon av en terskel metode. Vi utnyttet hale kontroller som en referanse for distribusjon av lese frekvenser i ikke-svulstvev, og beregnet en terskel for avvikende oppdagelse ved gjennomsnitt 60 høyeste frekvensene av halen kontrollprøver (de 10 frekvensene av hver hale prøve). Dette resulterte i en terskelverdi på 0,37% for vår datasett. Vi identifiserte mellom 9-25 innsett for hver tumorprøve over terskelen, men bare 2-6 innsett i halen prøver (Tabell S2).

Vi ytterligere avhørt reproduserbarheten av rangeringen innstikk av lesefrekvensen i en serie av kontrollforsøk. Vi spurte først om innstikkstedet utvidelse vil variere mellom ulike deler av en enkelt tumormasse (figur S6). Ved å sammenligne lese frekvenser av microdissected prøver fra enkelttumormasser, observerte vi en fullstendig overlapping av de mest høyanriket innsett mellom prøver og en kamp med mer enn 50% av innsett over terskelen overall.

Vi undersøkte om utvidet innsettinger i tumorer kan allerede være tilstede som utvidede innsettinger i den pre-kreftvevet hvorfra tumoren oppstår. For dette formål sammenlignet vi transposon innsetting inn i gener fra en lungetumor med innsetting av tilstøtende normalt lungevev (figur S7). Den mest sterkt anriket tumorinnsett var ikke til stede i det normale vev, noe som bekrefter gyldigheten av vår tilnærming for å identifisere kandidat kreftgener. Imidlertid 2 av 6 ekspanderte genet innsetting av tumoren ble også påvist ved tilsvarende nivåer i den normale lungevevet, noe som indikerer at noen klonalt ekspanderte innsettinger i tumorer kan være avledet fra pre-cancerøse klonale innsettinger.

Endelig vi spurte om organer vil bære en høyere bakgrunn rate av utvidede pre-kreft innsett enn hale vev, som organer har vanligvis en mer homogen sammensetning av celletyper enn den heterogene halen (figur S7). Faktisk fant vi at DNA fra kan organer i noen tilfeller inneholde mer utvidet innsett enn hale vev. Antallet av ekspanderte innsett varierte 3-23 i organer, med et gjennomsnitt på 11 ekspanderte innsettinger per prøve. Som tumorprøver av vår kohort gjennomført i gjennomsnitt 16,4 utvidede innsett, anslår vi at i gjennomsnitt 66% (11 /16,4) av utvidet innsetting i svulster kan reflektere utvidet pre-kreft innsettinger. Basert på disse kontrollforsøk, konkluderer vi med at klonal ekspansjon analyse er en adekvat metode for å identifisere kandidatkreftgener i enkelte svulster. Imidlertid er en viktig forbeholdet nærvær av ekspanderte pre-kreftinnsetninger i tumorvev, og frekvensen av disse innsetninger kan variere innen vide grenser mellom prøver, avhengig av tumortype og vertsvevet.

Blant klonalt ekspanderte innsettinger i tumorer 56,9% ble funnet i genet regioner (arrangører, eksoner og introner), -A betydelig høyere andel enn for alle PiggyBac innsettinger i tumorer (33,4%, se figur 2C) -, og 43,1% ble funnet i intergeniske regioner. Clonally utvidede innsettinger i intergeniske regionene kan utøve langtrekkende cis-effekter på tilgrensende gener. Men som dagens databaser ikke inneholder informasjon om onkogene rolle intergeniske regioner, begrenset vi vår videre analyse for å transposon innsett i genområder.

Klonale utvidelser identifisere kandidatkreftgener

klonal ekspansjon analyse av transposon innsettinger i genområder identifisert 88 unike gener som representerer potensiell kandidat kreftgener (Figur 4A). Etter avtale med denne spådommen, observerte vi flere gener blant våre kandidat gener som er involvert i kreft. For eksempel, ble ni av våre kandidat kreftgener også finnes i Cancer Gene Census liste, som omfatter 487 gener kausalt knyttet til kreft [11], som representerer en meget betydelig berikelse (

Abl2

,

BRAF

,

Fbxw7

,

Foxp1

,

Ipo11

,

Mllt3

,

Fas

,

PTEN

og

NF1

; p. 0,0002, Fishers eksakte test)

A) clonally utvidede genet innsettinger i tumorprøver, sortert etter deres gjennomsnittlige lese frekvenser (

f

) . Tre mus næret to tumorer hver (tumor 01 og 08, tumor 05 og 09, og tumor 04 og 10, henholdsvis). En blå stjerne betegner gener som finnes i Cancer Gene Census liste, en liste over 487 gener årsaks innblandet i kreft.

Mamdl1 Hotell og

Dgkd

ble truffet i uavhengige tumorprøver og er uthevet i rødt og rosa, henholdsvis.

B) Cellular prosesser som påvirkes av clonally utvidede genet innsettinger. Prosess kategorier ble samlet fra funksjonelt gen informasjon på www.omim.org og www.informatics.jax.org.

I vår studie, tre kohortstudier dyr gjennomført to svulster hver (Figur S1). Interessant, to par av svulster viste ingen overlapping av kandidat kreftgener (svulster 01 og 08, tumorer 04 og 10), som indikerer uavhengig opprinnelse av tumorer. I kontrast, svulster 05 (solid svulst masse i leveren) og 09 (follikulært lymfom) delt 5 kandidat kreftgener, noe som indikerer en felles opprinnelse. Som leveren er et felles nettsted for invasjonen for lymfatisk leukemi [12], er det mulig at levertumor 09 er en metastatisk tumormasse som er avledet fra milt lymfatisk svulst 05. Av notatet, fem felles kandidat kreftgener svulster 05 og 09 (

PTEN, Fas, Esr1, Abl2, Lrp1b

) ble uavhengig oppnådd i begge svulster med liknende gjennomsnittlig lese frekvenser, bekrefter robustheten vår sekvense metode for å identifisere klonal ekspansjon av innsettinger.

Når analysere kandidatgener for betydelig berikelse av funksjonelle kategorier ved hjelp av DAVID bioinformatikk ressurs (https://david.abcc.ncifcrf.gov) [13], fant vi en betydelig berikelse av protein kinase relaterte kategorier og veier (f.eks KEGG : MAPK signalveien, p 0,016; Interpro: Protein kinase, core, p 0,016; Benjamini-Hochberg korrigert P-verdi; Tabell S3). På samme måte når vi manuelt gruppert kandidat gener av deres kjente cellulære prosessen, fant vi at gener involvert i signaloverføring representerte den største gruppen av gener (figur 4B). Andre fremtredende cellulære prosesser av kandidatgener var apoptose, kromatin remodellering, transkripsjon og protein transport /sortering (figur 4B). Interessant, når man ser på celleprosesser på nivået av enkelte svulster, fant vi at hver svulst hatt en eller flere mutasjoner i signal gener, og en blanding av innsettinger som berører minst to andre cellulære prosesser. Dette mønsteret av flere muterte prosesser for hver tumor er i overensstemmelse med ideen om at flere genetiske endringer i forskjellige cellulære prosesser drive tumorvekst [14].

Blant de kandidatkreftgener som er definert ved klonal ekspansjon, ble to gener truffet uavhengig på ulike TTAA steder i flere svulster (unntatt gener som deles av svulst 05 og 09, som deler et felles opphav): Mastermind-domene som en (

Mamld1

) og Diacylglycerolkinase delta (

Dgkd

). Således er disse genene er særlig sterk kandidat kreftgener, slik de er definert dobbelt både ved klonal ekspansjon av innsettinger i de enkelte tumorer og uavhengig forekomst som vanlig innstikk i flere tumorprøver.

Mamld1

genet har blitt mutert av innsettinger i epiteliale svulster i huden (tumor 01, 02 og 03).

Mamld1

blitt foreslått å være en ko-aktivator av ikke-kanonisk Notch signalering [15]. I menneskelig hud, er Notch signalkomponenter rikelig uttrykt, og de-regulering av Notch signalering fører til ulike typer hudkreft [16]. Dermed

Mamld1

er en roman kandidat kreft genet som en regulator av Notch signalering for epiteltumorer.

Dgkd

genet har blitt funnet mutert i solide tumorer 05 (lymfatisk metastase i leveren) og 07 (lunge).

Dgkd

forbrenner 1,2, diacylglycerol (DAG) til fosfatidinsyre (PA). Både DAG og PA spiller viktige roller som andre budbringere for mitogene signaler, og modulering av deres nivå av

DGK

proteiner har blitt foreslått å være en potensiell mekanisme i kreft [17].

Diskusjoner

Vi viser her at high-throughput sekvensering analyse av skåret DNA fra transposon generert svulster gir hjelp til å identifisere kandidat kreftgener ved klonal ekspansjon analyse. Denne fremgangsmåten representerer en forbedret strategi for identifisering av kandidatkreftgener i transposon-skjermer, og gjør det mulig for første gang identifisering av kandidatkreftgener på nivået av den enkelte tumorer.

Kvantifisering av klonal ekspansjon

Current Protocols bruke restriksjonsspaltninger å fragmentere tumor-DNA, noe som resulterer i en skjevhet mot innsettinger som er representert ved korte fragmenter [7], og dermed redusere den kvantitative aspekter av lese nummeranalyse. Vi har søkt akustisk skjær for DNA-fragmentering for å minimalisere størrelsesforskjeller innsetting reiser fragmenter. Denne forbedring i kombinasjon med Illumina high-throughput sekvensering, tillot oss å oppnå en semi-kvantitativ vurdering av den forholdsmessige representasjon av innsettinger. Flere observasjoner antyder at vår fremgangsmåte nådd et nivå på kvantitativ nøyaktighet er tilstrekkelig til å identifisere klonalt ekspanderte innsettinger som definerer kandidat kreftgener. Først, sammenligning av tumor og kontrollprøver viste en tydelig anrikning av innsettings står i tumorprøver. Sekund, analyse av de relaterte svulster 05 og 09 viste sterk korrelasjon mellom lese frekvenser av clonally utvidet innsettinger. Til slutt, gener mutert ved clonally utvidede innsett omfattet mange veldefinerte kreftgener.

Men en viktig påminnelse av klonal ekspansjon analysen er at organene kan bære en rekke pre-kreft innsett som clonally utvidet ved en tilfeldighet. Som våre kontrollforsøk tilsier det, kan disse innskudd utgjør i gjennomsnitt to tredeler av clonally utvidede innsettinger. Således, selv om vår fremgangsmåte er klart effektive for å identifisere kandidatkreftgener i de enkelte svulster, kreft drivende funksjon av hvert gen må ytterligere bekreftet ved alterative metoder, slik som CIS analyse eller funksjonelle analyser.

En faktor som kan påvirke klonal ekspansjon frekvensen av innsettinger er aktiviteten av PiggyBac transposase. Hvis PiggyBac trans aktivitet vil opphøre i løpet av levetiden av musen, vil dette fikse enkelte innsettinger, som skulle vises som klonale ekspansjoner i vår analyse. Vi vil ta den kontinuerlige aktiviteten av PiggyBac transposase i voksen mus vev i fremtidige studier av immunhistokjemiske analyser.

Flere skjevheter i sekvens lese representasjonen i vårt klonal ekspansjon analyse forbli, for eksempel de som er innført av forskjellig GC-innhold av fragmenter under PCR forsterkning. En annen faktor som reduserer den kvantitative kraften i vår fremgangsmåte er mulig tilstedeværelse av ikke-tumor stromale vev i prøvene, som fortynner den klonalt ekspanderte tumor kjøreinnsettinger. I tillegg er en påminnelse av vår metode som uspesifikk Splinkerette primer binding kan føre i noen tilfeller til en dominerende forsterkning av genomiske områder som ikke er sanne transposon innsettinger. Ytterligere tekniske finesser vil bli pålagt å bringe analysen av klonal ekspansjon til et absolutt kvantitativ nivå

High-throughput sekvensering av transposon innsett

Vår sekvense tilnærming ga . 10

6 kartlagt leser per tumorprøve. Et antall av ti

5 leser per prøve var blitt foreslått å være tilstrekkelig til å avdekke alle innsettinger av Tornerose generert tumorer [7].

Legg att eit svar