PLoS ONE: transkriptomet Profilering av kreft, tilstøtende ikke-Tumor og Distant normalt vev fra et tykktarmskreft pasient ved Deep Sekvensering

Abstract

Tykktarmskreft (CRC) er en av de vanligste diagnosen kreft i verden. Et genom-wide screening av transkriptomet feilregulering mellom kreft og normalt vev vil gi innsikt i det molekylære grunnlaget for CRC initiering og progresjon. Sammenlignet med microarray-teknologi, som vanligvis brukes til å identifisere transkripsjons endringer, har nylig utviklet RNA-seq teknikk evnen til å oppdage andre unormale regler i kreft transkriptomet som alternativ spleising, nye transkripsjoner eller genet fusjon. I denne studien utførte vi high-throughput transkriptomet sekvensering ved -50 × dekning på CRC, ved ikke-tumor og fjernt normalt vev. Resultatene viste kreft-spesifikke, differensielt uttrykte gener og differensial alternativ spleising, noe som tyder på at den ekstracellulære matrise og metabolske veier er aktivert og gener relatert til celle homeostase undertrykkes i CRC. I tillegg er en tumor-begrenset genfusjon, PRTEN-NOTCH2, ble også funnet og bekreftet eksperimentelt. Denne studien viser noen fellestrekk i tumorinvasjon og gir en omfattende undersøkelse av CRC transkriptomet, som gir bedre innsikt i kompleksiteten av regulatoriske endringer i løpet tumorigenesis

Citation. Wu Y, Wang X, Wu F, Huang R, Xue F, Liang G, et al. (2012) transkriptomet Profilering av kreft, tilstøtende ikke-Tumor og Distant normalt vev fra en Colorectal Cancer Patient av Deep Sequencing. PLoS ONE 7 (8): e41001. doi: 10,1371 /journal.pone.0041001

Redaktør: Antonio Moschetta, University of Bari Consorzio Mario Negri Sud, Italia

mottatt: 13 desember 2011; Godkjent: 15 juni 2012; Publisert: 08.08.2012

Copyright: © Wu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av Medical Innovasjonsprosjekt prosjekt~~POS=HEADCOMP i Fujian-provinsen (2012-CXB-6). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP (CRC) er en av de mest diagnostisert kreft med over en million nye tilfeller på verdensbasis i alle år [1]. Metastatisk CRC er vanligvis uhelbredelig; som et resultat, er CRC den ledende årsak til kreft-relaterte dødsfall [1], [2]. CRC oppstår fra adenomatøse polypper og utvikler seg til lokalt invasive og senere metastatisk kreft. Progresjon av CRC er en flertrinnsprosess og kan kategoriseres i fire stadier (Dukes staging system) basert på graden av tumorinvasjon [3], [4]. I tidligere studier, flere molekylære mekanismer, slik som genomisk instabilitet [5], [6], [7], tap av DNA-reparasjonsgener [8], [9] og avvikende epigenetiske endringer [10], [11] (se gjennomgang i [12]), ble vist å bidra til utvikling av CRC. I tillegg en objektiv tilnærming av high-throughput screening av uttrykket endringer mellom CRC og normalt vev avdekket flere diagnostiske og prognostiske biomarkører [13], [14], [15]. Imidlertid er helhetlig forståelse av utviklingen av CRC og riktig prognose fortsatt utfordrende oppgave på grunn av den genetiske heterogenitet av CRC og komplekse genomiske forandringer funnet med denne typen kreft [12], [16].

Før studier av genomiske forandringer har avslørt at somatiske endringer, inkludert punktmutasjoner, DNA rearrangementer og kopitallvariasjoner (oversikt i [12]), kan resultere i mutasjoner som driver utvikling av CRC. Som en konsekvens av endringer i kreft-genomet, omprogrammering av transkriptomet fører til unormal celleegenskaper, og dermed bidrar direkte til progresjon av kreft [17], [18]. Studerer kreft transkriptomet ikke bare gjør oss i stand til å fylle gapet mellom sjåføren mutasjoner og kreft celle atferd, men også gir oss mulighet til å identifisere ytterligere kandidatkreftrelaterte mutasjoner og det molekylære grunnlaget for genregulering [17]. Den siste utviklingen av massivt parallell sekvensering (RNA-seq) gir en kraftfull tilnærming til å profilere transkriptomet med større effektivitet og høyere oppløsning [19]. Fordelen med RNA-seq er at denne teknikk gjør mulig studiet av kreft transkriptomet kompleksitet, blant annet alternativ spleising, isoform bruk, genfusjoner og nye transkripter (oversikt i [20], [21]). Til tross for utbredelsen av å bruke RNA-seq å studere ulike kreft transcriptomes [22], [23], [24], [25], den dype annotering av CRC genuttrykk profilering er ikke utført.

I denne studien ønsket vi å grundig kommentere de transcriptomes av CRC vev, ved ikke-svulstvev og fjernt normalt vev fra en enkelt pasient ved RNA-seq. Først fant vi flere kreftspesifikke feilregulert gener og alternativ spleising. For det andre, etter Gene ontologi (GO) og sti analyse av feilregulert gener og isoformer, identifiserte vi en potensiell kandidat sti og en funksjonell klasse av gener som er relevante for CRC progresjon, som ikke har blitt rapportert tidligere. Tredje, vi har oppdaget et nytt gen fusjon hendelsen spesifikt i CRC vev og eksperimentelt bekreftet fusjonsprodukt. Til slutt, for å validere våre sekvense resultater, kvantitativ real-time PCR (qPCR) ble brukt til å bekrefte genuttrykket forskjellen mellom CRC og normalt vev.

Resultater

Karakterisering av sekvensering og kartlegging

Tre prøver – CRC vev (stadium III), ved ikke-tumor vev og fjernt normalt vev – ble samlet inn fra en 57 år gammel kvinnelig pasient. Den clinicopathological informasjon om pasienten er vist i fig. S1. Alle tre prøver ble utsatt for massivt parallell parvise end cDNA sekvensering. Totalt fikk vi 36,5 mill, 33,1 millioner og 29,9 millioner lese parene fra CRC, henholdsvis ved ikke-tumor og fjernt normalt vev,. Vi brukte TopHat å justere leser til UCSC (University of California Santa) henvisning menneskelige genom Hg19. Det unikt Justert leser for de tre prøvene varierte fra 20,8 millioner til 25,9 millioner par. Andelen leser som tilordnes til Ensembl referanse gener varierte fra 75% til 86% for de tre prøvene. Den gjennomsnittlige dekning av vår sekvense dybde var omtrent 50 ganger av human transkriptomet (ca. 113 bp millon, basert på den totale lengde av den unike annotert ekson område i Ensembl database). I tillegg leser bare ~ 1% ble kartlagt til rRNA, noe som indikerer at våre biblioteker er riktig konstruert og trofast representerer uttrykk for RNA med ployA haler. Detaljene av kartleggingsresultater er oppført i Tabell 1.

Analyse av forskjellig uttrykt gener

For å måle genuttrykk og å identifisere differensielt uttrykte gener (degs) blant prøvene , vi brukte metoden for Cuffdiff [26] for å beregne genekspresjon og å identifisere en betydelig feilregulert gener. Den normaliserte Ekspresjonsnivået av hvert gen ble målt ved Fragmenter Per kilobase av exon per million fragmenter kartlagt (FPKM). Ved å kreve at FPKM var større enn én, vi har oppdaget 14854-15168 uttrykte gener i hver prøve, som omfattet de fleste av de kommenterte menneskelige referansegener (se tabell S1 for detaljer). Vi analyserte ytterligere korrelasjonen av genekspresjon mellom prøvene. De globale profiler av genekspresjon var generelt høyt korrelert med Pearson korrelasjonskoeffisient, som strekker seg 0,90 til 0,94 (fig. 1A). I tillegg indikerer clustering analysen at CRC transkriptomet skiller seg fra de av tilstøtende ikke-svulstvev og fjernt normalt vev (fig 1B.)

A:. Scatterdiagrammet for global uttrykk mellom prøvene; Pearsons korrelasjonskoeffisient er vist; B: Hierarkisk gruppering av forskjellig uttrykt gener (degs) blant prøver; C: Venn-diagram for å illustrere de overlapp degs mellom prøver; D: Volcano tomter for alle genene i hvert sammenligning. De røde og blå prikker indikerer at opp- og ned-regulert degs var signifikant på q-verdier mindre enn 0,01.

Vi oppdaget 1660, 1528 og 941 betydelige degs mellom CRC og tilstøtende vev, CRC og normalt vev og den tilstøtende og normalt vev, henholdsvis (den komplette lister over degs er oppsummert i tabell S1). Overlappingen av de degs mellom de tre prøvene er vist som et Venn-diagram i fig. 1C. Det er bemerkelsesverdig at CRC gir mer feilregulert gener (1660 gener i CRC vs. tilstøtende, 1528 gener i CRC vs. normal) enn de to andre vev, som er 1,5 ganger rikere enn de som finnes i andre vev (941 gener i normal vs . tilstøtende), som indikerer den kreftspesifikke omprogrammering av CRC transkriptomet, som vist i «vulkan plottet» av genekspresjonsprofiler (fig. 1D). Når man sammenligner retning av degs, antall opp- og ned-regulerte gener som er identifisert mellom CRC og de to andre prøver var tilnærmet like. I motsetning til dette ble det observert en liten økning i ned-regulert gener i tilstøtende ikke-tumorvevet i forhold til den tilstøtende kreft og normalt vev. MA-plot av genuttrykk profiler (fig. S2) viser at betydelig antall feilregulert gener ikke er forutinntatt mot høyt uttrykte gener.

I tidligere studier, flere viktige gener som er relevante for CRC har blitt identifisert. For å finne ut om våre funn var i samsvar med rapporterte resultater, vi systematisk i forhold endringer i uttrykket av spesifikke CRC-relaterte gener med de som er identifisert i andre studier. Vi fant at 15-prostaglandin-dehydrogenase (15 PGDH), et hastighetsbegrensende enzym som katalyserer degradering av prostaglandin [27], er betydelig nedregulert i CRC i kreftvevet sammenlignet med normale vev. Aktivering av COX-2 og tap av 15-PGDH er vanlige onkogene hendelser som blir observert i ~80% av tilfellene CRC [28]. I tillegg fant vi en annen tumor suppressor,

TGFBR2 product: [29], som ble nedregulert i både CRC og kreftfrem tilstøtende vev. På grunn av at inaktivering av TGFBR2 er koordinert med overgangen fra adenom til karsinom, er den progressive inaktivering av TGFBR2 i kreft-tilstøtende og tumorvev forventet. Vi har også oppdaget andre gener som ble feilregulert i CRC, inkludert APC [30], MYH [31], CD133, IDH1 og MINT2 [10]. I motsetning til dette, flere kjente driver faktorer som ofte er mutert i CRC, inkludert MINT3 [32], [33], MSH2 [34] og MSH6 [9], viste ingen endring i ekspresjon i denne studien, noe som tyder på at den genetiske heterogeniteten av CRC eller de muterte produktene kan være skadelig, selv om uttrykket nivået er upåvirket.

Funksjonell berikelse analyse av forskjellig uttrykt gener

for bedre å forstå funksjonen av degs, gjennomførte vi en berikelse analyse av Gene ontologi for feilregulert gener. For å identifisere kreftspesifikke undermenyer, vi urfremført parallelle berikelse tester for betydelig opp- og ned-regulert gener som ble oppdaget av pair-wised sammenligninger i Barnekonvensjonen, ved siden av ikke-tumor og normalt vev ved hjelp av elektroniske verktøy fra DAVID [35 ]. Farten kategoriene som ble betydelig anriket i feilregulert gener fra sammenligningen av CRC vs. kreft ved ikke-svulstvev og CRC vs. normalt vev, men ikke ved ikke-tumor vs. normalt vev, ble valgt. Totalt ble det opp- og ned-regulerte gener i CRC kategorisert i 47 kreftspesifikke funksjonelle kategorier (fig. 2). Interessant, selv om vi har identifisert et likt antall opp- og ned-regulerte gener i CRC, observerte vi et overskudd av betydelige GO kategorier for CRC oppregulert gener, noe som tyder på at den opp-regulering av kreftspesifikke gener som er funksjonelt viktig for cancer progresjon. For eksempel, den betydelige GO betingelser for opp-regulerte gener, som inkluderer «celle migrasjon», «celle motilitet» og «ekstracellulær matriks bindende», som er relevante for kreft invasjon [15], [36], [37]. I tillegg kan genene som er knyttet til metabolske forandringer, inkludert «kollagen metabolske prosess», «flercellet organismemakromolekyl metabolske prosess» og «flercellet organisme katabolisk prosess», reflekterer endring av tumor metabolismen [38], [39] og er også over representert i barnekonvensjonen. Tvert imot, er gener som er nedregulert i CRC beriket i flere funksjonelle prosesser knyttet til homeostase.

Vi valgte bare GÅ kategorier som beriket kreft-relaterte feilregulert gener, men ikke berike feilregulert gener som ble identifisert ved sammenligne normalt vev med tilstøtende ikke-svulstvev. Kreftspesifikke feilregulert gener ble kategorisert som betydelig opp- eller nedregulert gener i kreftvevet. Signifikansnivået er angitt ved forskjellige farger. Den «s1», «s2» og «S3» indikatorer betegne «kreft», «tilstøtende ikke-tumor» og «fjerne normale» vev, henholdsvis.

En mer informativ analyse av funksjonell annotering kan oppnås ved å studere den berikelse av differensielt uttrykte gener i en bestemt bane. Vi brukte DAVID [35] for å analysere hvilke KEGG veien ble beriket med CRC-spesifikke feilregulert gener. Trasé beriket med degs er oppført i tabell 2. ekstracellulære matriks (ECM) reseptor interaksjon veien ble ofte påvirket i alle de parvise sammenligninger, og slike genregule endringer i ECM veien var mye mer alvorlig i CRC vev. I tillegg ble det sentrale vedheft pathway beriket i degs identifisert fra CRC vev.

For å eksperimentelt bekrefte differensielt uttrykte gener identifisert av RNA-seq, uttrykket nivåer av utvalgte gener ble validert i hvert prøven av kvantitativ real-time PCR (QRT-PCR). Vi valgte fem kandidatgener (COL1A1, COL3A1, fn1, SPP1, og ITGB5) fra ECM vei (i henhold til genuttrykk nivå og brett endring mellom CRC og normalt vev) som ble uttrykt forskjellig av Cuffdiff (tabell S2). Vi brukte GAPDH som en endogen kontroll i disse reaksjonene. QRT-PCR-resultater bekreftet at alle disse kandidat gener viste nesten identiske endringer i genekspresjon i de detekteres via RNA-seq teknikk, som vist i fig. 3.

QRT-PCR ble utført i fem gener som er identifisert som differensial uttrykte gener mellom CRC og to andre vev. Ekspresjonsnivået av hvert gen ble normalisert til nivået i normale vev. Den «s1», «s2» og «S3» indikatorer betegne «kreft», «tilstøtende ikke-tumor» og «fjerne normale» vev, henholdsvis.

For å undersøke om disse genene var alltid opp -regulated i tykktarmskreft, utførte vi den QRT-PCR for å teste uttrykket endringer for de fem gener mellom sammenkoblede kreft og normalt vev i ytterligere ti pasienter. Resultatet av en parvise prøver fra en pasient ble ekskludert på grunn av stor variasjon innen tekniske replikater. Resultatet av de forble pasienter viste at, med unntak av ITGB5, de tre andre gener COL1A1, FN1and SPP1were oppregulert i seks kreftprøver, og COL3A1 ble oppregulert i fire kreftprøver (tabell S3), noe som tyder på ECM-veien gener er vanligvis oppregulert i tykktarmskreft. I tillegg kan kreft prøver av fem pasienter bli gruppert sammen i henhold til uttrykket nivåer av disse fem gener (fig. S3).

Analyse av alternativ spleising og differensial bruk av isoformer

Én gen locus kan uttrykke flere isoformer av alternativ spleising (AS). Utskriften mangfold fører til plast transkripsjons nettverk i kreft, som er viktig for å generere de uvanlige egenskapene til kreftceller [40], [41]. Av de mange molekylære mekanismer som kan generere AS isoformer, ekson hoppe avkorte den funksjonelle domenet er den vanligste måten å generere protein produkter med alternative funksjoner hos pattedyr [41]. Vi utførte derfor genome-wide screening for å identifisere kreft begrenset ekson hoppe hendelser ved hjelp av programvare Miso (blanding av isoformer) [42]. Totalt, vi har oppdaget 14072, 14537 og 13865 ekson hoppe hendelser i CRC, tilstøtende ikke-svulstvev og normalt vev, henholdsvis. Deretter undersøkte man differensial exon hoppe (DES) arrangementer (tabell S4) blant prøver, som vist i fig. 4A. Vi fant at: i) bare en liten andel av DES hendelser ble delt i tre måte sammenligning tyder på at en betydelig andel av gener som er under cancer-spesifikk regulering av alternativ spleising; og ii) antallet av Dess mellom normal og tilstøtende vev er mindre enn antallet DES hendelser mellom CRC og tilstøtende vev eller CRC og normalt vev, hvilket indikerer den forbedrede anvendelse av differensial-isoformer i kreft. Fordi ES hendelser er sannsynlig å endre protein funksjon ved å påvirke den funksjonelle domene, er antallet DES hendelser i CRC vev omtrent det dobbelte av ikke-kreft vev, noe som indikerer at spleiseveien kan bli betydelig aktiveres i CRC for å generere ulike funksjonelle produkter. Vi sjekket uttrykk for kutting faktorene stammer fra NCBI og SpliceAid 2 (https://www.introni.it/spliceaid.html), og fant at fire spleise faktorer, blant annet RBFOX1, SPRK1, MBNL1 og SRRM2, ble betydelig dysregulerte mellom kreft vev og ikke-kreft vev (tabell S1), noe som tyder på at den avvikende spleising aktivitet i kreftvevet kan være relatert med den feilregulering av skjøte faktorer.

(DES) hendelser blant prøver. A: Venn-diagram av antallet DES hendelser; B:. Overlappingen mellom forskjellig uttrykt gener og gener med DES hendelser

Mens degs har allerede vist seg å være betydelig i CRC, ville det være interessant å fastslå graden av overlapping mellom degs og gener med DES hendelser. Som vist på fig. 4B, bare tre gener (3/752, ~0.4%) ble samtidig påvirket av endringer i transkripsjonsregulering og post-transkripsjonsregulering (dvs. alternativ spleising).

For å identifisere svært pålitelige kreftassosierte gener med DES hendelser, filtrert vi DES hendelser ved noen skritt serie (Materiale og metode) fra alle DES hendelser (tabell S4) og oppnådde 20 pålitelig DES hendelser fra 14 kreftassosierte gener (Tabell 3). Seks gener, inkludert ADD3, CTNND1, EPB41L3, F3, MUC4 og PDGFA, viste kreft-vevsspesifikke DES hendelser. Som vist på fig. 5. Forholdet mellom kryss-leser nummer for exon inkludering versus utelukkelse ekson var åpenbart lavere i kreftvev enn i de to andre vev. Den leser kartlegging av andre fem gener som er vist i fig. S4-S8 henholdsvis.

RNA-Seq leser var kartlegging til UCSC referansen genomet (hg19) av ADD3. CRC vev sporene ble vist i rødt, tilstøtende ikke-svulst i grønt og normalt vev i blått. Tellingene av leser spenner krysset av eksoner ble vist.

differensial skjøting av ADD3 er funnet i den ikke-småcellet lungekreft [43] og murine bryst svulst [44 ]. Interessant, ADD3 viste en kassett ekson inkludering i disse to studiene, men det viste en kassett ekson eksklusjon på samme sted i vår studie. I en annen studie av menneskelige embryonale stamceller (hESCs) har utelukkelse kassett ekson også blitt funnet i hESCs i forhold til de som stammer hjerte forfedre [45]. Selv i forrige lungekreft studien var det også heterogent bevis for alternativ spleising mønstre av ADD3 (fire av 18 lunge-kreftpasienter viste en kassett ekson utelukkelse for ADD3) [43]. Derfor bør videre studier på ADD3 gjøres for å forstå forholdet mellom sitt alternativ spleising med kreft.

Bioinformatikk prediksjon av gen-fusjonsbegivenheter

Vi brukte to algoritmer, uskadeliggjøre og Hat-Fusion, til påvise genet fusjon basert på pair-endene leser i forskjellige prøver. Selv om ulike resultater ble generert av defuse og Hat-Fusion (tabell S5), en fusjon hendelse mellom PTGFRN og NOTCH2 var den eneste kreftspesifikke fusjon hendelsen identifisert av begge algoritmer. Som vist på fig. 6A, PTGFRN og NOTCH2 skilles på kromosom 1 av 3 millioner bps, og villtype former er transkribert fra motsatte retninger. I vår kreft prøve, vi har oppdaget at den første intron av PTGFRN er smeltet sammen med 3 «krysset av 17. ekson av NOTCH2 å generere en kimære PTGFRN-NOTCH2 transkripsjon. Det er verdt å merke seg at en delvis intronic region av PTGFRN er til stede i moden mRNA på grunn av denne sammensmelting hendelse (fig. 6B). Vi har således hver for seg utformet et par av primere som koordinere med det første intron av PTGFRN og ekson område av NOTCH2 for å bekrefte denne fusjon i normal, tilstøtende ikke-tumor og kreftvev ved RT-PCR. Resultatene indikerte at dette fusion hendelsen er kreft-begrenset (Fig. 6C), som er i tråd med konklusjonene fra vår RNA-seq analyse. I tillegg undersøkte vi PTGFRN-NOTCH2 genet fusjon i ytterligere ti prøver av RT-PCR, men ingen av dem viste genet fusjon, noe som tyder på at PTGFRN-NOTCH2 kan være en sjelden gen fusjon ved kolorektalkreft.

A: den inter-kromosom genet fusjon innebærer PTGFRN (vist i gult) og NOTCH2 (vist i grønt) loci; Avstanden mellom disse to loci er tre MBP. Fusjons hendelsene ble oppdaget av to-end leser som spredte fusjon regionen og leser at krysset fusjon regionen; B: Sammenligning av den leser kartleggingsresultater for fusjons transkripsjonene mellom de tre prøvene. Strukturen av fusjonsgenet er på bunnen. Den leser teller på «normal», «tilstøtende ikke-tumor» og «kreft» tissue betegnes som «grønn», «blå» og «rød» bar, respektivt. C: RT-PCR med sekvenseringsresultatene av fusjonstranskript i de tre prøvene. PCR primer er merket i panel A. D: Prediksjon av ORF av og dens funksjon for PTGFRN-NOTCH2 av bioinformatikk, ble det startkodon hjelp startkodonet av NOTCH2 og stoppkodon (red «*») som ligger i fusjonen sekvens fra PTGFRN. Sammensmeltingen peptid inne domenene (spådd av CD-søk i NCBI) i sin region fra NOTCH2, som EGF-domener, men noen viktige domener i proteinet NOTCH2 som HAKK domene og Ankyrin repeterer, manglet.

ved hjelp av strenger-spesifikke revers-transkripsjon og PCR, fant vi at fusjonsgenet transkribert med arrangøren av NOTCH2. Vi spådde ORF av fusjonsgenet ved hjelp startkodonet av NOTCH2 (Fig. 6D). Dette spådd protein tilsvarer en 934aa peptidsekvens med det første 917aa fra NOTCH2 (disse sekvensene ble oppført i Tilleggs S1). Vi kommenterte proteinsekvensen bruker CD-søk verktøy i NCBI (https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi, database: CDD), og fant noen EGF-domener i peptid regioner fra NOTCH2. Men noen vesentlige domener i NOTCH2, slik som HAKK domene og Ankyrin gjentas, gikk tapt i fusjonsproteinet (fig. 6D). Derfor inferred vi at genet fusjon PTGFRN-NOTCH2 i denne studien viste seg å være mer som en tap-av-funksjon mutasjoner, i samsvar med de nylig beskrevet for myeloid leukemi [46], hode og nakke plateepitelkarsinom [47], [ ,,,0],48]. Likevel, den generelle uttrykk for villtype PTGFRN, NOTCH2 og sine mål (PTCRA, HES1, HES5) er mindre berørt av kreft (tabell S6), noe som indikerer at 1) PTGFRN-NOTCH2 fusjon kan oppstå i en undergruppe av kreftceller eller 2) at sammensmeltningen er heterozygot i kreftvev og fusjons allelet kan bli uttrykt ved et meget lavere nivå. Videre undersøkelser er nødvendig for å forstå den spesielle mekanismen for denne fusjon arrangementet og funksjonell konsekvens.

Diskusjoner

Ved hjelp av RNA-seq teknologi, vi profilert hele transcriptomes fra CRC, ved ikke-tumor og normalt vev med ekstremt grundig. Totalt ca 50-70 millioner leser ble generert per prøve, noe som gjorde oss i stand til å kvantifisere genuttrykket overflod på et bredt spekter [49]. Antallet uttrykte gener (FPKM 0) oppdaget i vår studie er ca 67% av de totale UCSC referanse gener per prøve, som representerer flertallet av transkriptomet

Alternativ regulering av genekspresjon kan oppnås ved. transkripsjonen og post-transcriptional regulering. Den første klassen av dysregulering av CRC på transkripsjonsnivået har blitt godt undersøkt ved hjelp av mikromatriser [14], [15], [50]. Kvantifisere andre klasse av regulatoriske endringer er fortsatt utfordrende til tross for oppfinnelsen av ekson matrisen [51]. RNA-seq teknologi muliggjør samtidig studium av disse to ulike mekanismer [19], [26], [52], [53]. I vår studie undersøkte vi transkripsjonen dysregulering ved å analysere degs. Deretter brukte vi par-ende-cDNA-sekvensering for å identifisere mer effektivt alternativ spleising. Videre, ved å ansette miso algoritmen, var vi i stand til å måle den relative uttrykket nivået av forskjellige isoformer produsert av ekson-hopper hendelser, som er kvantitative målinger av alternativ spleising. Interessant, genene er berørt av disse to ulike reguleringsmekanismer er uavhengige (Fig. 4B), noe som tyder på mange måter for å omprogrammere kreften transkriptomet.

Den lokale invasjon og fjernmetastaser av kreft har vært ansett som en flertrinnsprosesser komponert av regelverket endring av intracellulær krets og det komplekse samspillet mellom kreftceller og deres mikro [36], [54], [55]. Under invasjon og metastasering, hyppig ombygging av ekstracellulære matrise gjør kreftceller til å spre fra primærsvulster og invadere normalt vev. I vår studie fant vi at mange gener relatert til ekstracellulære matrix (ECM) reseptor interaksjoner er høyt dysregulerte i en kreft-begrenset måte. ECM er sammensatt av flere typer av makromolekyler, inkludert kollagen-type proteiner, laminins, tenascin og andre adhesjonsmolekyler [55]. Alle de kollagen-type-gener, inkludert type I-IX kollagen, blir oppregulert 10 til 1000 ganger i kreftvev (tabell S7). Selv om det er noen samsvar mellom våre observasjoner og tidligere studier på oppregulering av kollagen mRNA i kolorektal kreft vev [56], er den gjennomgripende induksjon av kollagen mRNA unikt for vår studie. Disse funnene tyder på at omprogrammering av kollagen familienettverk under tykktarmskreftutvikling kan være mye mer komplisert enn tidligere antatt. I tillegg har vi også bemerkes at medlemmer av matriks-metalloproteinase (MMP) familien, som nedbryter ECM strukturer [55], [57], er også betydelig induseres i kreftvev, i samsvar med en tidligere rapport [58]. The ganger endring i uttrykket av MMP varierte fra 10 ganger (MMP1, MMP3 og MMP14) til 554 ganger (MMP7). I mellomtiden, andre celle-celle-adhesjons-relaterte molekyler, slik som laminins (LAMA4, LAMA5, LAMB1, LAMB2 og LAMC2) og integriner (ITGA5, ITGA5, ITGB5, ITGA11 og ITGBL1), er forhøyet i kreftvev. Vi har også oppdaget at den opp-regulering av vaskulær endotelial vekstfaktor (VEGF), noe som tyder på at de «angiogenese bryter» er aktivert i kreftvevet. Til sammen den globale oppregulering av ECM sti og angiogene vekstfaktor tyder på at CRC progresjon fører til massiv ECM ombygging og utvidelse av nye fartøyet nettverk. Dessuten har tidligere undersøkelser vist at gener i ECM-reaksjonsveien er under intensiv epigenetisk modifikasjon [59] og kan således være nye prognostiske markører; dermed vår studie gir større innsikt i å bruke uttrykk endringer i ECM pathway medlemmer som kandidat biomarkører.

Gene fusjon, noe som ofte resulterer fra en genomisk aberrasjon, har vist seg å være nøkkelen mekanisme for å generere kimære «onkogener» som iverk tumorigenesis eller bidra til tumorprogresjon (anmeldt i [60]). Ved hjelp av RNA-seq teknikk, det uttrykte genfusjon transkripsjon som er mer sannsynlig å produsere et funksjonelt produkt kan detekteres [23], [61]. Gitt at vanlig genfusjon er sjeldne i CRC [5], identifisere case-spesifikke gen-fusjon kan hjelpe til å forstå kompleksiteten av det molekylære grunnlaget for CRC utvikling. I denne studien, vi har oppdaget en kreft-begrenset genet fusjon mellom PTGFRN og NOTCH2 i CRC. I tillegg ble genfusjoner mellom de immunoglobulin-lambda-variablene og IGLL5 detektert i filtrerings resultat av Hat-Fusion (tabell S5), som kan representere immun rearrangementer i tumorassosierte B-celler. Tidligere studier antydet at konsekvensen av gen-fusjon kan være i) en endring av genekspresjon [62]; eller ii) generering av en avkortet eller kimært protein med en annen funksjon [63]. Fordi PTGFRN-NOTCH2 transkripsjon omfatter bare en liten del av PTGFRN og uttrykk for PTGFRN og NOTCH2 ikke nedregulert i CRC, resonnere vi at de opprinnelige funksjonene til disse to genene ikke er berørt av denne fusjon hendelse, og derfor vinning av funksjon av dette fusjonskonstruksjon som vil være spesielt interessant for fremtidige studier. Gitt at flertallet av fusjonsgenet er sammensatt av NOTCH2, kan funksjonen av dette fusjonsprodukt være mer relatert til den for NOTCH2. NOTCH2 er en homolog av NOTCH1 og spiller en rolle i en rekke utviklingsprosesser ved å styre celle skjebne beslutninger. NOTCH2 ekspresjon er vist å være en prognostisk prediktor, og er relatert til tumor differensiering status i CRC [64], [65]. I tillegg forsterkningen i funksjon av avkortet NOTCH2 med nonsens mutasjoner forårsaker en autosomal dominant skjelettforstyrrelse [66]. Derfor kan NOTCH2 spille en viktig rolle i CRC utvikling, og PTGFRN-NOTCH2 genet fusjon kunne introdusere dominerende negative effekter på normal utvikling-programmet.

Materialer og metoder

Prøve informasjon

Skriftlig informert samtykke fra pasientene ble innhentet, og denne serien av studier ble gjennomgått og godkjent av institusjonelle etiske komiteer av Fujian Provincial Hospital (Fuzhou, Kina). Tre prøver anvendt i RNA-Seq, inkludert fjernt normal tykktarmsslimhinne, tilstøtende kolon mukosa og kreft, ble samlet opp fra en pasient som kinesisk ble diagnostisert med stadium III kolon adenokarsinom. Avstanden mellom tilstøtende ikke-tumor og kreftvev grense er omtrent 1 cm, mens den for fjernt normalt vev og kreftvev er omtrent 10 cm. Fig. S1 gir mikrograf av kreft prøven brukes i vår studie. Ti sammenkoblede normale og kreftprøver brukes i ytterligere kontroll og godkjenning ble innhentet fra ti pasienter med stadium III kolon adenokarsinom.

Bibliotek forberedelse

Total RNA ble ekstrahert fra normal, ved ikke-tumor og kreft kolon vev

Legg att eit svar