PLoS ONE: Integrert Exon nivå Expression Analyse av Driver genene forklarer sin rolle i Colorectal Cancer

Abstract

Integrert analyse av genomisk og transcriptomic nivåendringer holder løftet for en bedre forståelse av tykktarmskreft (CRC) biologi. Det er et relevant behov for å forklare den funksjonelle virkningen av genomet nivåendringer ved å integrere informasjon ved transkripsjon nivå. Ved hjelp av høy oppløsning cytogenetikk array, hadde vi tidligere identifisert driver gener ved «Genomisk Identifisering av vesentlige mål i Cancer (GISTIC)» analyse av parvise tumor normal prøver fra pasienter med kolorektal kreft. I denne studien analyserer vi disse sjåfør genene på tre nivåer ved hjelp av ekson array-data – genet, ekson og nettverk. Gene nivå analyse avdekket en liten del å oppleve differensial uttrykk. Disse resultatene ble forsterket ved å utføre separate differensial uttrykk analyser (SAM og LIMMA). ATP8B1 ble funnet å være det nye genet assosiert med CRC som viser endringer på cytogenetisk, genet og ekson nivåer. Splice indeks av 29 eksoner som svarer til 13 gener ble funnet å være betydelig endret i tumorprøver. Driver gener ble brukt til å konstruere regulatoriske nettverk for tumor og normale grupper. Det var rearrangements i transkripsjonsfaktorgener antyder tilstedeværelsen av regulatoriske veksling. Det regulatoriske mønster av AHR genet ble funnet å ha den mest betydningsfulle endringen. Våre resultater integrere data med fokus på driver gener resulterer i høyanriket nye molekyler som trenger videre studier for å etablere sin rolle i CRC

Citation. Aziz MA, Periyasamy S, Al Yousef Z, AlAbdulkarim jeg, Al Otaibi M , Alfahed A, et al. (2014) Integrert Exon nivå Expression Analyse av Driver genene forklarer sin rolle i tykktarmskreft. PLoS ONE 9 (10): e110134. doi: 10,1371 /journal.pone.0110134

Redaktør: Osman El-Maarri, Universitetet i Bonn, Institut for eksperimentell hematologi og transfusjonsmedisin, Tyskland

mottatt: 20 februar 2014; Godkjent: 16 september 2014; Publisert: 21 oktober 2014

Copyright: © 2014 Aziz et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble finansiert av kong Abdullah International Medical Research Center gjennom forskningsstipend RC10 /083 tildelt MAA. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Det er et vell av informasjon på omics nivå som knytter cytogenetikk og genuttrykk endringer som fører til tykktarmskreft (CRC). Integrasjonen av genekspresjon og kopinummer (CN) data for å identifisere DNA CN forandringer som induserer endringer i ekspresjonsnivåer av de tilknyttede genene er et vanlig oppgave i studier av kreft [1] – [3]. Det sentrale dogmet om molekylærbiologi har dermed vært behandlet i to viktige nivåer. Det har vært mange rapporter som dokumenterer endringer i genomet nivå i form av kopi antall avvik [4], enkeltnukleotidpolymorfi, tap av heterozygositet som forsøker å forstå de molekylære hendelser assosiert med tykk- og endetarmskreft. Disse somatiske eller arvelige endringer har annen mekanisme for å bidra til initiering og progresjon av CRC. Tap og gevinst på viktige kromosomale regioner som fører til sletting eller forsterkning av kreftrelaterte gener har blitt svært godt etablert. Den funksjonelle betydningen av disse molekylære hendelser har vært målt ved hjelp av ulike verktøy og algoritmer. Gener målrettet av somatiske kopinummer endringer (SCNAs), spesielt, spiller sentrale roller i onkogenese og kreftbehandling [5]. Flere verktøy er gjort tilgjengelige for å vurdere potensialet av gener som blir berørt av SCNAs i forårsaker kolorektal kreft. «Genomisk Identifisering av vesentlige mål i Cancer «(GISTIC) verktøyet har med hell blitt brukt for å identifisere» driver SCNAs» basert på frekvens og amplitude av observerte hendelser [6], [7]. Det andre aspektet ved endringer som skjer i tumorceller er på transkripsjonsnivå. Det er gjennomført differensial uttrykk analyse for å finne ut viktige gener som spiller en rolle i å forårsake tykktarmskreft. Det kan være flere mekanismer som de SCNA påvirket genene utøver sin effekt på funksjonsnivå. Presiseringer og slettinger i genomisk region gjenspeiles i transkripsjonsnivåer og kunne påvises ved å utføre uttrykk microarray baserte studier. Ved å ansette ekson arrays, får vi ekstra dimensjon av hendelsene skjer på ekson nivå, noe som kan føre til alternativ spleising resulterer i forskjellige gen isoformer. Alternativ spleising er et viktig skritt i den generasjonen av protein mangfold og dens misregulation er observert i mange humane krefttyper [8].

forsøk på å utforske forholdet mellom kopinummerendringer og uttrykk nivå av berørte gener /eksoner har fått begrenset suksess på grunn av en rekke årsaker [9]. Teknologiske forbedringer i rekken design for cytogenetikk samt transcriptomics har forbedret nøyaktighet og presisjon av data generert. Kombinert med bedre analytiske teknikker og algoritmer, muligheter for å finne målet gener ansvarlig for forårsaker kolorektal kreft har økt ytterligere.

siste tiårene har sett en søken etter å finne nye gener som kan tjene som terapeutiske mål eller biomarkører. Imidlertid, gener eller proteiner ikke fungere alene, men kommuniserer med hverandre for å danne nettverk eller trasé for derved å utføre biologiske funksjoner [10]. Nettverksbaserte tilnærminger til å finne biomarkører nærmere representere

in vivo

molekylærbiologi hvor en forstyrrelse i ett gen kan påvirke mange nedstrøms gener. Kreft er således rette opp som en systembiologi sykdom [11] i motsetning til sykdommer forårsaket av endringer i noen gener eller mutasjoner. Rekonstruere gennettverk hos friske og syke vev er derfor avgjørende for å forstå kreft fenotyper og utarbeide effektive behandlingsformer [12].

Med tilgjengeligheten av verktøy og teknikker for å fange de molekylære endringer som skjer på ulike stadier av det sentrale dogmet med økt presisjon og nøyaktighet, er vi ennå for å utvikle en integrert helhetlig bilde som kan hjelpe oss i å finne bedre mål for tykktarmskreft. I denne studien har vi som mål å integrere informasjon fra cytogenetisk analyse med ekson nivå uttrykket data ved hjelp av sammenkoblede normal-tumorprøver fra pasienter med kolorektal kreft. Et sett med driver gener slått av GISTIC analyse (betegnet som «driver gener «fra nå og utover) ble spørres på genet, ekson og nettverksnivå. Både DNA og RNA for cytogenetics og transcriptomic studier, henholdsvis, ble ekstrahert fra det samme vev i en enkelt arbeidsflyt for å minimere variasjoner. Denne studien gir bevis for å forklare forskjellige mulige mekanismer som SCNA berørte driver gener kan utøve sin funksjonelle effekt. En undergruppe av driver genene ble funnet å vise genet nivå endringer i uttrykk. De fleste av disse genene også indikert at endringene exon nivå som resulterer i dannelsen av forskjellige isoformer. Nettverk av GISTIC gener viste en klar dreining i transkripsjonsfaktorer (TF) regulering. ATP8B1 genet ble funnet å ha ny tilknytning kolorektal kreft på cytogenetisk, gen og ekson nivå.

Materialer og metoder

Studiet er godkjent av etisk komité og Institutional Review Board (IRB) av kong Abdullah International medisinsk forskningssenter etter nøye gjennomgang prosessen med de etiske aspektene ved forslaget. De nødvendige prosessuelle og etiske samtykkeerklæring ble undertegnet av hver pasient før prøvetakingen.

Prøvetaking og RNA ekstraksjon

Prøveinnsamlingen ble gjort som beskrevet tidligere [13]. Typen og fasen av alle pasientprøver er gitt i tabell S1. Studien ble godkjent av Institutional Review Board etter rettssikkerhet. Pasientene ble samtykket og postene opprettholdes på en godkjent måte. RNA ble ekstrahert fra det samme stykke vev som ble brukt for å ekstrahere DNA for cytogenetisk studier i en enkelt arbeidsflyt. Maceherey Nagel trio prep kit (Tyskland) ble brukt for å ekstrahere DNA og RNA i samme protokoll. Kvalitet og kvantitet ble kontrollert ved hjelp av Nanodrop (Thermo Fisher Scientific, USA).

Exon microarray

Genechip Menneskelig Exon 1,0 ST Arrays sammen med WT Terminal Merking og kontroller Kit og Hybridisering, Wash, og Stain sett ble oppnådd fra Affymetrix USA. Ambion WT Expression Kit ble oppnådd ved Ambion, USA. 31 Tumor og 29 normale prøver fra 32 pasienter ble behandlet. Dataene ble hentet ved hjelp av Expression Console programvare fra Affymetrix, USA. Kvalitetskontroll ble utført ved hjelp av Principal Component Analysis (PCA) og Integromics biomarkør suite (TIBCO spotfire). Alle dataene er deponert i GEO database med et tilgangsnummer GSE50421.

Data Analysis

Før enhver gen /ekson nivå analyse, prinsipal komponent analyse (PCA) ble gjort for å identifisere rammene. Data fra 4 normale prøver og 7 tumorprøver ble senere fjernet.

Dataanalyse spesielt med sjåfør gener

Gene nivå analyseverktøy.

For å sjekke uttrykk nivåer av 144 driver genet liste generert av GISTIC analyse (13), ansatt vi to forskjellige programvare – Expression konsoll og AltAnalyze [14]. To forskjellige programvare ble brukt til å bekrefte våre resultater ved hjelp av uavhengige metoder. Signal estimatene ble avledet fra CEL filer av 60 prøver (29 normale og 31 kreft) ved hjelp av Robust Multi-Array Gjennomsnittlig (RMA) for å normalisere dataene. Kjerne exon-nivå probe sett ble brukt til å oppsummere genuttrykk nivåer.

Den samme listen over 144 driver gener med uttrykk verdier beregnet ved hjelp av «Altanalyze» ble brukt for slutning basert (GENIE3) sti /nettverksanalyse.

Exon nivå uttrykk analyse.

Altanalyze programmet ble brukt til å vurdere alternativ spleising i driver gener. Rådata ble filtrert for å fjerne probe sett som ble ansett for å være ikke-uttrykt. En spleising poengsum for filtrerte eksoner ble beregnet ved hjelp av spleising indeksmetoden og exon /intron /spleising merknad ble tildelt disse resultatene. En skjøt indeks p-verdi cut-off av 0,05 ble anvendt for å filtrere alternative ekson resultater. AltExonViewer – en del av Altanalyze og DomainGraph – en Cytoscape plugin ble brukt til å visualisere spleise indeksverdier og alternativt spleisede eksoner. Skjøte indeks (SI)-verdien ble beregnet som beskrevet i [15]. I korthet er SI log

2-forhold på normaliserte intensiteter av tumor og normale prøver. I vår analyse «prøve en» i telleren var normal og «prøve 2» i nevneren var svulsten.

årsaksnettverksanalyse.

For nettverksanalyse, kunnskap og inferens baserte tilnærminger ble brukt . For slutning baserte tilnærminger, GENIE3 [16], [17] ble brukt til å generere gennettverk for tumor og normale prøver. For å generere nettverket, ble driver gener klassifisert som TF gener og målgener. Selv om 1000 interaksjoner ble utledes for hver av gruppen, en interaksjon scorer 0.1 ble valgt som cut-off verdi. Ved hjelp av denne informasjonen de regulatoriske nettverk ble uavhengig sluttes for tumor og normale prøver ved hjelp Cytoscape.

Dataanalyse med hele probeset

Integromics biomarkører Suite.

For å finne forskjellig uttrykte gener i vår datasettet, uten forutgående skjevhet, data fra CEL filer ble analysert ved hjelp av Integromics programvare (TIBCO Spotfire, USA) rørledning for Affymetrix exon 1.0 ST arrays. Quantile normalisering ble gjort etter fjerning av uteliggere ved hjelp av PCA. Begge Betydningen Analyse av mikromatriser (SAM) og lineære modeller for microarray data (LIMMA) analyser ble utført med en cut-off på 0,01 for justert p-verdi og brett endring av 1 eller -1. To ulike, men gratis metoder ble brukt til å lage våre resultater mer trygg. Gene ontologi berikelse ble utført på en liste over 760 differensielt uttrykte gener hentet fra LIMMA analyse.

Oppfinnsomhet pathway analyse.

Liste over 760 gener fra SAM /LIMMA analyse gjort ved hjelp Integromics ble brukt til å utføre «core» og «biomarkør «analyser. Kjerne-analyse ble utført som tidligere beskrevet [13]. For biomarkør analyse følgende filtre ble brukt: Tenk bare molekyler der (arter = Menneske) og (vev /cellelinjer = KM-12 OR HCT-116 OR RKO ELLER tykktarmskreft cellelinjer som ikke er spesifisert eller COLO205 ELLER HT29 ELLER HCC-2998 ELLER HCT-15 OR SW-480 eller annet tykktarmskreft cellelinjer eller Vev og primærceller som ikke er spesifisert eller SW-620) og (sykdommer = Cancer) oG ((biomarkør applikasjoner = Alle biomarkør Applications) og (biomarkør sykdommer = tykktarmskreft OR tykktarmskreft eller kolon svulst eller kolorektal adenom eller tykktarmskreft eller tykktarmskreft))

resultater

analysen strategien fører til følgende resultater er illustrert i Figur 1a . b.

A) hele analyser er kategorisert i fire stadier fra «data Generation» til «Nettverks analyser». B) Analyse strategi ved hjelp av forskjellige programmer vises i dette diagrammet. Det er tre komponenter av analysen – Gene, Exon og Network håndteres av ulike programmer. Gene nivå analysene er utført med «Affymetrix, Expression /transkriptomet analyse konsoll» og «Tibco Spotfire «. Exon nivå analyse er utført av «AltAnalyze» og «Affymetrix elektroverktøy». Network analyser ansatt «GENIE3», «IPA» og «Cytoscape». «Nexus Kopier nummer «er et program som brukes i tidligere studier til slutt generere en liste over 144 driver gener.

En liten undergruppe av gener identifisert av GISTIC viser en betydelig endring i uttrykket nivå.

Vi studerte uttrykk mønstre av driver gener på gennivå hjelp AltAnalyze og Expression Console programvare. Disse analysene produserte gratis resultater og gitt en liste over 20 gener som ble funnet å ha en betydelig ganger endring på mer enn to og en p-verdi 0,01 [Tabell 1]. 9 gener opplevd en nedregulering. BCAS1 med høyest GISTIC score på 5,323 var blant de mest signifikant nedregulert gener. 11 gener viste en oppregulering med IL6 og INHBA viser den høyeste ganger endring [Figur 2a (AltAnalyze), 2b (Expression Console)]. Brett endre verdiene av alle 144 driver gener er gitt i tabell S2.

To forskjellige algoritmer ble brukt til å måle uttrykk verdier fra Exon array-data for å støtte resultatene. AltAnalyze (1a) og Expression Console (1b) viser gratis resultater med maksimale observerte endringene i BCAS1, INHBA, IL6 og MUC4 gener.

Tre betydelig ned regulerte gener (BCAS1, ABP1 og AGR3 ) ble funnet i forsterkede regioner i genomet, mens oppregulert HTRA1 ble funnet hovedsakelig i områder av tap. Disse genene opplevd en endring i deres transkripsjonsfaktor i tumor og normale prøver [Tabell 2].

Differensial uttrykk analyse ved hjelp av tumor normal sammenkoblede eksempeldata av ekson arrays fra 32 pasienter ble gjennomført. Etter fjerning av uteliggere ved hjelp PCA [Figur 3], 25 vanlige og 24 kreftprøver ble funnet egnet for videre analyser. Vi benyttet ikke-parametrisk (SAM) og para (LIMMA) metoder og funnet gratis resultater. 6242 genene ble uttrykt forskjellig med justerte p-verdi på 0,01. 760 gener ble funnet å være differensielt regulert (endring 1 eller -1), hvorav 15 gener som var felles med driver gener fra GISTIC analyse [Figur 4a-c og figur S1]. BCAS1, AURKA, ATP8B1, IL6 og INHBA var differensielt regulerte gener funnet å være blant de beste scorers i listen over driver gener.

60 prøver fra 32 pasienter ble utsatt for PCA og uteliggere ble fjernet. 4 normale og 7 tumorprøver ble fjernet fra den endelige analysen.

(a) Venn-diagram av felles gener blant GISTIC, SAM og LIMMA analyser. Alle gener ble kommentert og sammenlignet ved hjelp av IPA «sammenligne» funksjon. 43 gener fra Integromics analyser ble ikke kartlagt av IPA.15 gener er vanlig blant alle tre analysene. (B) binned ganger endring stolpediagram av LIMMA analyse. Totalt 6242 gener ble etter å ha justert p-verdi 0,01 hvorav 759 viste signifikant ganger endring ( -1 eller 1). (C) Volcano plott som viser signifikante gener (rosa = nedregulert, oransje = oppregulert) i form av p- verdi og brett endring.

Vesentlige endringer i isoform uttrykk er utstilt av gener identifisert ved GISTIC analyse .

Exon nivå analyse av 144 driver gener ble gjennomført. 29 eksoner som tilhører 13 gener ble vist å ha betydelige endringer i isoform uttrykk som gjenspeiles i deres spleise indeks score [Tabell 3]. Mens eksoner E25-1 av MUC4 og E3-2 av PTP4A3 viste høye negative SI verdier, eksoner E2-2 av IL6 og E21-2 av ADAM12 viste høye positive SI verdier. Negative SI verdier indikerer eksoner er anriket i tumorprøver og hoppes over eller undertrykt i normale prøver og vice versa for positive SI verdier. For MUC4 genet, eksoner E25-1, E2-2, E2-1, I4-6 og I3-6 registrert negative SI verdier og exon E8-1 registrert en positiv SI verdi. Eksoner E2-2 og E4-3 av IL6 registrert positive SI verdier. [Figur 5 ai-ii 44.000 prober som resulterer i forskjellig uttrykt gener gi en objektiv tilnærming og gir ytterligere tillit i listen over overlappende gener. Både LIMMA og SAM tilnærminger generert samme resultatene på funksjonelt nivå som gjenspeiles av Oppfinnsomhet Pathway Analysis (IPA).

ABP1, AGR3 og BCAS1 viste downregulation tross forsterkning på genomet nivå. Dette støttes av tidligere studier for BCAS1in MCF7- cellelinje [29]. Vi har observert at påvirkningen fra SMAD4 transkripsjonsfaktor var tapt i tumorceller og kan være ansvarlig for denne observasjonen. Tilsvarende endringer i transkripsjonsfaktorer ble observert for to andre gener som indikerer veksling oppførsel som beskrevet nedenfor.

Exon nivå.

Exon nivå analyse for å måle genuttrykk endringer er krevende, men givende. Selv forbedrede algoritmer har begrensninger i å gi absolutt kvantifisering av transkripsjonsnivåer. Tidligere metoder har funnet ekson nivå data for å være mer informativ om type og grad av vitnemål [30]. Nå med visshet om at mer enn 90% av alle gener gjennomgå alternativ spleising til å produsere mer enn ett transkripsjon for et gen, er potensialet for ekson nivådata blir realisert mer enn noensinne [31] – [33]. Gene tilnærming for gjennomføring av integrert analyse ved hjelp aCGH og ekson rekke data har gitt flere av bekreftende resultater og mangel på bruk av fulle potensialet i hele genomet arrays [34]. FGFR2-genet ble vist å bli amplifisert og oppreguleres som er misvisende på grunn av den avkortede form av FGFR2. Vekt FGFR2 genet ble ikke målt, og dermed kan ikke sammenlignes med vår studie [34].

Exon nivå studier i kolorektal kreft har vært få og bære flere begrensninger når det gjelder dataanalyse. Mange av disse studiene sammenlignet tumor og normalt fra forskjellige kilder [35]. Våre resultater viser en undergruppe av differensielt uttrykte gener for å oppleve endring i skjøting mønster. 29 eksoner som tilhører 13 gener viste signifikant spleise indeks (SI) og Midas p-verdier. Begge verdiene er sterke indikatorer for å måle alternativ spleising. MUC4 er svært godt kjent for å gjennomgå alternativ spleising og forårsake kreft [36], men alternativ spleising av IL6 er romanen i forbindelse med CRC. ADAM12 som scoret høyt SI verdi har vært innblandet tidligere i lungekreft [37]. 5 gener (ACTN1, CALD1, SLC3A2, CTTN og fn1) tidligere rapportert ulikt skjøtes [38] har blitt funnet i vår studie, så vel som brukte en annen analyse strategi.

ANK3 er kjent for å bruke alternativ transkripsjon starte nettsteder i tykk- og endetarmskreft [8] og kan også være mekanismen for andre genet Mylk som vi ikke ser en betydelig endring i gennivå uttrykk.

Nettverk nivå.

Pathways analyse har blitt brukt til å måle relevansen av genene påvirkes av CNAs ved å skape nettverk blant dem [1]. Imidlertid er disse nettverkene begrenset i sin nyttig tolkning som skyldes fravær av retningen. Vår årsaksnettverksanalyse gir mer nyttig informasjon til de involverte i disse nettverkene gener. Vi har observert en signifikant forskjell i antallet av målgener mellom tumor og normal. I tilfelle av gener som finnes i den amplifiserte regionen, men ble nedregulert vi har observert et tap av transkripsjonsfaktoren regulering, mens i oppregulert-genet befinner seg i det slettede området var det en bryter i transkripsjonsfaktor. Fra listen over driver gener vi valgte transkripsjonsfaktorer og studert deres endring i atferd i tumorprøver. AHR er etablert som en tumor suppressor genet i tykktarm og andre kreftformer [39]. Denne studien forklarer videre forsterket rolle AHR av økt antall utgående (mål) gener i svulsten. Vår studie gir holdepunkter for at TSHZ1 mister sin rolle som mester regulator i normale celler mens RUVBL1 forutsetter at rollen. Disse gir interessante muligheter for mekanistiske studier av nettverk /trasé berørt i CRC. Det har vært planlagt gjennom integrerte studier at mange ulike genomiske forandringer potensielt dys-regulere de samme baner i komplekse sykdommer [40]. Videre studier av de regulatoriske nivå endringer i denne studien vil være i stand til å etablere dette konseptet i CRC.

Funksjonell rolle differensielt uttrykte gener og identifisering av MYC, MMP og IL6 som viktige noder i de berørte nettverk gir fører som må valideres for å etablere deres tilknytning til CRC. Biomarkører, spesielt MUC4 vil være et viktig molekyl å studere mekanistisk og etablere deres bruk i kliniske studier. Denne studien gir vell av analyserte data og en beriket liste av gener som kan tjene som potensielle ledetråder for å forstå biologien til tykktarmskreft.

Hjelpemiddel Informasjon

Figur S1.

Betydningen av microarray analyse. SAM analyse ble utført ved hjelp av Integromics biomarkør oppdagelse suiter på alle prøvene. Resultatene var gratis å LIMMA analyse som gjenspeiles i antall differensielt uttrykte gener

doi:. 10,1371 /journal.pone.0110134.s001 plakater (TIF)

Figur S2.

Splice indeks og ekson uttrykk tomter for resterende 11 gener. Splice indeks- og ekson uttrykk verdier av alle 13 gener som ble funnet betydelig blant de driver gener ble plottet. Sammenligning av «Normal» og «Tumor «prøvene er avbildet å observere endring i skjøten indeksen så vel uttrykket mønsteret på ekson nivå

doi:. 10,1371 /journal.pone.0110134.s002 plakater (docx)

Figur S3.

biologiske prosesser berikelse Kart for differensielt uttrykte gener. Denne baren tomten viser forskjellig uttrykte gener (som hentes fra Integromics) er beriket med tre funksjoner viz, celledeling, mitose og celleadhesjonsprosesser

doi:.. 10,1371 /journal.pone.0110134.s003 plakater (PNG)

Tabell S1.

Typer og stadier av alle pasientprøvene brukt i studien

doi:. 10,1371 /journal.pone.0110134.s004 plakater (docx)

Tabell S2.

Legg att eit svar