PLoS ONE: Tap av Tilkobling i Cancer Co-Expression Networks

Abstract

Differensial genuttrykk profilering studier har ført til identifisering av flere sykdoms biomarkører. Imidlertid kan de onkogene forandringer i kodende regioner modifisere genet funksjoner uten å påvirke sine egne ekspresjonsprofiler. Videre kan post-translasjonelle modifikasjoner modifisere aktiviteten til det kodede protein uten å endre de ekspresjonsnivåer av det kodende genet, men å fremskaffe variasjoner i uttrykket nivåer av de regulerte gener. Disse betraktningene motivere studiet av omkobling av nettverkene co-uttrykte gener som følge av de nevnte endringer for å komplettere den informativt innhold av differensiell ekspresjon. Vi analyserte 339 mRNAomes av fem forskjellige krefttyper for å finne enkeltgener som presenterte co-uttrykk mønstre sterkt differensiert mellom normale og kreft fenotyper. Vår analyse av differensielt koblede gener indikerer tap av tilkobling som en vanlig topologisk egenskap av kreft nettverk, og lanserer nye kandidat kreftgener. Videre vår integrert tilnærming som kombinerer differensial uttrykk sammen med differensial tilkobling forbedrer den klassiske berikelse pathway analyse som gir ny innsikt om mulige kreft genet biosystemer ikke fortsatt fullt ut undersøkt

Citation. Anglani R, Creanza TM, Liuzzi VC , Piepoli A, Panza A, Andriulli A, et al. (2014) Tap av Tilkobling i Cancer Co-Expression Networks. PLoS ONE 9 (1): e87075. doi: 10,1371 /journal.pone.0087075

Redaktør: Filippo Castiglione, National Research Council of Italy (CNR), Italia

mottatt: 11 september 2013; Godkjent: 18 desember 2013; Publisert: 28 januar 2014

Copyright: © 2014 Anglani et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble delvis støttet med tilskudd fra Regione Puglia PO FESR 2007–2013 Progetto BISIMANE (Cod. n. 44), Progetto FIRB RBAP11B2SX, Progetto di Ricerca Finalizzata 2009 RF /2009-1471624. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

i løpet av de siste årene, har kreftforskning opplevd bemerkelsesverdige fremskritt som tilbys av nye systembiologi tilnærminger følge utviklingen av high-throughput teknologi kombinert til nye statistiske teknikker [1], [2]. En av de mest brukte metoder for studiet av genetiske mønstre i kreftvev er genekspresjonen profilering via RNAseq eller mikromatriseanalyse som gir målinger av mRNA-nivåer i hele genetiske landskapet i en gitt biologisk prøve. Vanligvis er syke vev, sammenlignet med normale kontroller for å identifisere grupper av gener hvis ekspresjon nivåer er vesentlig forskjellig i de to fenotype forhold og dermed forbundet til sykdommer [3], [4]. Denne populasjonen av gener, definert som differensielt uttrykte (DE), blir vanligvis betraktet laget av kandidat biomarkører for angrep og progresjon av patologien og har vært mye studert for identifisering av sykdomsrelaterte trasé [5], [6].

Selv om differensial uttrykk studier har vært mye og vellykket anvendt på mange måter, presenterer de alvorlige manglene i etterforskningen av komplekse sykdommer. Et viktig eksempel er representert ved kreftutvikling som er en flertrinnsprosess som involverer den gradvise akkumulering av genetiske mutasjoner, som kan forekomme likegyldig på regulatoriske eller kodende områder av gener. Som et spørsmål om faktum, kan det kodende område endringer og posttranslasjonelle modifikasjoner (f.eks phosporylation, acylering, metylering, etc.) modifisere protein aktivitet uten å påvirke genuttrykket nivå, men å endre samspillet mønster med andre gener. [7 ]. For eksempel kan missense og nonsense mutasjoner i de områdene som koder for proteinbindings regioner forstyrre flere grunnleggende protein-protein interaksjoner uten å endre uttrykket nivåer. Et velkjent eksempel på denne type endringer i kreftformer omfatter adenomatøs polypose Coli (APC), som er den mest vanlige muterte genet i kolorektal cancer [8], [9]. Den hyppigste APC mutasjon fører til en avkortet protein som mangler bindingssetene for enkelte samspill proteiner [10]. Derfor kan en analyse basert utelukkende på differensial uttrykk studier være ineffektiv for utheving av noen viktige genetiske sjåfører i neoplastiske lesjoner. På den annen side er en annen viktig ulempe ved den differensielle ekspresjonen analyse består i det faktum at gener er behandlet hver for seg, slik at interaksjoner ikke er tatt hensyn til. Faktisk er det allment akseptert at forståelsen av mekanismene bak utviklingen av genetiske sykdommer som kreft må vurdere bidraget av samspill mellom gener [11]. Videre er det viktig å undersøke hvordan disse interaksjonene endre seg i sykdom fenotype, med hensyn til villtype tilstand [12] – [14], siden det er velkjent at ikke alle gener som er aktive i begge tilstander. For eksempel, [15] har vist at i respons til ulike perturbasjoner interaksjons mønstre av transkripsjonsfaktorer kan endres forårsaker en omkobling av nettverket.

Innenfor rammen av genekspresjon profilering, studiet av statistisk signifikante korrelasjoner mellom genpar kan avsløre mulige interaksjoner, avhengigheter eller koordinerte aktiviteter gener i en gitt biologisk tilstand. Spesielt kan nettverk basert på genuttrykk parvise korrelasjoner representerer direkte genet forskrifter og omfatter også gener som er indirekte koblet gjennom regulatoriske trasé [16]. Videre, siden transkripsjon er resultatet av en kompleks multi-nivå prosessen, tar en antatt korrelasjon nettverk hensyn til ikke bare transkripsjonsfaktor-DNA-interaksjoner, men også faktorer som regulerer biokjemisk systemene. Derfor er det mulig å gjette at modifikasjoner av interaksjoner mellom gener under forskjellige eksperimentelle betingelser vil reflektere på forskjellige korrelasjonsmønster utganger. I dette bildet, senere tilnærminger fokusert på identifisering av endringer i genet co-uttrykk strukturer (kvantifisert ved parvise korrelasjoner) mellom friske og syke vev til sikte på å gi bedre innsikt i endrede reguleringsmekanismer og indikerer kritiske lidelse driver gener [7 ]. Spesielt har differensial co-uttrykk nettverk analyser blitt mye brukt og har vist viktige bevis for etterforskningen av kreft genet nettverk [17] -. [19] og identifisering av muterte men ikke ulikt uttrykte gener [20]

ideen ligger til grunn for denne studien er at modifikasjoner av genet tilkobling i biologiske nettverk er knyttet til betydelige fenotypiske endringer. Et oppmuntrende bevis er rapportert i [15] hvor forfatterne fant at tilkobling av genregulering i

Saccharomyces cerevisiae

gjennomgår dramatiske endringer i løpet av cellulære prosesser. Ja, de viste at mange transkripsjonsfaktorer til stede bare et lite antall av interaksjoner tilbakeholdt tvers av ulike forhold, mens de resterende tilkoblingene er aktive i spesielle forhold i systemet.

I denne studien, viser vi at nettverkstilkobling kan fornuftig endring i neoplastiske vev. Som et tilkoblings mål på et gen som vi brukte grad fordi det er en fundamental observeres i grafteori, og har en tydelig biologisk tolkning [15]. Spesielt studerte vi genet interaksjons endringene som oppstår i kreftvev i forhold til friske kontroller ved å sammenligne den spesifikke utledede koekspresjon nettverk. Til dette formål, vi undersøkt om de enkelte nodene som presenterte en forbindelse struktur sterkt modifisert mellom to biologiske fenotyper. Ikke-para tilfeldig permutasjon tester ble vedtatt for å markere de som genet har grad variasjoner knyttet til patologi og ikke skyldes tilfeldigheter.

Vi fant at manglende forbindelse i kreft nettverk med hensyn til normale sortene er en vanlig egenskap blant de forskjellige typer kreft. Deretter fant vi at en studie av differensial-tilkobling kan indikere kreftrelaterte gener ikke avslørt av differensial uttrykk analyser. Til slutt viste vi hvordan integreringen av differensial uttrykk med differensial tilkobling kan forbedre den klassiske berikelse analyse avslører stier knyttet til kreft kjennetegn og gir innsikt i nye antatte biomarkør systemer.

Resultater

Vi analyserte uttrykk nivåer av menneske 339 mRNAomes inkludert normale og neoplastiske vevsprøver knyttet til fem genuttrykk datasett av forskjellige neoplasier fra GEO og ArrayExpress: kolorektal, lunge, mage, bukspyttkjertel og cervical. Alle prøver ble profilert med Affymetrix teknologier og preprocessed med Affymetrix Expression Console-programvaren (se Materiale og metode).

Tap av tilkoblingsmuligheter i kreft nettverk

Vi har undersøkt de topologiske egenskapene til co-uttrykk nettverk de friske og syke forhold i form av genet tilkobling eller grad (se Materiale og metode). Vi utledes normale og kreft co-uttrykk nettverk basert på Spearman korrelasjonskoeffisienter: to gener ble koblet sammen med en kant hvis korrelasjonskoeffisienten mellom sine uttrykk profiler var ikke-null på 5% signifikansnivå med en Benjamini-Hochberg [21] false funnrate (FDR) under 20% (se figur 1 og Material og metoder).

Sunn tilstand til venstre og sykdom rammet vev til høyre. Grønne koblinger forblir uendret i de to fenotyper. Røde tilkoblinger er tap fra sunt til kreft nettverk. Blu kantene er nye forbindelser i kreftvev.

Som forventet, topologien av inferred genet nettverk viste seg å være merkelig fra en tilfeldig modell (se figur 2A-E og Materiale og metode) siden deres grad fordelingene resulterte forskjellig fra de av de tilsvarende tilfeldige grafer med samme gjennomsnittlige grad, og det samme antall noder (, Kolmogorov-Smirnov-test). Videre kreft og normale nettverk ble preget av noder med svært varierende grad, fra gener med noen forbindelser til «nav «med tusenvis av linker (figur 2A-F).

(AE) kumulativ fordelingsfunksjon i gen grad. (F) boksplott av genet grader for de fem vev i de to tilstandene. Rød farge refererer til kreft fenotype. Blå farge refererer til normal fenotype. Median grad i kreft er lavere enn i normale forhold

På den andre siden, sammenligningen mellom normale og kreft nettverk brakt ut en bemerkelsesverdig trekk som er felles for de ulike krefttyper:. Co-uttrykk genet nettverk av neoplastiske vev presentere en redusert tilkoblingsmuligheter med hensyn til sunn tilstand (se figur 2F). Faktisk viste en Kolmogorov-Smirnov test som alle kreft nett er karakterisert ved et gen grad som er stokastisk redusert i forhold til de tilsvarende normale grafene ().

Gene differensial tilkobling og dens samspill med den differensielle ekspresjonen

de vesentlige endringer av nettverkstilkobling i kreft indikerer at gener med sterkt endrede tilkoblinger kan ha en rolle i kreft biologi og motivere en studie på en tilkoblingsbasert scoring mål for identifisering av mulige kreft drivere. Til dette formål, for hvert gen, vurderte vi differensial tilkobling (DC) som differansen av genet grader i de to fenotypiske forhold og vi vurderte det statistisk signifikans med en p-verdi og en falsk funnrate. Videre studerte vi resultatene av dette tiltaket og dets relative fortrinn i forhold til dette uttrykket (DE) i form av p-verdi og FDR (se Materiale og metode).

En analyse av FDR som en funksjon av p-verdier for begge differensial tiltak viste at for p-verdier mindre enn 0,01, det var en andel av falske funn under 22% for DC og 10% for DE (figurene 3A-E). Dette betyr at for begge målene, er det antall av de resulterende differensial egenskaper vesentlig høyere enn det som forventes ved en tilfeldighet, selv om FDR av DC er større enn den FDR av DE for hver p-verdier.

Red farge representerer forskjellig uttrykt gener (dE). Blå farge representerer de differensielt koblede gener (DC).

Som en ytterligere etterforskning, analyserte vi samspillet mellom tilkobling tap og differensial uttrykk og differensial tilkoblings p-verdier. Vi fant at jo mindre er p-verdien av DC jo større er antall tapte tilkoblinger for alle datasett (, Spearman korrelasjon, se figur 4A-E). Dette resultatet bekrefter hypotesen om at en betydelig differensial forbindelse tilsvarer mer sannsynlig at et tap av linker fra normal til cancervev. Analogt, fant vi en positiv korrelasjon mellom gevinst på graden og differensial uttrykk p-verdien i hver sykdom med unntak av tykktarmskreft som det er en negativ korrelasjon (figur 4F). Dette indikerer at differensielt uttrykte gener er mer sannsynlige kjennetegnet ved en redusert grad i kreft, bortsett fra i tykktarmen tilfelle hvor de differensielt uttrykte gener har en tendens til å erverve forbindelser i tumorvevet (figurene 4A-F).

( AE) (Øvre panel) Gene differensial tilkobling p-verdi som en funksjon av grad forhold. (Nedre panel) Gene differensial uttrykk p-verdi som en funksjon av grad forhold. Hvert punkt representerer et gen og trendlinjen er den minste kvadraters linje. (F) Korrelasjon mellom differensial uttrykk p-verdi og gevinsten av tilkoblinger. P-verdier på barene viser til høyre halen tester for de positive korrelasjoner, og venstre-tail tester for de negative korrelasjoner. (G) Korrelasjon mellom differensial uttrykk p-verdier og differensial tilkoblings p-verdier.

Differensialtilkoblings høydepunkter kjente kreftgener

For å undersøke om differensial tilkobling kan fingeren mot tumor -spesifikke gener og utkonkurrerer differensial uttrykk analyse, samlet vi kjent kreft genet lister fra litteratur og kuratert databaser for å bli testet for berikelse. Derfor er valget av en gitt terskel betydning for DC og DE p-verdier viste seg å være nødvendig. Følgelig, for hver kreft datasett, inne vi to lister oppsamling av gener med vesentlig differensial ekspresjon og tilkobling på samme nivå på 0,05, henholdsvis (se tabell S1).

studie på tykktarmskreft datasett ført 1870 differensielt koblede gener og 6792 differensielt uttrykte gener på en rekke 17400 analysert gener. Bestandene viste seg å være tydelig med (figur 4G). Den DC-genet Listen er anriket i tumor-suppressor-gener og onkogener som vanligvis forbindes med kolorektal cancer, som rapportert i arbeidet til [22] (,,) der er på størrelse med en liste over kjente kreftgener, er antallet DC-gener i listen og er Fishers eksakte test p-verdi. Vedta en strengere nivå på 0,005, er DC gener også beriket i kjente kreftgener fra Cancer Gene Census [23] (, Fishers eksakte test), i KEGG Disease H00020 Kolorektalkreft genet liste [24] (,) og i gener mutert i kolorektal kreft som rapportert i arbeidet med Wood

et al.

[25] (,). Tvert imot, resulterte de differensielt uttrykte gener som ikke er anriket på de forannevnte kjente kolorektal kreft genet lister: i [22] (,), Cancer Gene tellingen [23] (,), i KEGG Disease H00020 Kolorektalkreft gen liste [24] ( ,) og i [25] (,).

for lungekreft datasett, lister over gener som er differensielt koblede og uttrykt mellom normale og kreft lunge vev inkludert 2749 og 7125 gener, henholdsvis (på en antall 12157 analysert gener). Selv om vi har funnet en positiv korrelasjon () mellom p-verdier på differensial uttrykk og p-verdiene av differensial-tilkobling (figur 4G), noen bemerkelsesverdige unntak, dvs. forskjellig tilkoblet men ikke uttrykte gener, resulterte kritisk knyttet til patologi. For eksempel,

EGFR

genet, viste seg å være DC (), men ikke DE (), er en viktig ofte mutert onkogen og et medikament mål for lunge adenokarsinom [26], [27]. Videre er DC genet liste beriket i gener som bærer forandringer (mutasjoner, presiseringer og /eller fusjoner) som er involvert i utviklingen av ikke-småcellet lungekreft som rapportert i arbeidet [28] (,). Listen over disse kreftgener viste seg å ikke være overrepresentert på listen over de differensielt uttrykte gener (,).

Vår analyse på magekreft datasett resulterte i 3016 DC og 11108 DE gener (på en rekke 19520 analysert gener) med de to listene betydelig forskjellige (se figur 4G). Vi fant så forskjellig koblet reseptor-regulert Smads (R-Smads) for TGF-beta (

SMAD2 Hotell og

SMAD3

) og for BMP signalveien (

SMAD1 Hotell og

SMAD5

) og felles-megler Smad (

SMAD4

). Disse genene, med det eneste unntaket av

SMAD5

, er ikke forskjellig uttrykt (se tabell S1). Videre fant vi at listene over gener med anrikes i gener som deler en

TCF3

-binding nettstedet motiv (E47_01,,) og i gener som deler en

SMAD4

-binding nettstedet motiv (SMAD4_Q6,,) [29]. Vi merker oss at det er kjent at TGF – aktivert Smads hemme ekspresjon av Id proteiner, som i sin tur inhiberer DNA-binding av bHLH transkripsjonsfaktorer slik som E12 og E47 [30], [31]. Derfor foreslår differensial tilkobling analyse endringer i de nevnte signal aktiviteter i mage kreft vev.

Studiet på kreft i bukspyttkjertelen datasett resulterte i 12434 differensielt koblede gener og 14726 differensielt uttrykte gener over en totalt 19520 gener på brikken. På grunn av den store overlappingen mellom de to gruppene (figur 4G), er det ikke overraskende at begge grupper er anriket for de vanlig differensielt uttrykte gener i pankreatisk duktus adenokarsinom som resulterer fra meta-analyse undersøkelse utført på fire forskjellige datasettene i [32] . Videre de tre gener (

KRAS

,

TP53

,

STK11

) knyttet til kreft i bukspyttkjertelen Omim Entry 260350 [33] ble funnet både forskjellig tilkoblet og forskjellig uttrykt med samme. Men med en mer konservativ signifikansnivå på 0,005, kreft genet liste fra Cancer Gene Census [23] ble funnet å være betydelig anriket i DC gener (,) men ikke i DE gener (,).

endelig analysen på livmorhalskreft datasett avslørte 2302 DC og 6186 dE gener (på en rekke 12507 analysert gener) med de to populasjonene være signifikant forskjellig med (figur 4G). ble utført en berikelse analyse av DC og DE gener på listen gitt av arbeidet [34] laget av gener som vanligvis forandrede sammen med de som finnes mutert ved deres hel-exome sekvense studie i livmor og eggstokkreft. Denne studien var motivert av tanken på å utnytte DNA-data samlet inn fra Papanicolau tester for å avdekke somatiske mutasjoner som involverer livmorvevet etter å ha blitt utgytt fra livmor eller eggstokkreft. Dette panelet av gener resulterte beriket av 6 DC gener over en totalt 15 (, Fishers eksakte test) mens inkluderte 8 DE gener (, Fishers eksakte test) gir en betydelig overlapping bare i det første tilfellet.

Vi disposisjon en viktig bemerkning. Selv om vi fant ut at p-verdier for differensial forbindelse negativt korrelert med seg for dette uttrykket bare for tykktarm, mage og cervix datasett, den generelle betydningen av de 5 uavhengige tester antydet at DC og DE p-verdier er knyttet gjennom en betydelig negativ korrelasjon (se figur 4G). I konklusjonen, kan DC og DE gener oppfører seg som distinkte populasjoner og vår bioinformatikk analyse støtter ideen om at gener involvert i kreft som ikke endrer sitt uttrykk kan bli markert ved en analyse av differensial tilkobling. Følgelig kan man gjette at DC gener er gener mutasjoner som endrer samspill mellom genprodukter uten at det påvirker deres uttrykk nivåer.

Differensial tilkobling antyder nye nettverksbaserte kreft biomarkører

Vår studie kan også opplyse gener som kreftspesifikke roller kan bli gjettet fra litteratur eller er fortsatt omdiskutert og videre kan motivere funksjonelle eksperimenter om involvering av disse genene i patogenesen av sykdommen. Fra vår analyse av magekreft datasettet, den hemmer av Bruton er tyrosin kinase (

IBTK

) resulterte i genet og de største tap i tilkobling () (se tabell S3). Som et spørsmål om faktum, kodet av

IBTK

nedregulerer kinase aktivitet av protein

BTK

som igjen er en negativ regulator av Wnt-beta-catenin signale [35]. På den annen side,

IBTK

protein regulerer negativt aktivering av nukleær faktor-kappa-B-drevet (

NF-kB

) transkripsjon. Siden det er vel etablert at

NF-kB Hotell og Wnt /catenin signalveier er aktivert i de fleste av magekreft [36], [37], er det mulig å gjette en involvering av

IBTK

i utviklingen av svulsten.

i tilfelle av kreft i tykktarmen, den andre topprangerte genet for at forbindelsen (se tabell S3) er aryl hydrokarbon reseptor (

AhR

) at i studiet av [38] viste seg å ha en avgjørende rolle i undertrykkelse av intestinal kreftutvikling ved proteasomal nedbrytning av -catenin, som samhandler med den kanoniske

APC

-avhengig veien. Videre sjette topprangerte genet « slettet i polypose en » (

DIP1

) har vist seg å ha en rolle tumor suppressor i tykktarm kreftutvikling [39].

En ytterligere eksempel kommer fra lungekreft datasett der genet

TNFSF11

viste den høyeste tap av tilkobling (se tabell S3). Tidligere studier viste at dette proteinet kan regulere celle apoptose aktiverende anti-apoptotiske kinase

AKT /PKB

via en signalerings kompleks som involverer SRC kinase og tumornekrosefaktorreseptor-assosiert faktor (

TRAF

) 6 (se EntrezGene Sammendrag:.. [40] Videre er

SRC Hotell og

TRAF6

proteiner er kjent for å være involvert i flere aspekter av tumordannelse i human lunge [41], [42] The arbeidet med [8] bekrefter involvering av

TNFSF11

i migrasjon av humane lungetumorceller. Faktisk genet

TNFSF11

bidrar til metastase konstituert gjennom

MEK /ERK

, som igjen aktiverer

NFkB

, noe som resulterer i aktivering av

ICAM1

.

som en siste bemerkning, vår analyse av lunge svulst datasettet fremhevet som den andre topprangerte genet for tap av tilkobling O-glykosylering initiator enzymet N-acetylgalactosaminyltransferase-14 (

GALNT14

). [50] viste at

GALNT14

kan være en prediktiv biomarkør for dulanermin basert terapi i NSCLC fordi de funnet at følsomheten til dulanermin (et protein som induserer apoptose i tumorceller) ble sterkt korrelert med overekspresjon av

GALNT14

. De fant også en funksjonell kobling mellom død reseptor O-glykosylering og apoptotisk signalering som viser at både farmakologisk hemming av glykosylering og enzymknockdown gjennom små interfererende RNA målretting

GALNT14

redusert dulanermin-indusert apoptose [45].

Disse funnene tyder på at en differensial tilkobling analyse er i stand til å oppdage kjente kreftgener og også til å foreslå nye biomarkører kandidater (noen potensielt druggable) gi nye hypoteser for spesifikke funksjonelle eksperimenter.

differensial~~POS=TRUNC tilkobling er komplementær til forskjells uttrykk for å avdekke kreft relatert trasé

motivert av bevisene dukker opp i de forrige avsnittene, kan man gjette at en sti analyse på forhåndsdefinerte gensettene som tar hensyn til både endringer i genuttrykk og endringer i tilkoblingsmuligheter kan forbedre molekylær karakterisering av sykdomsmekanismer. Av denne grunn, må vi først fokusert på den klassiske berikelse studie utført en Random-Set-baserte pathway analyse (se Materiale og metode) for identifisering av veier av funksjonelt relaterte gener beriket for forskjells uttrykk [46]. Derfor undersøkte vi de veier som resulterte deregulerte fra en samlet analyse av anriking av gener som enten var forskjellig uttrykt eller forskjellig tilkoblet (DEC) (se Eq. 5 i Materiale og metode). Vår analyse testet genet lister

a priori

tilhører de kanoniske pathway (C2-CP) samlinger av Molecular Signatur Database (MSigDB) [5] som samler 1452 trasé fra Reactome, KEGG, Biocarta og andre databaser. Oppførselen til FDR som en funksjon av den berikelse p-verdien ble separat studert i DE og DEC tilfeller (se figur 5A-E). For alle kreftformer (bortsett fra bukspyttkjertelen tilfelle), sammenligningen av FDRs i de to beregningene viser at DE-verdier var alltid større enn de tilsvarende DEC seg, og den sistnevnte ga mindre enn 15% ved et signifikansnivå på mindre enn 0,01. Videre, for tykktarm og lunge datasett, kurver av FDR resulterte godt atskilt, f.eks tar hensyn til differensialtilkoblings tiltaket ga en 91% reduksjon av FDR verdi for en p-verdi på 0,003. Som en konsekvens er spekulert vi at banene er involvert i tumorbiologi er deregulert i genekspresjon og karakterisert ved endrede gen-interaksjoner ikke nødvendigvis påvirker uttrykk mønstre. En biologisk validering av denne forutsetningen er nødvendig å vurdere den relative effektiviteten av desember tiltaket i identifisering av trasé som ligger til grunn de generelle mekanismene og de vevsspesifikke egenskaper av neoplasier.

(AE) Benjamini-Hochberg False funnrate (FDR) som en funksjon av p-verdien. Rød farge viser til trasé beriket av forskjellig uttrykt gener (DE). Blu farge refererer til trasé beriket av forskjellig uttrykt gener eller differensielt koblede de (DEC). (F) Reactome veier av immunsystemet. Berikelse meta-analyse p-verdier på tvers av vev for « Reactome Immune System », første og andre sub-trasé. Histogrammet i innfelte viser vevsspesifikke berikelse p-verdier på « Reactome immunsystem ». (G-H) Kjerne sett pathway berikelse analyse. Antallet kjerne sett trasé funnet som signifikant på 0.01 nivå (G) og i de topprangerte posisjoner (H) vises på barer. I innfelt er det rapportert at p-verdi knyttet til den relative fortrinn av desember tiltak med hensyn til DE oppnås ved en permutasjon test.

Innenfor rammen av generell kreft fenotype, som et konkret eksempel, vi validert de to verdiene i identifisering av Reactome immunsystem, som er relatert til en av de viktigste kreft kjennetegnene [46]. Vi utførte en meta-analyse av DE og desember berikelse å kombinere p-verdiene knyttet til de ulike vev (Fisher samlede sannsynlighet test). Interessant, DEC meta-analyse p-verdi knyttet til immunsystemet () viste seg å være mye mindre enn den tilsvarende DE-verdi () som er over signifikansnivå på 0,01 (figur 5F). Vi påpeker at dersom man vurderer vev-spesifikk berikelse analyse, desember berikelse p-verdiene alltid resultere mindre enn de tilsvarende DE verdier. Dessuten er den klassiske reaksjonsveien analyse ikke er i stand til å indikere, for en hvilken som helst organ, Reactome immunsystemet som signifikant ved nivået på 0,05 enten (se innsatt i figur 5F).

På den annen side, evne til å detektere organspesifikke kreft egenskaper ble testet på riktig « kjernesett » som samler kjente kreftspesifikke kjennetegn systemer (se Materiale og metode). Spesielt undersøkte vi om desember berikelse analyse utkonkurrerer den klassiske DE tilnærming i å prioritere de baner i kjernen sett.

Vi har studert separat forestillinger av DE og DEC tiltak for å identifisere så betydelige at kreft kjerne sett veier. Særlig for hver måling, vurdert vi betydningen av antall kjernesett baner som har en (figur 5G) ved hjelp av Fishers eksakte tester. Vi har derfor oppmerksom på at utnyttelsen av DEC gener gjør det mulig å bedre avsløre kjente kreft veier. Faktisk overgår DEC berikelse DE analyse både når det gjelder antall betydelige veier og p-verdier for tykktarm, lunge og livmorhalsen. Forskjellen mellom DEC- og DE opptredener ble bestemt ved en vilkårlig permutasjon test. Spesielt sammenlignet vi de veide antall signifikante kjerne set trasé som følge av de to analyser (se Materialer og Metoder). Selv om det er et sterkt bevis på den relative fortrinn av desember analyse bare i tykktarm og lunge sammen med en liten indikasjon for cervix, ser vi at vurderer DEC gener i reaksjonsveien anrikning analyse globalt avdekker flere signaler knyttet til patologien, ettersom den generelle betydning er (se innfelt i Figur 5G).

Videre kvantifisert vi hvor mye veien rangeringen oppnådd med de to verdiene avvike fra en tilfeldig bestilling i identifisering av kreft baner (Figur 5H). For dette formål for hvert tiltak, rangert vi trasé i form av berikelse p-verdier og telles antall kjerneinnstilt trasé til stede i de første topprangerte stillinger i listene (se tabell S2). For eksempel, i tykktarmskreft, i de første 104 stillinger fant vi 11 kjerneinnstilt trasé beriket av DE gener () versus 18 veier beriket av DEC gener (). Interessant, ser vi at desember berikelse analyse alltid utkonkurrerer DE tiltaket med unntak av mage og bukspyttkjertel tilfeller, der de to verdiene er like effektiv i identifisering av kjernen sett veier. Faktisk DEC tilnærming globalt rangert i høyere stillinger kreftrelaterte trasé enn den klassiske DE berikelse analyse som bekreftes av Fisher samlede sannsynlighet test p-verdier viser (DE; DEC)

Til slutt, vi påpeke at for. bukspyttkjertelen tilfellet er kreft kjerne sett uventet underrepresentert blant både dE og DEC baner (Figur 5G-H). Som et spørsmål om faktum, i stedet for veier vanligvis forbindes til kreft i bukspyttkjertelen, desember analyse fant mer endret disse veiene (se tabell S2) som involverer neuroaktive ligand-reseptor interaksjon og lukte transduksjon sammen med sin superfamily av rhodopsin lignende G protein- koblede reseptorer (GPCR).

Legg att eit svar