PLoS ONE: Et nettverk av kreftgener med co-forekommende og Anti-co-forekommende mutasjoner

Abstract

Enkelte kreftgener bidrar til tumorigenesis på en måte av enten co-forekommende eller gjensidig utelukkende (anti-co-forekommende) mutasjoner; Men det globale bildet om når, hvor og hvordan disse funksjonelle interaksjoner er fortsatt uklart. Denne studien presenterer en systembiologi tilnærming til dette formålet. Etter bruk av denne metoden til kreft genmutasjon data generert fra store og hele genomsekvensering av kreftprøver, ble et nettverk av kreftgener med co-forekommende og anti-co-forekommende mutasjoner konstruert. Analyse av dette nettverket viste at gener med co-forekommende mutasjoner foretrekker direkte signal transductions og at samspillet relasjoner mellom kreftgener i nettverket er knyttet sammen med sin funksjonelle likheten. Det ble også avdekket at gener med co-forekommende mutasjoner tendens til å ha lignende mutasjonsfrekvenser, mens gener med anti-co-forekommende mutasjoner tendens til å ha ulike mutasjonsfrekvenser. Videre gener med flere eksoner tendens til å ha flere samtidig forekommende mutasjoner med andre gener, og gener som har lokale lavere koherent nettverkstrukturer har en tendens til å ha høyere mutasjonsfrekvens. Nettverket viste to komplementære moduler som har forskjellige funksjoner og har ulike roller i tumorigenesis. Denne studien presenteres et rammeverk for analyse av kreft genomsekvense utganger. De presenterte data og avdekket mønstre er nyttig for å forstå bidraget av genmutasjoner til tumorigenesis og verdifull i identifisering av viktige biomarkører og narkotika mål for kreft

Citation. Cui Q (2010) et nettverk av kreftgener med co-forekommende og Anti-co-forekommende mutasjoner. PLoS ONE 5 (10): e13180. doi: 10,1371 /journal.pone.0013180

Redaktør: Simon Rogers, University of Glasgow, Storbritannia

mottatt: 04.04.2010; Godkjent: 11 september 2010; Publisert: 04.10.2010

Copyright: © 2010 Qinghua Cui. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Forfatteren har ingen støtte eller finansiering for å rapportere

konkurrerende interesser:.. forfatteren har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kreft oppstår gjennom akkumulerte genetiske og epigenetiske alter av somatisk cellene [1], [2], [3]. I de senere år har flere forsøk blitt gjort for å identifisere genmutasjoner i forskjellige humane kreftformer av genom-wide eller stor-skala-sekvensering [3], [4], [5], [6], [7], [8], [9]. Faktisk har disse studier identifisert tusener av kreft genmutasjoner, og visse mønstre eller regler for kreft genmutasjoner er avdekket gjennom analyse av disse data mutasjons [1], [2], [10], [11]. Oppdagelsen av muterte gener i menneske kreft og mønstrene bak mutasjon data har gitt kritiske innsikt i mekanismene bak kreft dannelse og utvikling, og har vist seg nyttig for kreftbehandling [3], [12]. Men den raske økning i kreft genmutasjon data antyder et høyt nivå av kompleksitet i forbindelse med forståelsen av tumorigen prosessen [2]. Gitt denne kompleksitet, blir mer nye fremgangsmåter for analyse av mutasjons data som er nødvendig for en bedre forståelse av kreft.

Vanligvis kreft genmutasjoner ikke forekommer tilfeldig. Mutasjoner av visse kreftgener har en tendens til å forekomme samtidig (kalt ko-forekommende mutasjon i dette arbeidet), noe som tyder på at de kan virke sammen for å tumordannelse og utvikling. Imidlertid mutasjoner av noen andre gener forekomme i en gjensidig utelukkende måte (betegnet anti-ko-forekommende mutasjon i dette arbeidet) [8], som tyder på at to gener med anti-ko-forekommende mutasjon kan ha svært like nedstrøms komponenter. For eksempel, Ras og BRAF viser anti-co-forekommende mutasjoner. Faktisk activaion av ett medlem er tilstrekkelig for aktivering av MAPK-reaksjonsveien [13]. Selv om noen kreftgener med co-forekommende og anti-co-forekommende mutasjoner er blitt avslørt, kompleksiteten av menneskelig kreft genmutasjoner hindrer oss i å få et globalt landskap av kreft genet co-forekommende og anti-co-forekommende mutasjoner. For bedre å forstå disse funksjonelle samspillet mellom kreftgener, presenterer denne studien en systembiologi tilnærming og gjennomfører en omfattende analyse av kreftgener med co-forekommende mutasjoner og anti-co-forekommende mutasjoner.

Resultater

nettverk av co-forekommende og anti-co-forekommende kreft genmutasjoner

Et nettverk av kreftgener med co-forekommende og anti-co-forekommende mutasjoner (CCA nettverk) ble konstruert ved å koble kreftgener som har betydelig samtidig forekomst eller anti-co-forekomst med andre gener (se Materiale og metode). CCA nettverket omfatter 306 gener og 1,366 linker (File S1, figur 1). Blant de 1366 linker, 1355 (99,2%) er koblinger av co-forekommende genmutasjon og bare 11 (0,8%) er koblinger av anti-co-forekommende genmutasjon. Således, i denne studien, ble alle analysene utført for gener med co-forekommende mutasjoner med mindre annet er angitt eller beskrevet. CCA nettverket omfatter fem nettverkskomponenter. Den gigantiske (største) nettverkskomponent inneholder 97,4% (298/306) av de totale noder, noe som tyder på at mesteparten av genene har potensielle forhold som bidrar til tumorgenese. Grader av noder i nettverket CCA viser en fordeling av kraft lov (figur S1), noe som indikerer at CCA-nettverket er en skala-fri nettverk.

Hver node representerer en kreft-genet. Gener forbundet med grå koblinger representerer co-forekommende mutasjoner. Gener forbundet med lilla lenker representerer anti-co-forekommende mutasjoner. CCA-nettverket har to moduler. Noder i modulen en er rød og noder i modul to er grønn.

Preference av gener med co-forekommende mutasjoner for direkte aktivering signal transductions

Det er antatt at kreftgener med co -occurring mutasjonene ikke er tilfeldig distribuert i kreft genomet. Foreløpig er det fortsatt uklart hvordan co-forekommende mutasjoner oppstår. Som cellene trenger for å svare på forskjellige signaler, og ettersom cellesignalisering er kritisk for oppgaver som cellevekst, opprettholdelse av celleoverlevelse, proliferasjon, differensiering og utvikling, og apoptose, dysfunksjon av cellesignalisering fra genmutasjoner kan føre til kreft [1 ]. For å møte de spørsmålene ovenfor, ble fordelingen av gener med samtidig forekommende mutasjoner i humane cellesignalbaner og i en human celledelt signaleringsnett undersøkt. Co-forekommende muterte gener ble først kartlagt i 183 menneskelige signalveier, og 42 par gener med co-forekommende mutasjoner ble kartlagt i de samme baner. En randomisering test ble deretter utført for å vurdere hvorvidt gen samtidig forekommende mutasjoner som foretrekker å forekomme i det samme signalveien (se Materialer og metoder). Resultatene tyder på at genet samtidig forekommende mutasjoner som foretrekker å eksistere i den samme signalveien (P = 0,002, randomisering test, figur 2A). Denne observasjonen tyder på at ytterligere mutasjoner av et enkelt gen i en signalveien ikke nødvendigvis letalt påvirke reaksjonsveien, og at dysfunksjoner av en reaksjonsvei er ofte et resultat av samtidig forekomst av mutasjoner av to eller flere gener. For å avgjøre om gener med co-forekommende mutasjoner tendens til å ha direkte interaksjon under cellesignalering, ble fordelingen av kreftgener med co-forekommende mutasjoner i et menneske cellulær signalnettverk undersøkt. Totalt 306 kreftgener ble først kartlagt inn i signaleringsnett, og 107 av disse genene ble bestemt til å eksistere i signaleringsnettet. For par med gener med co-forekommende mutasjoner, 7,0% av dem hadde direkte samhandling i signalanlegget nettverket. Til sammenligning, for parene av gener som ikke har samtidig forekommende mutasjoner, bare 2,8% av dem hadde direkte interaksjoner i signaleringsnett. Dette indikerer at gener med co-forekommende mutasjoner tendens til å ha direkte signal interaksjoner (p = 0,02, Fishers eksakte test, odds ratio (OR) = 2,45). Celler må bruke riktige signaler (dvs. aktivering eller undertrykkelse) for å gjøre riktig respons på ulike stimuli [14]. Ulike signaler kan føre celler til forskjellige skjebner [15], [16]. Det er interessant å avdekke hvilke signaler disse samspill kreftgener foretrekker å bruke. For å gjøre dette, ble antall forskjellige signaler mellom de samvirkende kreft genet parene telles. Resultatene viser at disse genene bruke flere aktiveringssignaler (69,2%), mindre undertrykkelse signaler (6,8%) og fysiske interaksjoner (24,0%) enn den gjennomsnittlige (47,5%, 14,6% og 37,9% for aktivering, undertrykkelse, og fysiske linker , henholdsvis). Signalene som brukes av disse kreftgener er sterkt ubalansert (P = 4,1 × 10

-6, Chi-kvadrat test). Videre disse kreftgener foretrekker å bruke aktiveringssignaler og unngå å bruke undertrykkelse signaler (P 2,0 × 10

-4, randomisering test; figur 2B). Disse resultater antyder at, i mange tilfeller, mutasjoner i en enkelt gen i en signalveien kan ikke i vesentlig grad påvirker cellulær signalisering, og at akkumulerte mutasjoner i aktiveringssignale interaksjonen har en tendens til å forsterke virkningene av kreft genmutasjoner og derfor har betydelig påvirkning på den dysfunksjon av signalveien. Disse mutasjonene kan derfor bidra mer til kreft dannelse og utvikling enn andre mutasjoner.

Den røde pilen viser det reelle antall kreft genet parene som eksisterer i samme bane. Kurven er fordelingen av det tilfeldige tallet av kreft gen parene som eksisterer i det samme reaksjonsvei. (B) Fordeling av antall aktiverings og undertrykkelse signaler mellom kreft genet parene med co-forekommende mutasjoner. Den røde sirkelen (pekte med en rød pil) viser det reelle antall aktiveringssignaler og undertrykkelse signaler som eksisterer blant kreft genet parene i menneskesignaleringsnett. Heatmap indikerer unionen fordelingen av tilfeldig antall aktiveringssignaler og undertrykkelse signaler som eksisterer blant kreft genet parene i menneskesignaleringsnett. (C) Sammenheng mellom avstanden kreftgener i CCA-nettverket og deres uttrykk likhet.

Nettverk avstand av gener i CCA nettverk korrelerer med sitt uttrykk likhet

Resultatene ovenfor tyder på at kreftgener med co-forekommende mutasjoner tendens til å være mer funksjonelt relatert enn tilfeldige genet parene. Derfor kan gener som er nær hverandre i nettet være mer funksjonelt relatert enn gener som er langt borte fra hverandre. Det har blitt rapportert at genekspresjon likheten har en god korrelasjon med genet funksjonell likhet [17], [18], [19]. Derfor er nettverket avstand (lengden av korteste vei mellom to noder i et nettverk) av disse kreftgener forventes å være korrelert med deres ekspresjon likhet. For å bekrefte denne forventningen, forfatteren først beregnet uttrykk likheten mellom par av samspill gener i CCA nettverk basert på menneskelige genuttrykk data presentert av Su et al. [20] av Pearsons korrelasjon, som ofte brukes til å beregne genekspresjon likhet (se Materiale og metode). Deretter ble korrelasjonen mellom nettverket avstand og ekspresjon av gener i likhet CCA nettverket analysert. Som forventet, er nettverk avstand og uttrykk likhet negativt korrelert (R = -0,04, p = 6,9 × 10

-11, Spearmans korrelasjon). Tatt i betraktning at mange gen par har det samme nettverket avstand, noe som kan skape forspenning i korrelasjonsanalyse, ble genet parvis videre integrert i grupper i henhold til sitt nettverk avstand, og den gjennomsnittlige uttrykket likheten for hver gruppe av genet parene ble beregnet. Som vist i figur 2C, er nettverket avstand på grupperte gener negativt korrelert med deres ekspresjon likhet (R = -0,89, p = 0,03, Spearmans korrelasjon). Disse resultatene indikerer at gener med co-forekommende mutasjoner tendens til å være mer funksjonelt relatert, og vice versa.

Gener med co-forekommende mutasjoner tendens til å ha lignende mutasjonsfrekvenser, mens gener med anti-co-forekommende mutasjoner pleier å ha forskjellige mutasjoner frekvenser

Mutation frekvens varierer for ulike kreftgener og ulike krefttyper. For eksempel er mutert P53 i nesten 90% av spiserøret kreftprøvene men bare i 7,5% av nyrecancerprøver. Selv om en stor skala av samtidig forekommende muterte gener har blitt identifisert i denne studien, mønstre av mutasjonsfrekvens av disse genene er imidlertid ukjent. For å løse mangel, ble den absolutte forskjell fra mutasjonsfrekvens (AD) for hvilke som helst to nabogener i nettverket beregnet. AD verdier for gener med co-forekommende mutasjoner, gener med anti-co-forekommende mutasjoner og tilfeldig genet parene ble deretter sammenlignet. Gener med co-forekommende mutasjoner ble funnet å ha mindre AD verdier enn gener med anti-co-forekommende mutasjoner (P = 3,32 × 10

-7, Wilcoxon test, figur 3A). Det ble også funnet at gener med co-forekommende mutasjoner har mindre AD verdier enn tilfeldig genpar (P = 0,002, randomisering testen, 3B), mens gener med anti-co-forekommende mutasjoner har større AD verdier enn tilfeldig genpar (P 0,0002, randomisering test, figur 3C)

(A) Sammenligning av AD verdier for gener med co-forekommende mutasjoner (rød) og gener med anti-co-forekommende mutasjoner (grønt).. (B) Sammenligning av median AD verdier for gener med co-forekommende mutasjoner (rød pil) og fordelingen av medianverdier for 5000 tilfeldige grupper av gener med co-forekommende mutasjoner. (C) Sammenligning av median AD verdier for gener med anti-co-forekommende mutasjoner (grønn pil) og fordelingen av median AD verdier for 5000 tilfeldige grupper av gener med anti-co-forekommende mutasjoner.

nettverks~~POS=TRUNC funksjoner~~POS=HEADCOMP er forbundet med genet funksjoner

en viktig egenskap ved en node i et nettverk er graderes [21]. Graden av en node er representert som antall koblinger det har. Dette er en viktig beregning for å måle sentralitet av en node i et nettverk. Imidlertid er det fortsatt ukjent hvilke gener som har en tendens til å ha flere co-forekommende mutasjoner enn andre gener i CCA-nettverket. Som sådan ble de sammenslutninger av noden grad og node lengde, mutasjonsfrekvens, og flere eksoner ytterligere undersøkt. Analyseresultatene viser at grad som ikke er assosiert med mutasjonsfrekvens eller genet lengde, men er positivt korrelert med antallet eksoner (R = 0,13, P = 0,02, Spearmans korrelasjon). Dette tyder på at proteiner som er sammensatt av flere eksoner kan ha større funksjonell diversitet, og derfor potensielt kan ha flere fysiske eller biokjemiske interaksjoner med andre proteiner. Dette ytterligere antyder at Samtidig forekomst av mutasjoner av disse proteiner med andre proteiner kan ofte være nødvendig for dysfunksjon av forskjellige veier som bidrar til tumorgenese.

clustering koeffisient (CC) er en annen viktig egenskap for noder i nettverk [21] som den representerer sammenhengen i lokale regioner i nettverk. CCA-nettverket har en gjennomsnittlig CC på 0,48. Dette indikerer at mutasjoner av flere gener er ofte nødvendig i tumorigenesis. Videre er CC av gener negativt korrelert med deres mutasjonsfrekvens (R = -0,19, p = 7,09 x 10

-4, Spearmans korrelasjon) og positivt korrelert med deres grad (R = 0,19, P = 6,29 x 10

-4, Spearmans korrelasjon). Tatt i betraktning at gener med co-forekommende mutasjoner pleier å være funksjonelt relatert, som avslørte ovenfor, antyder dette resultatet at gener i en tett interaksjon lokal nettverksstruktur (dvs. gener med mange gjensidige interaksjoner) har en tendens til å være mer robust mot feil (f.eks mutasjoner ) og har mindre dødelighet enn de i et tynt interaksjon lokal nettverksstruktur. Videre, for å både grad og CC økning fra ekstracellulære rom kjernen (median grader er 3, 6, 6, og 6,5; median CCs er 0,17, 0,40, 0,44 og 0,45), noe som indikerer at nedstrøms cellulære komponenter har en tendens til å samarbeide med hverandre i mobilnettet dysfunksjoner som bidrar til kreft enn oppstrøms cellulære komponenter.

CCA-nettverket viser modulære strukturer

i likhet med mange andre biologiske nettverk, viser CCA nettverket også modulære strukturer. I et nettverk, refererer et nettverkmodulen til et høyt sammenkoplet gruppe av noder [21]. Noder mellom to nettverksmoduler er tynt tilkoblet. Som vist i figur 1, den CCA nettverket har klart to moduler. Tidligere studier har vist at noder i et nettverk modul har en tendens til å arbeide sammen for å oppnå en bestemt funksjon [21], [22]. For å bekrefte hvorvidt de to modulene i CCA-nettverket har forskjellige funksjoner, de beriket molekylære funksjoner (MFS), biologiske prosesser (bps), og cellulære komponenter (CCS) for genene i de to modulene ble identifisert ved hjelp av DAVID programvare [23 ] og innstillingen av samtlige kreftgener i de to moduler som bakgrunn befolkningen. DAVID er et populært verktøy for å identifisere beriket gensettene (dvs. veier, Gene ontologi vilkår) ved å evaluere betydningen av anriking av interesserte gener i hver forhåndsdefinerte gen set [23]. Vi tok gensettene med P-verdier mindre enn eller lik 0,05 som betydelige gensettene. Resultatene viser at de to modulene har forskjellige anrikede gensettene (figur 4; File S2). I form av cellulær beliggenhet, for eksempel modul ene er beriket i membranen og kjernen, mens modul to er anriket i det intracellulære rommet. Begge moduler er beriket med funksjonen av bindingen, men har en tendens til å binde seg med andre molekyler. Modul ene er beriket med DNA-binding, mens modulen To er beriket med bindende små molekyler slik som adenyl ribonukleotid, purin nukleotid, ATP, og lipider. Videre er de to modulene er også forskjellige i deres metabolske og signaleringsprosesser. Disse resultatene indikerer at gener med samtidig forekommende og anti-co-forekommende mutasjoner som viser spesifikk arkitektur med hensyn til både topologi og funksjon.

Module One (ord med rød farge) er anriket i membranen og kjernen og Modul to (ord med gul farge) er beriket i den intracellulære plass. De beriket funksjoner og biologiske prosesser i hver modul er også plottet i de tilsvarende steder.

Forfatteren ba om genene i to moduler kan operere i et kompenserende eller samordnet måte å styre ulike funksjoner. Mot dette formål, et uavhengig datasett av hel-genom kreft genmutasjoner av 22 kreftprøver fra Sjøblom et al. «Studie [7] ble anvendt for å undersøke fordelingen av genmutasjoner i de to moduler. Forfatteren telte antall prøver som har genmutasjoner i begge modulene, bare i modul One, og bare i modul to, henholdsvis. Som et resultat, blant de totale 22 kreftprøvene, 8 prøver har genmutasjoner i begge moduler, 14 prøver har genmutasjoner bare i modul One, og ingen prøver har genmutasjoner bare i modul Two. Tilfeldig modellering av fordelingen av de tre tallene viser at prøvene har genmutasjoner i begge modulene oppstå med en sjanse på 25% i tilfeldig tilfelle. Dette resultatet tyder på at gener fra de to moduler har en tendens til å arbeide sammen på en komplementær måte for å generere tumor fenotyper. Videre må alle prøvene har minst en mutasjon i modul One. Dette tallet er signifikant større enn den tilfeldige tilfellet (P 2,0 x 10

-4, randomisering test, figur 5A), som indikerer at denne modulen synes å være kritisk og viktig spiller i tumorgenese. Dette funnet er videre støttet av følgende observasjoner. (A) Module One er beriket i funksjon av anti-onkogen (File S2). (B) Gener i Module One har høyere andel av metylering (10,0%, 21/210) i kreft stamceller enn de i Modul To (1,1%, 1/88). Forfatteren innhentet tallene denaturert gener i disse to moduler ved første kartlegging metylert gener inn gener i disse to moduler og deretter telle antall kartlagte denaturert gener i Module One og modul to, henholdsvis. Fishers eksakte test viser at kreft metylert gener har betydelig anriket fordeling i modul One (P = 0,006), noe som tyder på at gener i modul En bidra mer til den langsiktige tap av genekspresjon og representerer den tidlige fasen av tumordannelse [1]. (C) mutasjonsfrekvens av gener i modul ene er betydelig høyere enn for gener i modul to (P = 5,75 x 10

-9, Wilcoxon test; figur 5B). Den statistiske signifikans ble oppnådd ved bruk av Wilcoxon test til test forskjellen mellom to grupper av kreft genmutasjon frekvens fra modul One og modul to.

X-aksen representerer antall (M) av prøver som har minst en mutasjon i Modul Two. Y-aksen representerer antall (N) av prøver som har mutasjoner bare i Modul Two. Den røde sirkelen (pekte med en rød pil) viser det reelle antall M og N. heatmap indikerer unionen fordelingen av tilfeldig antall M og N og dens farge representerer sannsynlighetstettheten. (B) Sammenligning av mutasjonsfrekvens for gener i Module One og gener i Modul Two.

Diskusjoner

Selv om en rekke kreftgener bidrar til tumorigenesis på en måte av co-forekommende eller anti-co-forekommende mutasjoner, har det vært utfordrende å få et globalt landskap om når, hvor og hvordan deres interaksjoner øve innvirkning på tumordannelse og utvikling. Ved å bygge et CCA nettverk og utfører en integrerende analyse av dette nettverket, forfatteren avdekket et globalt bilde av kreft genet co-forekommende og anti-co-forekommende mutasjoner. Samtidig forekommende mutasjoner fortrinnsvis forekomme i funksjonelt relatert gen parene, slik som signaleringsoverføringsmolekyler, særlig aktivering signal- transduksjon molekyler. De kreft genet samspill parene har en innvirkning på deres mutasjonsfrekvenser. Gener med co-forekommende mutasjoner tendens til å ha lignende mutasjonsfrekvenser, mens gener med anti-co-forekommende mutasjoner tendens til å ha ulike mutasjonsfrekvenser. Topologisk, viser CCA nettverket to moduler som har spesifikke funksjoner. De to modulene har en tendens til å ha funksjonelle samarbeid og modul Man ser ut til å være det sentrale spilleren i å bidra til tumorgenese.

På grunn av den enorme variasjon og kompleksitet av kreft genmutasjoner, kreft og med samme type cancer viser svært forskjellig mutasjon profiler og noen vanlige mønstre bak disse dataene har blitt identifisert. Derfor noen forskere tviler på verdien av kreft genomikk [24]. Ved et system nivå analyse, har denne undersøkelsen presentert direkte bevis for prinsippene for kreft gen samtidig forekommende og anti-co-forekommende mutasjoner, som er nyttig for å forstå mekanismen ved hvilken kreftgener bidrar til kreft dannelse og utvikling på en måte av co-forekommende eller anti-co-forekommende mutasjoner.

sekvensering av kreft genomer er en pågående prosess. For tiden kan de sekvenserte mutasjon data tolke bare en del av mutasjonene. Ettersom utviklingen av neste generasjon genomsekvenseringsteknologi, vil flere og flere kreft genmutasjon data bli akkumulert. Derfor er det forventet at mer pålitelige og nye observasjoner vil bli realisert i fremtiden. Denne studien presenterer en systembiologi rammeverk for integrerende analyse av kreft genomsekvense utganger, som vil være nyttig for ikke bare forståelsen av tumordannelse, men også identifisering av verdifulle biomarkører og narkotika mål.

Materialer og metoder

Kreft genmutasjon data

Kreft genmutasjon data ble lastet ned fra Katalog av somatiske mutasjoner i Cancer (desember 2008, COSMIC, https://www.sanger.ac.uk/genetics/CGP/kosmiske /). Mutasjonen frekvens av et gen ble beregnet ved å dividere det totale antallet kreft prøver som sekvensert dette genet med det av kreft prøvene med minst en mutasjon av dette genet, som beskrevet av Cui et al. [1]. Fordi genmutasjon frekvens er signifikant korrelert med genet lengde (R = 0,4, P = 5,16 × 10

-14, Spearmans korrelasjon), ble genmutasjon frekvens videre korrigert av genet lengde ved hjelp formel «original mutasjonsfrekvens /genet lengde».

denaturert gener i kreftstamceller

287 metylert gener i kreftstamceller ble hentet fra Cui et al «s studie [1], der de samlet disse genene fra tre studier [25 ], [26], [27]. Tjueto av 287 gener ble funnet på CCA nettverk

Menneskelig signalveien og cellesignaleringsnett

Ett hundre og åtti fire menneskelige signalveier ble hentet fra BioCarta (http: //www. .biocarta.com /) og en human celledelt signaleringsnett ble oppnådd fra studiet av Cui et al. [1]. Den menneskelige mobilsignalnettverk inkludert 1,634 noder og 5089-koblinger, som inneholder 2,403 aktiverings interaksjoner, 741 undertrykkelse interaksjoner, 1,915 fysiske interaksjoner, og 30 linker som typer er ukjent (File S3).

Nettverk av co-forekommende og anti CO-forekommende kreft genmutasjoner

for noen to gener, for eksempel, A og B, ble antall kreftprøver som sekvensert både Gene A og Gene B først identifisert. Antall kreft prøver med mutasjoner i både Genes A og B (AandB), at av kreft prøver med mutasjoner bare i Gene A (AnotB), at av kreft prøver med mutasjoner bare i Gene B (BnotA), og at av kreftprøvene med mutasjoner i verken Gene A eller gen B (notAnotB) ble deretter telles. Den signifikans (p-verdi) av samtidig forekommende eller anti-ko-forekommende kreft genmutasjoner ble ytterligere bestemt ved anvendelse av Fishers eksakte test basert på de innhentede fire tall. Et nettverk av co-forekommende og anti-co-forekommende kreft genmutasjoner (CCA nettverk, File S1) ble konstruert ved å sette en P-verdi cutoff 0,02. Eventuelle to gener med P-verdi mindre enn eller lik 0,02 (FDR P = 0,08) ble koblet. Til slutt ble et CCA nettverk konstruert fra denne metoden. Den endelige nettverk inkludert 306 noder og 1,366 lenker (figur 1), som ble tegnet av Pajek, et gratis nettverk visualisering og analyse programvare (https://vlado.fmf.uni-lj.si/pub/networks/pajek/).

i hvilken grad og CC verdi for hver node i CCA-nettverket ble beregnet i henhold til formelen presentert av Barabasi og Oltvai (File S4) [21]. Mutasjonen hyppigheten av kreftgener er også gitt i File S4. Nettverkskomponenter ble identifisert ved et Java-program som er laget for dette formålet (File S5). Nettverket avstand fra to gener ble oppnådd ved beregning av lengden til deres korteste vei, som ble gjennomført ved bruk av Dijkstra algoritme. Graden fordeling ble beregnet ved R, en gratis statistisk programvare (https://cran.r-project.org/). Som CCA nettverk viste klare modulære strukturer, ble to nettverksmoduler (File S6) manuelt identifisert uten bruk av andre verktøy.

analyse av genuttrykk data

Denne undersøkelsen fått normalisert menneskelige genuttrykk profil over 79 menneskelig vev fra Su et al. «Studie [20] for analyse av genekspresjon likhet. Forfatteren ekstrahert ekspresjonsprofiler av gener som inngår i CCA-nettverket og ytterligere målte ekspresjonen likheten mellom hvilke som helst to koblede gener i CCA nettverket ved absolutte Pearsons korrelasjonskoeffisient, som er en hyppig benyttet metrisk i tilsvarende analyse [17].

statistiske beregninger

Alle statistiske tester ble utført ved hjelp av R-programvare. Randomiseringslisten Testene ble utført ved Java-programmer som er utviklet for dette formålet. Den grunnleggende ideen om randomisering tester ble introdusert her ved å ta testen for anriking av co-forekommende mutasjoner i menneskesignalveier som et eksempel. Gener ble først tilfeldig gjen koblet i nettverket bruker samme antall koblinger. Antallet re-genererte koblinger som er innenfor de samme signalveier ble deretter telles. Disse prosedyrene ble gjentatt 5000 ganger. Det antall ganger (T) den tilfeldige tallet var større enn eller lik det virkelige antall ble tellet. P-verdien ble beregnet ved hjelp av formelen

(T + 1) /5001

.

Hjelpemiddel Informasjon

Fil S1.

Pajek nettverk fil av nettverket av kreftgener med co-forekommende og anti-co-forekommende mutasjoner

doi: 10,1371 /journal.pone.0013180.s001 plakater (0,05 MB TXT)

File S2.

Liste over anrikede molekylære funksjoner (MFS), biologiske prosesser (bps), og cellulære komponenter (CCS) av gener i modul 1 og modul 2.

doi: 10,1371 /journal.pone.0013180.s002

(0,05 MB DOC)

File S3.

Liste over gener, deres funksjoner, cellulære steder og signal relasjoner i det menneskelige signalnettverk

doi:. 10,1371 /journal.pone.0013180.s003 plakater (0,49 MB XLS)

File S4.

Liste over nettverksnoder og deres mutasjonsfrekvens, grad og clustering koeffisient (CC)

doi:. 10,1371 /journal.pone.0013180.s004 plakater (0,01 MB TXT)

Fil S5. .

Jave kildekode fil for identifisering av nettverkskomponenter

doi: 10,1371 /journal.pone.0013180.s005 plakater (0,00 MB TXT)

File S6.

Liste over gener i to nettverksmoduler

doi:. 10,1371 /journal.pone.0013180.s006 plakater (0,00 MB TXT)

Figur S1.

Degree fordeling av CCA nettverk

Doi:. 10.1371 /journal.pone.0013180.s007 plakater (0,41 MB TIF)

bekreftelser

Forfatteren takker anmelderne for verdifulle kommentarer og forslag, takk Prof. Yongfeng Shang for verdifulle råd, og takket Dr. Wei Pang for å hjelpe på tegningen i figur 4.

Legg att eit svar