PLoS ONE: Modul Network slutning fra en Cancer Gene Expression datasett Identifiserer mikroRNA Regulerte Modules

Abstract

Bakgrunn

microRNAs (mirnas) er små RNA som anerkjenner og regulerer mRNA målgener. Flere linjer av bevis tyder på at de er viktige regulatorer av mange kritiske funksjoner i utvikling og sykdom, inkludert kreft. Men å definere plass og funksjon av miRNAs i komplekse regulatoriske nettverk er ikke enkelt. Systemer tilnærminger, som slutning av en modul nettverk fra uttrykk data, kan bidra til å nå dette målet.

metodikk /hovedfunnene

I løpet av det siste tiåret, mye fremgang har blitt gjort i utviklingen av robuste og kraftige modul nettverks inferensalgoritmer. I denne studien analyserer vi og vurdere eksperimentelt en modul nettverk utledes fra både miRNA og mRNA uttrykk data, ved hjelp av vår nyutviklede modulen nettverk slutning algoritme basert på sannsynlighets optimalisering teknikker. Vi viser at flere mirnas er spådd som statistisk signifikante regulatorer for ulike moduler av tett co-uttrykte gener. En detaljert analyse av tre av disse modulene viser at den spesifikke tildeling av mirnas er funksjonsmessig sammenhengende og støttes av litteratur. Vi videre utformet et sett av eksperimenter for å teste tildeling av MIR-200a som den øverste regulator av en liten modul av ni gener. Resultatene antyder sterkt at Mir-200a er å regulere modul gener via transkripsjonsfaktoren ZEB1. Interessant nok er denne modulen mest sannsynlig er involvert i epithelial homeostase og dens feilregulering kan bidra til den maligne prosess i kreftceller.

Konklusjoner /Betydningen

Våre resultater viser at et robust modul nettverk analyse av ekspresjon data kan gi ny innsikt av miRNA funksjon i viktige cellulære prosesser. En slik beregningsorientert tilnærming, med start fra ekspresjon av data alene, kan være nyttig i prosessen med å identifisere funksjonen av mirnas ved å foreslå moduler av co-uttrykte gener hvor de spiller en regulerende rolle. Som vist i denne studien, kan disse modulene så testes eksperimentelt til å undersøke og forbedre funksjonen av miRNA i den regulatoriske nettverk

Citation. Bonnet E, Tatari M, Joshi A, Michoel T, Marchal K , Berx G, et al. (2010) Modul Network slutning fra en Cancer Gene Expression datasett Identifiserer mikroRNA regulerte moduler. PLoS ONE 5 (4): e10162. doi: 10,1371 /journal.pone.0010162

Redaktør: Simon Rogers, University of Glasgow, Storbritannia

mottatt: 15 desember 2009; Godkjent: 22 mars 2010; Publisert: 14 april 2010

Copyright: © 2010 Bonnet et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet støttes av en Innovatie dør Vitenskap no Technologie (IWT) tilskudd til Strategisch BasisOnderzoek (SBO) Bioframe prosjektet og ved en Interuniversity attraksjonen Pole (IUAP) tilskudd til BioMaGNet prosjektet (Bioinformatikk og modellering. fra genomer til Networks, ref p6 /25). Finansiører hadde ingen rolle i studiedesign, datacollection og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

microRNAs (mirnas) er små endogene regulatoriske RNA, til stede i en rekke forskjellige eukaryote organismer. De er innarbeidet i en RNA indusert stanse kompleks (RISC) som binder seg til områder av variabel komplementaritet i mål messenger RNA, utløser deres nedbrytning og /eller undertrykke deres oversettelse [1]. Bevis for deltakelse av miRNAs i cellevekst, celledifferensiering og kreft er i ferd med å hope seg opp. Nesten halvparten av den kommenterte menneskelige mirnas kartet innen skjøre kromosomale regioner, som er områder forbundet med ulike typer kreft hos mennesker. Nyere bevis indikerer at mirnas så vel som de faktorer som deltar i miRNA biogenese kan fungere som tumor-suppressorer og /eller onkogener [2]. Ifølge den nyeste miRBase depotet meldingen [3], det er 700 mennesker modent miRNA sekvenser identifisert med eksperimentell støtte, mens noen beregningsstudier utvide denne listen til mer enn 1000 [3], omtrent tilsvarende antall transkripsjonsfaktorer [4] . Beregnings og eksperimentelle studier har også forutsett at mellom 30% og 100% av de humane protein-kodende gener kan være under den posttranskripsjonsregulering av mirnas [5], [6]. Det er ikke vanskelig å se at selv ved å ta de mest konservative verdier, er de regulatoriske nettverk indusert av et så stort antall av regulatorer og mål potensielt svært store. Dessuten trenger mirnas ikke opptre isolert, men er en del av et komplekst regulatorisk nettverk, som involverer transkripsjonsfaktorer, signal transdusere og andre typer regulatoriske molekyler [7]. Rekonstruere og analysere slike regulatoriske nettverk er således et komplekst, men viktig utfordring å takle.

Forskjellige algoritmer eksisterer for å antyde regulatoriske nettverk fra ekspresjonsdata [8], [9], [10]. En av de mest effektive metodene, spesielt for eukaryote organismer, forutsetter en modulær struktur av den underliggende regulatoriske nettverk, der en gruppe co-uttrykte gener reguleres av et felles sett av regulatorer (også kjent som tilsynsprogram) [10]. Det regulatoriske programmet bruker uttrykket nivåer av settet av regulatorer å forutsi tilstanden avhengig middel uttrykk av co-uttrykte gener. Dermed er modulene består av klynger av co-uttrykte gener sammen med tilhørende regulatorer. Som regulator kan være assosiert med mer enn en modul, danner ensemblet en modul nettverk. Vi har nylig utviklet en ny algoritme som strekker seg den opprinnelige modul nettverk begrepet Segal og medarbeidere [10] ved hjelp av sannsynlighetsoptimaliseringsteknikker som muliggjør prioritering av de statistisk mest signifikante klynger av co-uttrykte gener og deres kandidat regulatorer [11], [12]. Den største fordelen med denne algoritmen er at det trekker ut mer representative sentroide-lignende løsninger fra et ensemble av mulige statistiske modeller, for å unngå suboptimale løsninger. Ved å teste den på ulike biologiske datasett, har vi vist at denne tilnærmingen genererer mer sammenhengende moduler, og at myndighetene konsekvent tildelt en modul er oftere støttet av eksterne datakilder [11], [12].

i denne studien har vi tilpasset vårt modul nettverk algoritme for å ta som input en heterogen datasett fra både miRNA og budbringer-RNA (mRNA) ekspresjonsdata målt på de samme prøvene. Flere mirnas er tildelt så høye-scoring kandidat regulatorer for flere moduler, sammen med kjente transkripsjonsfaktorer eller signaldetektorer. En detaljert analyse av tre moduler hvor mirnas er valgt som høy-scoring regulatorer viser at dette oppdraget er svært samstemt med modulen funksjon og er også støttet av ulike eksterne datakilder. Vi har også validert en av disse moduler eksperimentelt, og viser at over-ekspresjon eller inhibering av miRNA tildelt som en regulator endres vesentlig ekspresjon av et utvalg av modul gener og bekrefter derved slutning av algoritmen. Disse resultatene underbygge modul nettverk slutning som en robust og nyttig tilnærming for å få mer presise innsikt i miRNA funksjon.

Resultater

slutning av en mikroRNA modul nettverk fra uttrykket data

LeMone algoritme, som starter fra et uttrykk datamatrise og en liste med kandidat regulatorer, vil produsere en modul nettverk, som består av moduler av co-uttrykte gener og deres tilhørende regulatorer. Algoritmen er også gruppering med forholdene (kolonner) for hvert sett av co-uttrykte gener, skaper tilstand klynger. Listen over regulatorer for en gitt modul er bestilt i henhold til deres individuelle poeng. Denne poengsummen tar bare hensyn til differensial uttrykk for regulator på tvers av ulike ulike tilstand klynger, og ikke deres absolutte verdi. På denne måten kan vi samtidig evaluere og sammenligne mRNA og miRNA kandidat regulatorer, bruker uttrykket nivåer av hver klasse av regulatorer. Som innspill til vår algoritme, brukte vi et datasett bestående av uttrykk data målt på 89 svulst og prøver normalt vev (som representerer 11 kreft klasser) både for 11,833 messenger RNA og 124 mirnas [13]. I motsetning til tidligere forsøk [14], [15], [16], vår tilnærming til integrering av miRNAs i nettverket er ikke basert på miRNA mål prediksjon, eller en blanding mellom mål prediksjon og uttrykk data, men bygger utelukkende på uttrykk data. Algoritmen som genereres et sett av 76 tett co-uttrykte gensamlingene, svarende til et totalt 2987 gener. Vi beregnet GO berikelse for alle modulene [17] og fant totalt 44 klynger med minst en GO kategori beriket (p 0,05), for totalt 589 beriket kategorier (den komplette listen over moduler og deres GO kategorier er tilgjengelig som tabell S2). For tildeling av regulatorer, vi satt sammen en liste over 1,841 kandidat regulatorer basert på deres GO annotering (enten transkripsjonsfaktorer eller signaldetektorer), pluss en liste over 124 miRNAs. Etter tildelingen av regulatorer tok vi en strengere cutoff tilsvarer de beste 2% mest betydnings beregnede regulerings interaksjoner (figur 1), har fått endelig sett av 294 unike regulatorer (fullstendig liste med modul gener og regulatorer er tilgjengelig i tabell S1). Innenfor dette settet ble ti mirnas valgt som regulatorer for totalt syv moduler (tabell 1). For å vurdere gyldigheten og relevansen av inferred modulen nettverk, vi her presentere en detaljert analyse av tre moduler, med vekt på de typiske trekk ved miRNA medierte regulatoriske moduler. Disse modulene ble valgt basert på deres iboende interesse, funksjonell sammenheng og det høye antallet litteraturreferanser diskutere deres antatte funksjon.

Histogrammene representerer fordelingen av randomisert (grønn) og sann (gul) regulatorer score for modul nettverk. Pilen for tilfeldige regulatorer representerer maksimal score for randomisert regulatorer med det som står i parentes. Pilen for den sanne regulatorer representerer cutoff poengsum verdi, med den rå verdien som er angitt i parentes.

MiR-133 og MIR-145 er tildelt som regulatorer av en glatt muskel actomyosin modul

modul 29 er en liten modul som består av fire gener og fem er tilordnet regulatorer (figur 2a). De går over-representert kategorier for denne modulen er knyttet til glatte muskelutvikling og actomyosin struktur (figur 2a og tabell S2). MYH11 koder for et glatt muskulatur myosin tung kjede familiemedlem. ACTG2 er en gamma 2 aktin protein som finnes i enteriske vev. De to andre gener i modulen (Mylk og CNN1) er godt kjent regulatorer av aktin-myosin interaksjoner. Mylk er myosin lett kjede kinase, en dedikert kalsium-avhengig kinase som fosforylerer et bestemt sted på regulatoriske lette kjeden av myosin, styrke sin aktivitet. Mylk er allestedsnærværende i alle voksne vev med den høyeste mengder som finnes i glatt muskelvev [18]. CNN1 (calponin) er et kalsiumbindende protein som hemmer ATPase aktiviteten av myosin i glatt muskulatur. Den øverste regulator (PPP1R12B) er valgt for denne modulen er en myosin fosfatase subenhet. Myosin fosfatase er også et velkjent kjerne regulator av actomyosin vei, inhibering av myosin aktivitet [18]. Den andre høy scoring kandidat regulator er en miRNA, MIR-133, mens den tredje regulatoren er TGF-beta stimulerte klon-22 medlem 1 (TSC22D1) genet, som koder for et leucin zipper domene protein, et medlem av TGF-beta 1- pathway som er involvert i regulering av transkripsjon. De siste regulatorer er ANGPTL2, en vaskulær endotelial vekstfaktor, og en annen miRNA, MIR-145.

genuttrykk verdier er fargekodet, fra mørkeblå (lave nivåer) til lys gul (høy uttrykk nivåer) . I hver figur, søyler representerer en annen prøve. Den fargekodet linjen nederst på grafen representerer vev opprinnelse (se legenden), mens de grå rutene like nedenfor viser om prøven vev var normal (lys grå) eller svulst (mørk grå). Kandidat regulatorer er sortert etter synkende poengsum verdi (fra topp til bunn). Samplene grupperes i blader av homogene uttrykk verdier, i henhold til de hierarkiske trær som er angitt på toppen av hver figur. De oransje boksene på høyre side av figuren viser overrepresentert GO kategorier (p≤0.05).

De to mirnas valgt som regulatorer for denne modulen viser tydelig en tett positivt korrelert uttrykk mønster med modul gener ( Figur 2a). Som de fleste mirnas har blitt karakterisert så langt som negative regulatorer av genuttrykk, dette tyder på en indirekte regulering mellom mirnas og modul 29 gener. Nyere studier viser flere sannsynlige kandidat gener som kan fungere som mellom regulatorer mellom mirnas og modul 29 gener. MiR-133, er valgt som den nest beste regulator for denne modulen (figur 2a), ble nylig vist å være en viktig regulator for skjelettmuskelutvikling og hjertemuskelhypertrofi [19], [20]. I disse studiene, er MIR-133 er vist å direkte regulere SRF transkripsjonsfaktor. SRF er anerkjent som en viktig faktor for normale cytoskeletal og kontraktile celle aktiviteter og alle modul 29 gener (

MYH11

,

CNN1

,

ACTG2

,

Mylk

) er kjent for å være direkte mål av SRF [21]. Disse litteratur Resultatene støtter hypotesen om en indirekte regulatorisk sammenheng mellom MIR-133a og modul 29 gener via SRF. De fleste studier på SRF aktivitet har så langt preget denne faktoren som en transkripsjonen aktivator [21], men noen resultater tyder også på at SRF kan fungere som en transcriptional repressor av sine mål gener [22], [23], [24]. SRF mediert genet undertrykkelse er ikke klart, men det kan innebære rekruttering av SRF av transkripsjons lyddempere [23], [24]. Hvis vi hypoteser om at SRF er undertrykke transkripsjon av modul 29 gener, så det regulatoriske kjeden MIR-133 – SRF – modul 29 gener kan forklare den positive genuttrykk korrelasjon som er observert i figur 2a. De andre miRNA valgt som en regulator, MIR-145 ble nylig vist seg å være en viktig regulator for glatt muskelcelle skjebne [25]. Denne studien [25] viser også at MIR-145 aktiverer en av dens direkte mål, den myocardin (myOCD), som er en transkripsjonsfaktor vel kjent for å aktivere glatt muskulatur genekspresjon ved å samhandle med SRF [26]. Dermed har vi også en regulerende kjede MIR-145 – myOCD – modul 29 gener som kan forklare mønsteret av uttrykket observert i figur 2a. Verken SRF eller myOCD er tildelt som regulatorer eller gruppert sammen med de andre modul 29 gener. Dessverre er det myocardin genet var ikke til stede i de mikromatriser brukes i fremstillingen av datasettene [13]. Profilen på SRF transkripsjonsfaktor synes å korrelere dårlig med uttrykk for modul 29 gener i vårt datasett (Data fil S1), som forklarer hvorfor dette genet ikke kan velges som en regulator. Flere grunner kan forklare hvorfor profilen er avvikende, som posttranslasjonelle modifikasjoner eller det faktum at mirnas handle på post-transkripsjonsnivået, muligens hindre regulerende effekt for å bli oppdaget (ved å undertrykke oversettelsen).

MiR -142s er betegnet som regulatorer av en immunrespons modul

modul 18 er sammensatt av seks gener (figur 2b), hvorav fem koder for immunoglobuliner som svarer enten til den tunge kjeden (IGHG4, IGHA2, IGHA1) eller til lettkjede (IGKV1-5, IGLV3-21), mens IGLL1 er surrogat lette kjede, en kritisk komponent av pre-B-celle-reseptor-komplekset. Ikke overraskende, vi fant GO kategorien immunrespons overrepresentert for denne modulen (figur 2b og tabell S2). Alle modul genene er kjent for å være for det meste uttrykkes i utviklings og modne B-celler, avslører en sammenhengende Modul [27]. Ni høye poeng regulatorer ble valgt for denne modulen. Den øverste regulator er en homeobox genet, HOXC5. Den HMGA1 genet er valgt som den nest beste regulator for denne modulen. Høye mobilitet gruppe proteiner (hmga) regulere aktiviteten av et bredt utvalg av gener ved å endre DNA-konformasjon av deres målgener. HMGA1 Det er kjent at co-aktiverer transkripsjon i B-celler og å være viktig for B-celler utvikling [28]. Den tredje og fjerde kandidat regulatorer er to mirnas behandlet fra samme forløper, MIR-142-5p og MIR-142-3p. HLA-DRB1 genet tilhører de HLA klasse II beta kjeden paralogues. Det er kjent for å spille en sentral rolle i immunsystemet ved å presentere peptider som stammer fra ekstracellulære proteiner [29]. CCL5 er en kjemotaktisk cytokin som spiller en aktiv rolle i å rekruttere leukocytter til inflammasjons [30]. AXL er en reseptortyrosinkinase som forandrer i fibroblast og hematopoetiske celler, og er involvert i utvikling mesenchymale [31]. CXCL14 er en liten cytokin som hører til CXC kjemokin familien. Dette genet er kjemotaktisk for monocytter og kan aktivere disse cellene i nærvær av en inflammatorisk mediator [32]. CXCL14 uttrykk er redusert eller fraværende i de fleste kreftceller [33]. Denne modulen er sannsynligvis knyttet til en immunrespons utløses av ulike krefttilstander. Slike vedvarende pro-tumor immunresponser er kjent for å forsterke primære tumorutvikling og ondartet progresjon.

Mir 142s er fortrinnsvis uttrykt i hematopoietiske vev og deres ekspresjon er regulert i løpet av hematopoiesis, hvilket antyder en rolle i immunceller differensiering [34 ]. Transkripsjonsfaktor TCF12 er spådd som et mål for MIR-142-3p [35]. I en tidligere studie ble en kombinert dosering av faktorene E2A, E2-2 og TCF12 vist seg å være nødvendig for normal B-celle utvikling. Mer presist, er TCF12 viktig for generering av normale antall av pro-B-celler [36]. Fordi modulen 18 gener blir uttrykt i utviklingen av B-celler, kan reguleringen av TCF12 ved MIR-142-3p være viktig for denne prosessen. Videre fant vi bevart bindende motiver for TCF12 for de fleste modul 18 gener (datafil S1), noe som indikerer at denne transkripsjonsfaktor kan være viktig for deres regulering. Som for modul 29 og SRF, er uttrykket profilen til TCF12 svært avvikende fra uttrykket profiler av modul 18 gener, forklarer hvorfor dette genet ikke ble valgt som modul genet eller regulator (data ikke vist).

speil 200A er en viktig regulator av en modul som er involvert i epitel-Homeostase

modul 25 er sammensatt av ni gener (figur 2c). SCNN1A (også kjent som ENaC) er den underenheten alfa av amilorid-følsomme natrium-epiteliale kanal, uttrykt i mange epitelvev [37]. PRSS8 (prostasin) er en trypsinogen som regulerer aktiviteten til epiteliale natriumkanalen [38]. FDXY3 er en liten membranprotein som er sterkt transkribert i vev slik som uterus, mage og tykktarm, og kan fungere som et Na /K-kanalregulatoren [39]. TACSTD1, tumor-assosiert kalsium signal transduser 1, fungerer som et kalsium-uavhengig celleadhesjonsmolekyl [40]. Andre gener som ATAD4 eller TMEM63A er trans-membran proteiner med ukjent funksjon. RAB25 er et lite GTP-bindende protein. RAB proteiner har vært involvert i reguleringen av vesikkel menneskehandel [41]. Modulen toppen regulator er MIR-200A. Når det gjelder de andre regulatorer, er PPP1R1B et fosfoprotein regulert av dopamin og cAMP, og er en inhibitor for protein fosfatase 1. I tillegg til den velkjente rolle i det sentrale nervesystemet, det er sterkt uttrykt i en rekke av epitelvev, hvor det kan skje spille en rolle i signalisering og epitelial tumorigenesis [42]. GPR30 er et trans-membran G-proteinkoblet østrogenreseptor [43], mens PTGER3 er en G-proteinkoblet prostaglandin E2 reseptor som er involvert i en rekke fysiologiske prosesser, og ble vist å påvirke intracellulære konsentrasjoner av Ca ++ og cAMP [43]. ZNF157 er en sink-finger-protein med ukjent funksjon mens GNB3 og GNG5 er G-protein-underenheter som er involvert i signaltransduksjon. Fra funksjonene til disse genene, kan vi konkludere med at det meste av modul 25 gener og regulatorer sannsynligvis involvert i epitel homeostase, selv om vi ikke finner noen spesiell GO kategori beriket for denne modulen. Det er også verdt å merke seg at flere av disse genene er knyttet til tumorprogresjon [40], [41], [44].

MiR-200a, som ble valgt som den beste kandidaten regulator for modul 25, er et medlem av en miRNA familie på fem nært beslektede mirnas (MIR-200a, MIR-200b, MIR-200C, MIR-141 og MIR-429). Nyere publikasjoner viser epitel spesifikke uttrykk for MIR-200A og MIR-200b [45], [46]. Vi har utviklet et sett forsøk for å validere den rollen MIR-200a som en regulator av ekspresjonen av gener i modulen 25. MiR-200a ble innført i en human de differensiert epitelial brystkreftcellelinjen MDA-MB-231, kjent for å uttrykke abnormt lave nivåer av MIR-200A. Uttrykket av seks gener (

RAB25

,

IRF6, SCNN1A, PRSS8, ATAD4

,

TACSTD1

) ut av ni tilhørighet til modul 25 ble overvåket ved hjelp av RT-qPCR ( figur 3). Uten unntak, de seks overvåkede genene viser en klar oppregulering på eksogene uttrykk for MIR-200a (figur 3a). Det motsatte forsøk inhibering av noen medlemmer av MIR-200 familien (MIR-200a, b, c) i MDA-MB-231-celler ved hjelp av antagomirs, resulterte i en betydelig nedregulering av fire av fem testede gener, (

SCNN1A

er ikke signifikant nedregulert,

ATAD4

er ikke uttrykt i normale forhold i denne cellelinje) (figur 3b). Disse resultatene viser tydelig at MIR-200a er en kjerne regulator av modul 25, mest sannsynlig med andre medlemmer av MIR-200 familien.

(a) Real time kvantitativ PCR (RT qPCR) analyse av uttrykket av modul 25 gener

RAB25

,

IRF6, SCNN1A

,

PRSS8

,

ATAD4 og TACSTD1 Hotell og ved overuttrykk av MIR-200a i MDA- MD-231-celler (gjennomsnitt ± standardavvik). Y-aksen representerer den relative mRNA-ekspresjon verdi. MIR-en ble brukt som kontroll (Ctrl), da det ikke er kjent for å målrette noen av de overvåkede gener (b) RT qPCR analyse av den relative uttrykk for genene

RAB25

,

IRF6

,

SCNN1A

,

PRSS8 Hotell og

TACSTD1

i MDA-MB-231 celler infiltrert med MIR-200a, b, c antagomirs. Y-aksen representerer den relative mRNA-ekspresjon verdi (gjennomsnitt ± standardavvik). MIR-en ble brukt som kontroll (Ctrl) (c) RT qPCR analyse av de relative uttrykk nivåer av modul 25 gener

RAB25, IRF6, SCNN1A, PRSS8, ATAD4, TACSTD1, TMEM63A Hotell og

FXYD3

i MDA-MB-231 celler der

ZEB1

er slått ned. Den første barplot (svart) viser effektiv undertrykkelse av

ZEB1

nivåer ved transfeksjon med

ZEB1

bestemt siRNA. Par = foreldrecellekultur, Mock = mock transfeksjon, si-ZEB1 = transfeksjon med ZEB1 spesifikke siRNA.

I denne modulen ser vi igjen en klar positiv korrelasjon mønster mellom MIR-200a og modulen gener uttrykk, noe som tyder på en indirekte reguleringskrets mellom MIR-200a og modul 25 gener (Figur 2c og 3a og 3b). Nyere eksperimentelle arbeidet viste at MIR-200 familiemedlemmer direkte rettet mot transkripsjonsfaktorer ZEB1 og ZEB2 [47], [48], [49]. Disse transkripsjonsfaktorene er kjent som store transcriptional repressors av epitelial differensiering iscenesetter epitel mesenchymale overgang (EMT) [50]. EMT er en prosess som driver epitelceller fra en polarisert fenotype til en sterkt motile, ikke-polarisert mesenchymale fenotype og er kjent for å forekomme i epiteliale tumorer som gir opphav til svært maligne cancerceller. De ZEB transkripsjonsfaktorer har vært funksjonelt relatert til medlemmer av MIR-200 familie via en dobbel negativ feedback loop, og dermed fremme EMT og kreft invasjonen [47], [51], [52]. Vi fant konservert ZEB bindende motivene for flere modul 25 gener (datafil S1), noe som tyder på at ZEB faktorer kan være mellom regulatorer mellom MIR-200 og modul 25 gener. For å teste denne hypotese, vi nedregulert den ZEB1 transkripsjonsfaktor i MDA-MD-231-celler med en spesifikk siRNA mens man overvåket ekspresjon av åtte modul 25 gener (figur 3c). Alle genene viser en sterk oppregulering mønster, med unntak av genet RAB25 (figur 3c). Disse resultater viser at den ZEB1 faktor er viktig for regulering av modulen 25 gener. Til sammen våre eksperimentelle resultatene (figur 3) sterkt at eksistensen av et regulatorisk kjede mellom MIR-200 og modul 25 gener via ZEB1 transkripsjonsfaktor (figur 4). Som både MIR-200 og ZEB1 spiller viktige roller i EMT [47], [48], [49], [51], [52] vi hypotese at modulen 25 undertrykkelse kan bidra til ondartet EMT prosessen i kreftceller.

MiR-200 gener undertrykke ZEB faktorer, som i sin tur undertrykker ekspresjonen av modulen 25 gener. Den lysegule indikere gener tildelt som regulatorer, indikerer lys grønn modul gener, mens lampen oransje indikerer gener ikke tildelt som regulatorer, men støttes av litteratur (indirekte regulering). Denne reguleringsmodell støtte positiv korrelasjon av uttrykk mønstre mellom mir-200a og modul 25 gener.

Diskusjoner

mirnas har dukket opp ganske nylig som et nytt og viktig lag av regulering. Mesteparten av de studier så langt har fokusert på deres identifikasjon og på deteksjon av sine mål. Flere eksperimentelle undersøkelser har vist at i det minste noen av dem spiller viktige roller i forskjellige utviklings og cellulære veier. Integrering mirnas i regulatoriske nettverk er derfor av fundamental betydning og bør ideelt sett gjøres tar hensyn til andre typer regulatoriske molekyler. Så langt har få studier foreslått en beregnings strategi for å antyde miRNA medierte modul nettverk [14], [15], [16]. Disse ble i hovedsak basert på miRNA mål prediksjon, eller på en kombinasjon av mål prediksjon og uttrykk data. Vi har brukt en robust og objektiv modul nettverk slutning algoritmen til en kreft-relaterte uttrykk datasett av både mRNA og miRNAs. I vår tilnærming, ble mirnas ansett som kandidat regulatorer, sammen med andre typer regulatorer, som transkripsjonsfaktorer og signal transdusere. Selv etter å ha påført en strengere cutoff ble flere mirnas beholdt så høy score, statistisk signifikante kandidat regulatorer for ulike moduler. Gjennom en grundig analyse av tre av disse modulene, viste vi at tildelingen av spesifikke miRNAs som regulatorer støttes av ulike eksterne kilder og er funksjonelt sammenhengende. Videre kan vi vise eksperimentelt at en miRNA, tildelt som den beste regulator, er faktisk en viktig regulator for modul gener uttrykk. Antallet mirnas tilordnet i denne studien (10) kan virke ganske beskjedne, men dette tall må bli vurdert med hensyn til det totale antall mirnas hvor ekspresjon ble målt i prøvene (124). Forholdet tilordnede pr totalt antall mirnas er lik 8%, mens den samme forholdsverdi er 15% for ensemblet transkripsjonsfaktorer i tillegg til signal transdusere (284/1841). De to ratio verdiene er sammenlignbare og derfor kan vi med rimelighet kan forvente et høyere antall mirnas tildelt når en økt dekning av miRNome uttrykk landskapet vil være tilgjengelig.

Likevel, akkurat som med andre lignende metoder, har omsorg for å være tatt for tolkningen av inferred reguleringsmodellen. Spesielt kan korrelasjonen av genekspresjon ikke alltid angi en direkte interaksjon. Faktisk, for de tre moduler som vi har undersøkt i detalj, har vi funnet en indirekte regulering svei mellom regulatoren og modulen gener. Videre ble ingen av de indirekte regulatoriske gener tildelt av algoritmen i reguleringen program eller gruppert sammen med de modul gener. Som vi kunne vise for modul 29 og SRF transkripsjonsfaktor, er grunnen fordi de indirekte regulatorer uttrykk profil avviker vesentlig fra de av modulen gener. Forskjellige grunner kan forklare dette avvik, for eksempel regulering kan skje ved post-transkripsjonelle nivå, eller kan være et resultat av post-translasjonelle modifikasjoner. Indirekte regulatorer kan selvfølgelig komplisere tolkningen av resultatene, men de er å forvente, spesielt i høyere eukaryote organismer hvor regulatoriske nettverk forventes å være mer komplisert [53].

Til sammen våre resultater viser at romanen innsikt kan oppnås av et robust modul nettverk analyse av miRNA og mRNA uttrykk data og støtter det syn at i det minste noen mirnas har viktige regulatoriske roller i viktige cellulære prosesser. Vår tilnærming har også fordelen av å gi en direkte visning av post-transcriptional modifikasjoner gjennom integrering av miRNAs, hvor mRNA uttrykk alene ikke kan være nok til å avsløre eksistensen av regulatoriske interaksjoner. Alle tre moduler som vi gjorde en detaljert analyse i denne studien har hvert et sammenhengende sett av gener som er involvert i samme prosess og funksjon. Videre, ved å koble mirnas til sammenhengende moduler, mener vi at denne tilnærmingen kan bidra til å belyse miRNA funksjon og kan effektivt drive eksperimentelt arbeid mot identifisering av viktige regulatoriske komponenter i ulike prosesser. Med den raske spredningen av ulike teknikker for å måle med høy nøyaktighet nivåer av uttrykk for hundrevis av mirnas, og samtidig tilgjengeligheten av mRNA uttrykk data, vil det være svært attraktivt å anvende beregnings strategier som den vi beskriver her å utvide vår kunnskap på globale regulatoriske nettverk.

Materialer og metoder

Expression datasett

Vi brukte en normalisert kreft uttrykk datasett tidligere utgitt [13]. Vi utførte ytterligere filtreringstrinn for å forbedre kvaliteten av inngangsdatasettet. Probesets med ingen kjente ensembl genet identifikatorer ble forkastet, samt miRNA sekvenser som ikke ble kommentert som menneskelige mirnas i den nyeste miRBase meldingen [3]. Den endelige data matrise inneholdt 11,833 gener og 124 mirnas, som uttrykk ble målt over 89 prøver som dekker 11 ulike kreft klasser.

Module nettverk slutning

Vi brukte LeMone algoritme for å antyde modulen nettverk [11], [12], [54]. I et første trinn blir den algoritme søker etter en skillevegg av gener inn i klynger av co-uttrykte gener. I et andre trinn, definerer algoritmen et regulatorisk program (et sett av regulatoriske gener) for hver klynge.

Legg att eit svar