PLoS ONE: miRNA-mRNA Correlation-nettverksmoduler i Human prostatakreft og forskjellene mellom primær og metastatisk Tumor Subtypes

Abstract

Nyere studier har vist bidrag mirnas til kreft patogenesen. Prostatakreft er den vanligste diagnosen kreft hos menn. I motsetning til andre alvorlige kreftformer, er det ikke enkelt gen blitt identifisert som å være mutert i de fleste av prostatakreft. Dette innebærer at uttrykket profilering av gener, inkludert de ikke-kodende mirnas, kan betydelig variere over enkelte tilfeller av denne kreftformen. Den innen-klasse variasjon gjør det mulig å rekonstruere eller slutte sykdomsspesifikke miRNA-mRNA korrelasjon og regulatoriske modulære nettverk ved hjelp av high-dimensjonale microarray data av prostata tumorprøver. Videre, siden mirnas og tumorsuppressorgener er vanligvis vev bestemt, miRNA-mRNA-moduler kan potensielt variere mellom primær prostatakreft (PPC) og metastatisk prostatakreft (MPC). Vi her utført en

i silico

analyse for å utforske miRNA-mRNA korrelasjon nettverksmoduler i de to kreft subtyper. Vår analyse identifisert 5 miRNA-mRNA modul par (MPS) for PPC og MPC, henholdsvis. Hver MP inkluderer en positiv-tilkobling (korrelasjon) modul og en negativ-tilkobling (korrelasjon) modulen. Antallet mirnas eller mRNA (gener) i hver modul varierer fra 2 til 8 eller fra 6 til 622. Modulene oppdaget for PPC er mer informativ enn for MPC i form av de impliserte biologiske innsikt. Spesielt en negativ-tilkobling modul i PPC passer godt med populært anerkjent miRNA-mediert post-transcriptional regulering teori. Det er, blir de 3’UTR sekvenser av de involverte mRNA (~620) beriket med målstedet motiver av de 7 modulære mirnas, har-MIR-106b, -191, -19b, -92a, -92b, -93, og -141. Om 330 GO vilkår og KEGG trasé, inkludert TGF-beta signalveien som opprettholder vev homeostase og spiller en avgjørende rolle i bekjempelse av spredning av kreftceller, er overrepresentert (adj.p 0,05) i den modulære genet listen. Disse beregnings identifiserte moduler gir bemerkelsesverdig biologiske bevis for forstyrrelser av miRNAs i utviklingen av prostatakreft og garanterer ekstra oppfølging i uavhengige laboratoriestudier

Citation. Zhang W, Edwards A, Fan W, Flemington EK, Zhang K (2012) miRNA-mRNA Correlation-nettverk moduler i human prostatakreft og forskjellene mellom primær- og metastatisk svulst Subtyper. PLoS ONE 7 (6): e40130. doi: 10,1371 /journal.pone.0040130

Redaktør: Lorenzo Chiariotti, Università di Napoli Federico II, Italia

mottatt: 19 mars 2012; Godkjent: 01.06.2012; Publisert: 29 juni 2012

Copyright: © 2012 Zhang et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Forskning rapportert i denne publikasjonen ble støttet av National Institutes of Health tilskudd (NIGMS P20GM103424, NCRR-RCMI 5G12RR026260-03), en Louisiana BOR award (LEQSF (2008-11) -RD-A-32), en US Department of Army stipend (W911NF -12-1-0066) og en NSF stipend (EPS-1006891). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser. Selv om Dr. Wei Fan er tilknyttet IBM T.J. Watson Research dette betyr ikke endre forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer.

Innledning

microRNAs (mirnas) er korte (~

22nt

), ikke-kodende RNA avledet fra genom-kodet stammesløyfe forløpere. Som de avgjørende post-transcriptional regulatorer av genuttrykk i metazoans, mirnas primært binder seg til 3 «UTR sekvenser av messenger RNA (mRNA), vanligvis resulterer i translasjonell undertrykkelse eller mRNA degradering [1], [2]. Det er anslått at ~ 30% av humane protein-kodende gener blir regulert av mirnas, der hvert miRNA kan målrette omtrent 200 transkripter og mer enn en miRNA kan konvergere mot en enkelt mRNA-target [2], [3]. Tallrike studier har vist at abnormt uttrykt miRNA

s

vil trolig bidra til menneskelige sykdommer, inkludert kreft [4], [5], [6], [7], [8], [9]. Men disse små RNA kan ikke være «kreft-drivere» [10] i de fleste krefttilfeller fordi bevisene for sine mutasjoner i sematic cellene er fortsatt relativt sjeldne [11], [12]. Dette indikerer at mirnas seg selv kan være regulert av andre molekyler, slik som transkripsjonsfaktorer [13] og, i sin tur, samvirkende spiller rolle i sykdomsprogresjon ved å forsterke eller redusere virkningen av de avvik som opptrer i proto-onkogener og tumorsuppressorgener. Det har blitt anerkjent at forstyrrelser av miRNAs med tumorigenesis er ganske komplisert og må gransket av nettverksbaserte systemer biologiske metoder.

Til dags dato, en rekke algoritmer har blitt utviklet for å antyde miRNA-mRNA-moduler eller modulære nettverk med genome-wide transkripsjon og sekvens affinitet informasjon [14], [15], [16], [17]. Til tross for de ulike algoritmiske design og beregningsmessige kompleksiteten, flytskjemaer for disse metoder er ganske tydelig og definisjonene av en miRNA-mRNA-modul bære tilsvarende egenskaper. En grunnleggende modul består generelt av et sett av co-uttrykte protein-kodende gener og et miRNA som er signifikant korrelert med disse genene i uttrykket nivå, eller er et topp prediktor (blant andre regulatorer) for mRNA-set bestemt klassifisering trær av de biologiske prøver /»forhold» [18], [19], [20]. En slik en-til-mange type modul kan deretter raffinert til en kanonisk miRNA-mRNA regulatoriske modul der uttrykk for mirnas og mRNA er i omvendt forhold, og de komplementære motiver av de mirnas «frø sekvenser eksisterer i 3’UTRs av målgener (mRNA). To eller flere en-til-mange-moduler kan videre kombineres til en mange-til-mange-modul ved å identifisere sine kryss [16].

Prostatakreft er den vanligste diagnosen kreft og andre ledende årsaken til kreftdødelighet i amerikanske menn. Hvert år blir mer enn 200.000 nye tilfeller diagnostisert og over 30.000 voksne menn dør av denne sykdommen [21]. Dødelig utgang oppstår ofte når lokal tumorinfiltrasjon har spredd seg utover prostata og spredning til lymfeknuter og andre organer. I motsetning til andre viktige typer kreft, den genetiske etiologien av prostatacancer er ganske kompleks og heterogen. Ingen enkelt gen-mutasjon er blitt pekt i de fleste av prostatakreft [12], [22], [23]. Dette innebærer at uttrykket profilering av gener, inkludert ikke-kodende mirnas, kan betydelig variere over enkeltsaker i ulike stadier eller undergrupper av prostatakreft. Den innen-klasse variasjon, dvs. variasjon hovedsakelig på grunn av den iboende forskjeller i molekylær genetisk mekanisme blant samplede individer av samme klasse, gjør det mulig å rekonstruere eller antyde sykdommen spesifikke korrelasjon og regulatoriske (modulære) nettverk ved hjelp av high-dimensjonale microarray data av prostata tumorprøver. Spesielt fordi mirnas og tumorsuppressorgener er vanligvis vevsspesifikk [23], [24], miRNA-mRNA moduler potensielt forskjellig mellom primære prostatakreft (PPC) og metastatisk prostatakreft (MPC). Vår studie dermed initiert fra denne oppfatningen og sentrert på

i silico

identifisering og sammenligning av miRNA-mRNA moduler i PPC og MPC. En nylig utgitt omfattende database [12] gitt oss de nødvendige opplysningene for en slik bioinformatikk etterforskning. De oppnådde resultater gir bemerkelsesverdig biologisk innsikt i innblanding av mirnas i utviklingen av prostatakreft. Figur 1 oppsummerer ordningen med vår studie flyt, og detaljene for hvert trinn er beskrevet i metodedelene resultatene og.

Før nedbryting, ble Pearson korrelasjonskoeffisienter transformert med Fisher r-z-metoden. A1 /B1 /C1: resultatene oppnådd fra den primære prostatakreft (PPC) prøver. A2 /B2 /C2: de oppnådde resultatene fra metastatisk prostatakreft (MPC) prøver. A3 /B3 /C3. Resultatene oppnådd fra en tilfeldig datastruktur som genereres av stokking PPC matrise

Red: de beste 1% positive sammenhenger. Gul: de beste 1% negative sammenhenger. Oransje:. Pseudo eller ubehandlede korrelasjoner

Red: de beste 1% positive sammenhenger. Gul: de beste 1% negative sammenhenger. Oransje:. Pseudo eller ubehandlede korrelasjoner

Diskusjon

Resultater og SVD Analyse av miRNA-mRNA Interaksjon Matriser

Før dedusere de miRNA-mRNA nettverksmoduler for PPC og MPC, prøvde vi å få en generell forståelse av forskjellene mellom disse to korrelasjonsmatrisen beregnes fra miRNA /mRNA uttrykk nivåer av de primære og metastatiske tumorprøver, henholdsvis (se metode seksjon for detaljer). Men på grunn av det enorme antall potensielle miRNA-mRNA-regulerende eller co-uttrykte forhold og det kompliserte samspillet mellom dem, sammen med støy som innføres i prøvetaking og måling prosess, den parvise sammenligning av de tilsvarende matriseelementene var for trivielt å oppnå en konklusjon. Vi omgått denne hindringen ved å anvende en ny fremgangsmåte. Mer spesifikt, behandlet vi hver korrelasjonsmatrise som en pseudo datasett med rader (mRNA) som «observasjoner» og kolonner (mirnas) som «egenskaper», og kjennetegnes det ved å gjennomføre SVD (singulærverdidekomposisjonen) analyse [25], [ ,,,0],26], [27], [28]. Tatt i betraktning de verdier av korrelasjonskoeffisienter var i størrelsesorden [-1, 1], vi transformerte matrisen oppføringer ved hjelp av Fishers rz metode før spaltningen slik at resultatene kan forklares ved den standard statistisk teori.

de ordinære p-verdier ble justert med BH-metoden.

under~~POS=TRUNC nettverket ble hentet for moduler

p-modul-5-ne (ps)

. Alle tilkoblinger unntatt de som er relatert til E2F5 er negative. Signal + angir at minst en miRNA-target-området motiv eksisterer i den 3 «UTR-sekvens av den tilkoblede mRNA (gen).

. Genene som har negative forbindelser med mirnas i modulnettet er skyggelagt med rødt. Gene CDKN1A (om enn ikke i modulen genet liste) er også skyggelagt med rødt på grunn av de betydelige negative korrelasjoner (p 0,001) med HSA-MIR-93, -106b og -200c på uttrykket nivå. Gener E2F5, MYC (CMYC) og CDK4, som viser en tydelig mønster av positive transkripsjons korrelasjoner med modulære mirnas (figur 9), er skyggelagt med gult.

Antall presenteres på hver celle er p -verdi av sammenhengen for den tilsvarende miRNA og mRNA (genet).

Denne analysen førte til to interessante funn. Først, for både PPC og MPC korrelasjonsmatrisen, kan den ledende latente faktor forklare over halvparten av variasjonen i data (figur 2-A1, A2), og resultatet (i den første venstre entall-vektor) på tvers av gener (figur 2- B1, -B2) viser en klar to-peak distribusjon. For det andre, forskjellig PPC matrisen fra MPC-matriksen ved en betydelig andre latent faktor som forklarer ~ 20% av variansen og har et asymmetrisk stillingen (i det andre venstre entall vektor) fordeling (Figur 2-C1), som avviker fra den symmetriske motstykke for MPC (figur 2-C2). Styrken av denne analysen blir ytterligere fremhevet ved det faktum at de observerte mønstrene ikke er til stede i en tilfeldig datasett som vist i figur 2-A3, B3 og C3, hvor SVD analyse ble utført på en matrise som genereres av stokking radene og kolonnene i matrisen PPC. Mens de biologiske konsekvensene må utredes videre, disse funnene foreløpig bekreftet vår første hypotese om at den dynamiske forstyrrelser av miRNAs i disse to typer prostatakreft kan være annerledes og verdt videre utforskning.

Det er verdt å merke seg at, ved fremstilling av figur 2, har vi anvendt informasjon av 58 kreft mirnas samlet i [7]. Men de presenterte resultatene i stor grad holdes når SVD analyse ble utført på hele datasett (matriser). I tillegg ser vi at forskjellene mellom PPC og MPC kan bestemmes av en kjerne sett av miRNAs. Denne oppfatningen er basert på en ekstra analyse som viste at mønstrene vist i figur 2 også holdt på under matriser med bare tumorsupressorproteinene mirnas, men ikke på under matriser som inneholder onkogene mirnas eksklusivt. Vi vil fortsette å undersøke dette problemet i fremtidig forskning.

miRNA-mRNA moduler i forskjellige Prostate Cancer Subtyper

To miRNA-mRNA-nettverk (PN og MN) ble generert av en korrelasjon-basert metode for henholdsvis PPC og MPC,. For å fokusere på analyse av kreft-relaterte mirnas, ble dimensjonene av PN og MN ytterligere redusert som vist i metode delen. Med kondenserte nettverk som innganger, ble store kreftrelaterte miRNA-mRNA moduler identifisert av en gruppering analysebasert algoritme. Innenfor en enkelt modul, som hver miRNA eller mRNA som har minst to forbindelser med de tilsvarende modulære mRNAer eller mirnas.

Som oppsummert i tabell 1, Figur 3 og Figur 4, identifiserte vi 5 miRNA-mRNA modulparene (MPS ) for henholdsvis PPC og MPC,. Hver MP inkluderer en positiv-tilkobling (korrelasjon) modul og en negativ-tilkobling (korrelasjon) modulen. Antallet mirnas eller mRNA (gener) i hver modul varierer fra 2 til 8 eller fra 6 til 622. De fleste av modulene inneholder det sekvens-spesifikk DNA-bindende transkripsjonsfaktor (TF) gener [29] som kan ta roller som mediatorer for miRNA-mRNA-tilkoblinger. De to medlemmer (for eksempel

p-MODU-en-ps Hotell og

p-MODU-en-ne

i PPC) for hver MP inneholder de samme mirnas men ulike mRNA. To moduler av ulike politikere (for eksempel

p-MODU-en-ps Hotell og

p-MODU-2-ps

i PPC) består av ulike miRNAs og variert (eller delvis overlappende) mRNA settene. Innenfor en positiv eller negativ-tilkoblingsmodul (med «

-ps

» eller «

-ne

» forlengelse i IDer), korrelasjoner av de involverte mirnas og mRNA på uttrykket nivåer er gående positiv eller negativ. Uavhengig av tilkoblingstypen, mRNA som ligger i hver modul i stor grad etterligner en ko-uttrykt genklusteret. Foruten de fire modulene i de to parlamentsmedlemmer (

p-MODU-3-ps product: (

-ne

) og

m-MODU-4-ps product: (

-ne

)) hvor de fleste mirnas tilhører utleid-7 familien, moduler for MPC neppe overlapper med moduler for PPC i form av de involverte mirnas (tabell 1) og proteinkodende gener (Tabell S1). Avanserte innsikt om forskjellene mellom PPC og MPC kan videre utledes av en gransking av de biologiske konsekvensene av de identifiserte moduler.

Her må vi påpeke at de identifiserte modulene er ikke nødvendigvis de kanoniske regulatoriske moduler i hvilken alle forbindelser mellom mirnas og gener bestemmes av årsaks regulator-målet relasjoner [30]. Faktisk, på grunn av uløst problem i nøyaktig gjenkjenne miRNA målwebområder [2], er det vanskelig å identifisere en triviell og presis kanoniske reguleringsmodulen. Likevel, kan vi forvente å finne en mindre streng reguleringsmodul, kalt en «semi-kanoniske» reguleringsmodulen hinsidige, der forholdet potensielt bestemmes av miRNA-mediert mRNA nedverdigende mekanismen er dominerende blant de miRNA-mRNA-tilkoblinger. Basert på denne allment akseptert teori, semi-kanoniske reguleringsmoduler, hvis det finnes, bør være blant de negative forbindelsesmoduler, og deretter kan bestemmes ved målstedet berikelse analyse. Vi gjorde dette leting ved å etablere miRNA-mRNA sekvens affinitet matrise og gjennomføre Fishers eksakte test (se metode avsnitt). Som et resultat, fant vi at

p-MODU-5-ne

, en modul identifisert for PPC, var den eneste semi-kanoniske modul hvor 3’UTR sekvenser av de involverte 622 mRNA ble betydelig beriket (p 1.0e-4) med målstedet motiver av de 7 modulære mirnas (HSA-MIR-106b, -200c, -19b, -92a, -92b, -93 og -141) (figur 5). Denne modulen derfor representerer den viktigste forskjellen mellom PPC og MPC i form av de observerte miRNA-mRNA sammenhenger. Det tyder på at post-transkripsjonsregulering mediert av de dokumenterte kreft mirnas direkte bidra til uttrykket variasjon av proteinkodende gener på tvers av tumorprøver for PPC, men ikke for MPC.

Implikasjonene av de identifiserte moduler trenger for å bli ytterligere utledes gjennom de funksjonelle merknader av de modulære gener, siden det er en stor biomedisinsk interesse i å belyse forholdet mellom aktiviteten av modulære mirnas, som regulatorer eller biomarkører, og variasjonen av den spesifikke biologiske prosesser. Bruke David databasen [31], fant vi at over 330 GO vilkår og KEGG trasé, inkludert TGF-beta signalveien, var overrepresentert (BH adj.p 0,05) med 622 gener i den semi-kanoniske modul

p-MODU-5-ne

. Genene innenfor andre individuelle moduler også demonstrert betydelig funksjonell likheten. For eksempel

m-MODU-4-ne

, en negativ-tilkoblingsmodul oppdaget for MPC, ble beriket med genene i GO: 0007186~G-protein kombinert protein signalveien (BH adj.p = 1.14E-40). Tabell S2 oppsummert de funksjonelle berikelse analyseresultatene av modulære gener.

Vi undersøkte også forskjellene mellom disse to prostatakreft subtyper ved å studere fordelingsprofilen av KEGG trasé over-representert i den enkelte modul genet sett. Som vist i figur 6, modul

p-MODU-4-ps

for PPC er unik blant de identifiserte modulene om funksjonene til de modulære gener. Om to dusin av trasé, slik som type I diabetes mellitus, er overrepresentert i sin gen liste og de fleste av dem er relatert til sykdomsprosess og /eller immunrespons. Tre mirnas (HSA-MIR-146a, -150 og -223) er inkludert i denne modulen. Involvering av MIR-146a i immunresponsen har vært mye undersøkt. [32] har vist at MIR-146a er en modulator av IL-2 og aktivisering-indusert celledød av lymfocytter. [33] rapporterte at det formidler en inflammatorisk krets ved Alzheimers sykdom og stresset menneskelige hjerneceller. En annen studie [34] viste også at HSV-1-infeksjon i menneskets hjerne celle kan indusere ekspresjon av MIR-146a. Angivelig disse funnene ikke bare tyder på at Mir-146a tar en funksjonell rolle i immunresponsen som en regulerende faktor, men også foreslå at det dynamiske aktivitet (uttrykk), i enkelte sammenhenger kan bare tjene som passasjer av sykdom og /eller immunprosessene [10]. Dette er nøyaktig det viktigste budskapet formidles av modulen

p-MODU-4-ps

hvor de positive sammenhenger mellom de modulære mirnas og gener ikke kan bare forklares med en regulator-target mekanisme.

olfactory reseptorer (ORS) uttrykkes ikke bare i de sensoriske nerveceller i det olfaktoriske epitel, men også i forskjellige andre vev hvor deres potensielle funksjoner er stort sett ukjent. I en nylig publikasjon, forfatterne rapporterte at aktivering av en olfaktorisk reseptor (PSGR) inhiberer proliferasjon av prostata kreftceller [35]. Resultatene fra vår analyse viser at lukte transduksjon (sti) er overrepresentert i genet listen over 4 store moduler (

m-MODU-to-ne

,

m-MODU-3-ne

,

m-MODU-4-ne

,

m-MODU-5-ne

) i MPC (figur 6). De involverte mirnas inkluderer HSA-MIR-200A /-200b, HSA-MIR-15a /26a /29c, HSA-MIR-7a /-7e /-7F /-98, og HSA-MIR-107 /-26b. Selv om miRNA satt i

p-MODU-3-ps (-ne)

stor grad overlappet med det i

m-MODU-4-ne

, ingen modul i PPC har en funksjonell sammenheng med lukteledning. Derfor spekulere vi at aktiveringen av PSGR og (direkte eller indirekte) forbindelse med mirnas er bare begrenset til MPC.

fokal adhesjon kinase (FAK) er en viktig mediator for vekst-faktor-signalisering, celleproliferasjon , celleoverlevelse og cellemigrasjon. Musemodeller har vist at FAK uttrykk økes i humane tumorer [36]. En fersk studie viste at brennvidde heft styrer prostatakreft progresjon [37]. I denne studien fant vi at mirnas blande seg inn i transduksjon av FAK signalering, og dermed kan ta roller i kreftutvikling. Som vist i figur 6, er fokal adhesjon (sammen med 6 relaterte KEGG reaksjonsveier slik som ECM-reseptor-interaksjon) over representert i genet listene 3 store moduler som er identifisert for PPC (

p-MODU-1-ps

,

p-MODU-2-ps

,

p-MODU-5-ne

). Motsatt til tilfeller av lukte transduksjon for MPC, synes sammenslutning av ved en hierarkisk clustering algoritmen FAK signaliserer med mirnas begrenset til PPC. Disse funnene indikerer en annen stor forskjell mellom de to kreft subtyper. Eksperimentell undersøkelse på dette problemet kan være lovende for diagnostisering av prostatakreft.

potensiell forstyrrelse av miRNAs i TGF-beta signalveien

transformerende vekstfaktor-beta (

TGF

beta

) opprettholder vev homeostase og spiller en avgjørende rolle i bekjempelse av spredning av kreftceller [23], [38]. Som nevnt ovenfor, er TGF-beta signalveien er over representert i genet (mRNA) sett av den semi-kanoniske regulerende modul,

p-MODU-5-ne

. Av de 622 modulære gener, et dusin av dem koder for proteiner i veien. Disse 12 gener viser 56 negative-forbindelser med de 7 modulære mirnas, og nesten en tredjedel av tilkoblingene er kompatible med de potensielle regulator-target relasjoner bestemmes av sekvensen affinitet informasjon (figur 7). Basert på dette funnet, og teoriene som er beskrevet i [23] (sidene 198-224), vi generert en hypotetisk modell (Figur 8) for å vise forstyrrelser av de modulære mirnas med TGF-beta signalering og spredning av kreftceller. I figur 8, er genene negativt korrelert med mirnas i den modulære nettverk uthevet i rødt. Gene CDKN1A er også merket med rødt på grunn av sin betydelige negative korrelasjoner (p 0,001) med HSA-MIR-93, -106b og -200c på uttrykket nivå. Gener E2F5, CMYC (MYC) og CDK4 viser en tilsynelatende mønster av positive transkripsjons korrelasjoner med modulære mirnas og er merket med gult. Forholdene er presentert i figur 8 antyder at de modulære mirnas forstyrre sykdomsprosessen av det primære prostatakreft av et oncogent mekanisme i de målte PPC prøvene. Mer spesifikt, ekspresjon av disse mirnas omvendt regulerer transkripsjon intensiteten av to GF-beta-gener, TGFBR1 og TGFBR2, og en cancersuppresjon gen SMAD3. Deretter gjennom aktivering eller inaktivering av Smad2-3 /Smad4 /E2F-komplekset, er denne effekten speiles på uttrykket nivåer av CDKN1A og CMYC, og til slutt påvirker cellesyklus arrest og celleproliferasjon hemming.

Expression variasjon av miRNAs i modul

p-MODU-5-ne

Som omtalt ovenfor, i

p-MODU-5-ne

, de identifiserte mirnas direkte regulere transkripsjon intensiteter av modulære mRNA i PPC prøver. I denne forbindelse er det viktig å belyse etiologien av biologiske variasjoner (på tvers av tumorprøver) av miRNA ekspresjonsnivåene som bestemmer miRNA-mRNA-forbindelser. Først, vi bemerket at de fleste av de identifiserte miRNAs, inkludert HSA-MIR-19b, -92a, -93 og -106b, har blitt rapportert som mål for de transkripsjonsfaktorer av E2F familien [13], [39]. I mellomtiden har vi også observert de positive forbindelser mellom disse mirnas og E2F5 ved uttrykket nivåer (figur 8 og 9). Derfor var det en mulighet for at den biologiske variasjonen i mirnas var på grunn av reguleringen av E2F5. Imidlertid må en slik mekanisme for å bli undersøkt videre, siden selve bildet av regulering og /eller mutasjon av TF-genet i seg selv er fortsatt ikke klart. Deretter spurte vi om de modulære miRNA uttrykket nivåer var knyttet til utviklingen av prostatakreft. For å undersøke dette problemet, gruppert vi de 98 PPC prøvene på uttrykket nivåer av de 7 modulære mirnas av en hierarkisk clustering algoritmen og sammenlignet resultatet med Gleason score-baserte klasser. Ingen sammenheng ble funnet mellom de to partisjoner. Til slutt har vi foreslått og testet en hypotese om at den biologiske variasjonen i mirnas ble hentet fra reguleringen av protein-kodende gener (inkludert kreft gener) av hvilke mutasjoner sporadisk forekommet i de enkelte tumorprøver. Ved gruppering analyse, vi først genererte to skillevegger av de 98 PPC prøver, henholdsvis basert på uttrykket nivåer av alle de 7 modul mirnas og transkripsjonsintensitetene av 34 mulige kreftfrem drivende gener i tumorprøver som er vist i figuren-en av [12]. Så etter en Chi-kvadrat test, har vi funnet sammenheng mellom de to partisjoner var ekstremt signifikant (p 0,001)., Noe som indikerer vår hypotese kan bekreftes på denne måten

Materialer og metoder

datasett

microarray data ble publisert i Gene Expression Omnibus (GEO, en MIAME kompatibel database) depotet med tiltredelse antall GSE21032 [12], [40]. Blant de 218 biologiske prøver som inngår i super-serien, 98 primærsvulster, 13 metastatiske svulster og 28 prøver normal prostata vev (N = 139) har både miRNA og mRNA uttrykk profiler. Strenge kriterier er lagt til grunn ved valg av svulster for genomisk analyse [12]. De genet (mRNA) uttrykk profiler ble målt med Affymetrix Menneskelig Exon 1,0 ST Array [probe sett (ekson) versjon], og bildene ble kvantifisert ved bruk av Genechip Operating programvare (GCOS) versjon 1.4. Rådata ble behandlet av Aroma Affymetrix. Standarden RMA bakgrunn justering og quantile normalisering ble utført. De miRNA uttrykk ble målt på plattformen Agilent-019118 Menneskelig miRNA microarray 2,0 G4470B, og bildene ble kvantifisert ved hjelp av Agilent Feature Extraction versjon 9.5. Dataene ble normalisert med mellom-matrise varians stabilisering normalisering (VSN) etter eksklusive microRNAs ikke til stede i over 80% av de profilerte prøvene. I denne studien ble det mRNA data (den nedla Series Matrix fil) ytterligere forenklet ved å følge prosedyren. Først tilpasset vi genuttrykket verdier som opprinnelig sentrert på Affymatrix_Exon_Gene_IDs (Affy_IDs) til de offisielle genet symboler ved å beregne middelverdien for et gen med to eller flere Affy_IDs. For det andre ble tilpasset genekspresjon verdier forvandlet til log2 skala. Til slutt, vi filtrert ut de genene som mangler uttrykk variasjon over 139 arrays. Med en cutoff av en to-gangers forandring fra den maksimale uttrykket intensitet til et minimum en, ~ 5730 gener passert filteret. Derfor inneholder de endelige miRNA datasett 5730 gener og 377 miRNAs. Selv om informasjonen fra de 28 normale vevsprøver ble vurdert i data preprosessering å fortynne potensielle støy i microarray eksperimenter, vi fokusert på PPC og MPC prøver i følgende SVD analyse og miRNA-mRNA-modulen identifikasjon.

Beregning av miRNA-mRNA korrelasjonsmatrisen

Vi brukte en beregningskrevende metode for å beregne uttrykket sammenheng mellom en miRNA og en mRNA. Beregningen av Pearson korrelasjon ble gjentatt 1000 ganger. I hvert løp, ble 80% av de tilfeldig utvalgte PPC eller MPC prøver involvert. Den endelige beregningen ble oppnådd ved gjennomsnitt resultatene over 1000 kjøringer.

Generering av miRNA-mRNA Korrelasjons Networks

Vi henholdsvis generert to miRNA-mRNA korrelasjons nettverk, PN og MN, for PPC og MPC av discretizing uttrykket korrelasjonsmatrisen med 5730 gener (mRNA) som rader og 377 mirnas som kolonner. Mer spesifikt, vi fylt i begge matriser med en for den øverste 1% av de positive miRNA-mRNA sammenhenger, -1 for de øverste 1% av de negative sammenhenger, og 0 for resten av oppføringene. Således representerer en ikke-null element en positiv eller negativ korrelasjon for et par av miRNA og mRNA. En korrelasjon er definert på en slik måte tilsvarer en miRNA-mRNA forbindelse med BH justert p-verdi 0,008 (eller 0,065) for PPC (eller MPC)

Identifikasjon av miRNA-mRNA moduler

Begge diskretisert korrelasjonsmatrisen ble kondensert ved å ekskludere den mirnas mangel av innspilte relasjoner med kreft, og genene til noen forbindelse med kreftrelaterte miRNAs. Det vil si at kolonnene tilsvarer de mirnas ikke er inkludert i dokumentlisten i [7] ble først fjernet, og deretter p (gener) som ikke inneholder minst to ikke-null oppføringer ble ekskludert. Det kondenserte PN og MN inneholder derfor 58 kolonner og 1792 og 1340 rader, henholdsvis. Med den raffinerte nettverks matriser som innganger, to heatmaps generert henholdsvis for PPC og MPC ved å bruke funksjonen «

heatmap.2

» i R pakke «gplots». Utformingen av miRNAs og mRNA i heatmaps var basert på en to-veis hierarkisk clustering analyse med

Manhattan

avstand og

Ward

metode som argumenter. Tar PPC som et eksempel (figur 3), identifiserte vi miRNA-mRNA-moduler via de følgende tre trinn. (1) Basert på dendrogram og miRNA-mRNA-tilkobling mønstre som vises på heatmap, fem modulære miRNA undergrupper (klynger) var visuelt bestemt. (2) For hver av miRNA undergrupper, positive eller negative forbindelser med mRNA ble samlet inn i et par av to-kolonne topologi matriser, respektivt. (3) En miRNA-mRNA-modulen paret ble identifisert fra utgangene fra trinn (2) etter å slippe mRNAer med bare en (positiv eller negativ) forbindelse. Tall for de modulære nettverk ble produsert av Cytoscape 2.8.1 [41].

Target Side Enrichment Test

Ved hjelp av en lab-eide R program med kjernen blir

matchPattern

() -funksjonen i Bioconductor

Biostrings product: [42], [43], identifiserte vi de syv-mer og 8-mer miRNA mål språk motiver på de 3 «UTR sekvenser (hentet fra hg-18) av genene målt i de anvendte microarray data. Den binære miRNA-mRNA-sekvensen affinitetsmatriks (A) ble deretter generert på en måte slik at et element (A

ij) av verdi 1 indikerte eksistensen av målstedet motiv (e) for j

th miRNA i 3′-UTR-sekvens i i

th mRNA. For en miRNA, ble den statistiske signifikans av målstedet anrikning nivå i listen over de korrelerte modulære genene målt ved Fishers eksakte test i referanse til nivået av hele genet settet.

Hjelpemiddel Informasjon

Tabell S1.

oppsummering av miRNA-mRNA korrelasjon-nettverksmoduler.

doi: 10,1371 /journal.pone.0040130.s001 plakater (TXT)

Tabell S2.

Legg att eit svar