PLoS ONE: MiRComb: En R Package å analysere miRNA-mRNA interaksjoner. Eksempler på fem Digestive Kreft

Abstract

microRNAs (mirnas) er små RNA som regulerer uttrykket av målet mRNA ved spesifikk binding på mRNA 3’UTR og fremme mRNA degradering i de fleste tilfeller. Det er ofte av interesse å vite de spesifikke mål for en miRNA for å studere dem i en bestemt sykdom sammenheng. I den forstand har noen databaser er designet for å forutsi potensielle miRNA-mRNA interaksjoner basert på hybridisering sekvenser. Imidlertid er en av de viktigste begrensningene som disse databasene har for mange falske positiver, og tar ikke hensyn til sykdomsspesifikke interaksjoner. Vi har utviklet en R pakke (miRComb) i stand til å kombinere miRNA og mRNA-ekspresjon data med hybridisering informasjon, for å finne potensielle miRNA-mRNA mål som er mer pålitelig å skje i en bestemt fysiologisk eller sykdoms sammenheng. Denne artikkelen oppsummerer rørledningen og hoved utgangene fra denne pakken ved å bruke som eksempel TCGA data fra fem gastrointestinal kreft (tykktarmskreft, endetarmskreft, leverkreft, magekreft og spiserørskreft). De oppnådde resultatene kan brukes for å utvikle et stort antall av testbare hypoteser av andre forfattere. Globalt, viser vi at miRComb pakken er et nyttig verktøy for å håndtere miRNA og mRNA uttrykk data, som bidrar til å filtrere det høye antallet miRNA-mRNA interaksjoner hentet fra pre-eksisterende miRNA mål prediksjon databaser og den presenterer resultatene i en standardisert måte (pdf-rapporten). Dessuten er en integrerende analyse av miRComb miRNA-mRNA interaksjoner fra de fem fordøyelses kreft presentert. Derfor er miRComb et svært nyttig verktøy for å begynne å forstå miRNA genregulering i en bestemt sammenheng. Pakken kan lastes ned i https://mircomb.sourceforge.net

Citation. Vila-Casadesus M, Gironella M, Lozano JJ (2016) MiRComb: En R Package å analysere miRNA-mRNA interaksjoner. Eksempler på fem Digestive kreft. PLoS ONE 11 (3): e0151127. doi: 10,1371 /journal.pone.0151127

Redaktør: Moray Campbell, Roswell Park Cancer Institute, USA

mottatt: 15 oktober 2015; Godkjent: 24 februar 2016; Publisert: 11 mars 2016

Copyright: © 2016 Vila-Casadesus et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet:. All relevant data er i avisen og dens saksdokumenter filer

Finansiering:. den nåværende arbeidet ble støttet med tilskudd fra Instituto de Salud Carlos III (PI13 /02192, delfinansiert av FEDER-EU) og fra Fundación Científica de la Asociación Española contra el kreft (GCB13131592CAST) til MG. CIBEREHD er finansiert av Instituto de Salud Carlos III. MVC er finansiert av Ministerio de Educación Cultura y Deporte (FPU12 /05138). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Forkortelser : BH, Benjamini Hochberg; Coad, colon adenokarsinom; ESCA, esophageal carcinoma; FDR, False funnrate; H, sunt; LIHC, lever leverkreft; Mirna, mikroRNA; MRNA, messenger RNA; QRT-PCR, kvantitativ revers transkripsjon PCR; NGS, Next-Generation Sequencing; LES, endetarm adenokarsinom; STAD, mage adenokarsinom; TCGA, The Cancer Genome Atlas

Innledning

microRNAs (mirnas) er ikke-koding, enkelt-strandet RNA av 18-25 nukleotider og utgjør en ny klasse av genet regulatorer som finnes i både planter og dyr. De negativt regulere sine mål (messenger RNA -mRNAs-) på en av to måter, avhengig av graden av komplementaritet mellom miRNA og målet. En måte å handling (som står for rundt 80% av tilfellene) er fremme mRNA degradering [1], er den andre en hemme mRNA oversettelse.

Tidligere forfattere har brukt sammen miRNA og mRNA-data for å forutsi miRNA mål i bestemte sykdommer. De baserer sin analyse på korrelere miRNA og mRNA uttrykk, og kryssende det med kjente databaser [2,3]. Men selv om disse studiene er nyttige, er det ingen programvare tilgjengelig for å reprodusere resultatene. R [4] er et programvaremiljø for statistisk databehandling og grafikk. Det har blitt mye brukt i det vitenskapelige miljøet på grunn av det faktum som fungerer med hvilken som helst plattform, er gratis, kan bygge dine egne pakker og funksjoner, og dele den med andre forskere, er det godt dokumentert og holdes oppdatert. Bioconductor [5] er en R-pakke depot fokusert på pakker som mål å analysere biologiske data. Det er noen R /Bioconductor pakker som er i stand til å gjøre miRNA-mRNA korrelasjoner, skjærer med kjente databaser og analysere nettverk, blant andre funksjoner, som for eksempel

RmiR

,

Corna

,

miRNApath

,

mikroRNA

,

MultiMiR product: [6,7]. Imidlertid har ingen av disse fremgangsmåter gjør det mulig å utføre en hel fullstendig analyse på en enkel måte. Vårt mål var å designe en R-pakke, kalt miRComb, kunne kombinere miRNA og mRNA uttrykk data (fra en hvilken som helst format) med hybridisering informasjon, for å finne potensielle miRNA-mRNA mål som sannsynligvis vil oppstå i en bestemt fysiologisk eller sykdom sammenheng . Dette genererer en liste med resultater som kan være grunnlag for å utvikle flere hypoteser som skal eksperimentelt testet i en våt lab. En annen merverdi er å presentere resultatene av analysen i en standardisert måte med en pdf-rapporten.

Vi har brukt som eksempler offentlig tilgjengelige data fra Kreft Genome Atlas (TCGA) [8] for ulike fordøyelses kreft. Resultatene fremheve potensielle miRNA-mRNA interactomes av fem fordøyelses kreft og gi en objektiv vurdering av miRComb funksjoner. Så vidt vi vet, er det fortsatt ingen global analyse av denne typen i gastrointestinal kreft.

Materialer og metoder

Vi har brukt TCGA data fra 1645 prøver blant 5 forskjellige fordøyelses kreft (kreft i tykktarmen , endetarmskreft, leverkreft, magekreft og spiserørskreft) som hadde samtidig miRNA-seq og RNA-seq data. Alle data er blitt behandlet med samme prosedyre

Som utgangspunkt for vår pakke brukte vi tre vidt benyttede forutsetninger.

miRNA negativt regulere uttrykk for sine mRNA mål. > Mirna /mRNA interaksjoner, som de er basert på RNA hybridisering, kan forutsies med bionformatic tilnærminger.

mirnas og mRNA som spiller en rolle i en bestemt sykdom er deregulert i denne sykdommen.

figur 1 viser omrisset av den fremgangsmåte som anvendes. Rå data behandles med sikte på å finne relevante miRNA-mRNA interaksjoner i et bestemt biologisk sammenheng for å kunne tolke dem. Pakken er skrevet i R og inkluderer noen kode C ++ for å øke hastigheten på noen beregninger. Latex [9] og Sweave [10] pakkene blir brukt til å generere den endelige pdf rapporten. MiRComb er tilgjengelig på https://mircomb.sourceforge.net/.

Mirna og mRNA uttrykk data kan komme fra ulike kilder (mikromatriser, NGS, QRT-PCR …). Pakken forutsetter at miRNA og mRNA data er riktig normalisert. I tilfelle av QRT-PCR data vi foreslå å bruke -dCt heter (eller CT enheter), for microarrays foreslår vi at du bruker log2 (normalisert) intensitet, og for NGS foreslår vi at du bruker log2 (normalisert) teller.

Data kilder

data ble lastet ned fra TCGA data portal (https://tcga-data.nci.nih.gov/tcga/dataAccessMatrix.htm). Vi valgt ut følgende kreftformer å studere: Colon adenokarsinom (coad); Esophageal carcinoma (ESCA); Leveren leverkreft (LIHC); Rektum adenokarsinom (LES); Magen adenokarsinom (STAD).

Vi valgte bare de prøvene som hadde paret miRNA og mRNA informasjon og kom fra sentre (riktig identifisert med sin tilsvarende Tissue Kilde nettsteder-TSS- koder) som samlet inn mer enn én prøve. Primær solid Tumor og Solid vev Normal ble brukt. Mirnas uten id (på mirbase17) eller median uttrykk 10 rå tellinger ble fjernet. MRNA uten genet id eller median uttrykk 10 rå tellinger ble fjernet. Voom transformasjon [11] og quantile normalisering ble brukt, og deretter batch korrigering med Combat [12] i henhold til TSS sentre ble brukt.

Differensial uttrykk analyse

Differensial uttrykk mellom saker og kontroller ble beregnet med limma-trend prosedyre. Pakken implementerer også T-test, Wilcoxon Test, LIMMA, LIMMA-trenden [11], og RankProd [13] for å teste forskjeller mellom begge gruppene. Imidlertid kan andre metoder for differensial uttrykk brukes og resultatene kan også importeres til

miRComb plakater (funksjonene som trengs er miRNA eller mRNA, logratio, mener uttrykk,

p

verdi og justert

p

verdi). Flere testprosedyrer kan være: Benjamini Hochberg (BH), Bonferroni eller andre (selv om RankProd foruts bare BH (som styrer False Discovery Rate (FDR)).

For para nærmer seg, er hypotesen om at uttrykket av kontrollgruppe prøver de (H) er forskjellig fra bety uttrykk for kreftrelaterte gruppeprøver. i tilfelle av ikke-parametriske metoder-Wilcoxon test og RankProd-, median (i stedet for gjennomsnittet) blir testet.

korrelasjonsanalyse

Vi beregnet Pearson korrelasjonskoeffisienter for alle miRNA-mRNA par tilgjengelig i hvert kreft. pakken støtter også Spearman og Kendall korrelasjon (Kendall bare for små datasett). Pearson korrelasjon er egnet dersom begge miRNA og mRNA data kommer fra samme kan antas plattform analyse (både mikromatriser eller log2-normalisert telledata, for eksempel), og en lineær sammenheng mellom miRNA og mRNA. Hvis begge analyseplattformer er annerledes eller hypoteser av en lineær relasjon kan ikke legges til grunn, da Spearman (eller Kendall ) korrelasjon er ønskelig. Hvis det er en negativ sammenheng mellom miRNA (X

1, …, X

n) og mRNA (Y

1, …, Y

n) korrelasjonskoeffisienten vil være negativ, så:

Hvor ∈ {

Pearson

,

Kendall

,

Spearman

}. Deretter multippel testing korreksjon (Bonferroni og BH er tilgjengelig, blant andre alternativer) brukes for å kontrollere falske positiver som kan oppstå.

Veikryss med miRNA mål prediksjon databaser

Neste trinn ble å matche signifikante sammenhenger med target informasjon. Valget av en database er en vanskelig sak. Flere databaser som mål å beregnings forutsi miRNA mål [14]. De hovedsakelig ta hensyn til minst ett av disse parametrene: frø komplementaritet, miRNA-mRNA kompleks stabilitet (termodynamikk) og nettstedet bevaring inter-arter. Flere databaser begynne å integrere miRNA-mRNA korrelasjon som en prediktiv verdi, men det har blitt gjort i noen datasett (GenMiR ++) [15].

Vi valgte mikrokosmos [16,17] og TargetScan [18]. Mikrokosmos omfatter 690 ulike miRNA og 22107 forskjellige mål, med totalt 563179 interaksjoner beskrevet. Mikrokosmos beregner målene med Miranda algoritme, trenger perfekt komplementaritet ved 5 «; Da utelukker ikke-stabile konformasjoner ved hjelp av Wien RNA folding tilnærming [19] og krever nettstedet bevaring tvers flere arter. På den annen side, er TargetScan [18] trolig en av de mest oppdaterte. Den inneholder informasjon om 1537 forskjellige mirnas og 15031 mål, med totalt 520354 interaksjoner beskrevet. Den er basert på frø komplementaritet og skiller mellom konserverte og ikke-konserverte områder. For å gjøre det mer sammenlign mikrokosmos, og mer fornuftig, valgte vi bare konserverte områder. Pakken gjør det mulig å bruke en eller begge databasene (og også bruke tilpassede databaser, om ønskelig), og fikse et minimum antall opptredener på databasen. De endelige betingelsene som definerer en miRNA-mRNA samhandling er:

Funksjonsanalyse

Selv om hovedformålet med pakken er å generere en liste over potensielle miRNA-mRNA-parene,

miRComb

implementerer også noen funksjoner som kan bidra til tolking. Blant andre funksjoner som er angitt i følgende punkter, tabeller og barplots med antall mål eller antall miRNAs kan skaffes. Pakken plotter et nettverk med de ønskede miRNA-mRNA interaksjoner (noder som representerer mirnas og mRNA, og piler markerer interaksjoner). Farger er nøye utvalgt for å hjelpe tolkning: mirnas er representert som firkanter, mRNA som sirkler. Videre er fargen på noden reflekterer FoldChange retning av knutepunktet (red: oppregulert, grønn: downregulated). En score beregnes med sikte på å gjenspeile virkningen av miRNA på kreft (høyere score betyr at både miRNA og mRNA er høyt deregulert i at sykdom)

Piler er også informativ. Fargen representerer

scorer

av samspillet (rød betyr motsatt og sterk motsetning FC mellom miRNA og mRNA, mens grønn ville representere sterk konkordant FC mellom miRNA og mRNA), og bredden representerer antall databaser hvor målet har blitt funnet (flere databaser: bredere pil). Nettverket kan også enkelt eksporteres til cytoscape i «SIF» format [20], samt node og kant attributter.

GOstats

pakke [21] ble brukt til å beregne om noen funksjon er assosiert med målene for en bestemt miRNA eller et sett av miRNAs. Dette bidrar til å forutsi funksjonen av en miRNA eller et sett av mirnas hvis antallet mål er stor nok.

RamiGO

R pakke [22] kan også brukes til å plotte de betydelige GO vilkår og deres relasjoner.

Circlize

pakke [23] brukes til å lage en circos tomt av de utvalgte miRNA-mRNA par. Starter fra grensen av tomten, er plasseringen av mRNA representert på første spor, deretter en andre spor representerer mirnas posisjon, og til slutt en siste spor (med lenker) viser miRNA-mRNA par. Dette vil bidra til å identifisere om noen miRNA mål er mer spesifikt ligger i et kromosom eller region.

Rapport generasjon

Et av målene med prosjektet er å presentere en standardisert måte å presentere resultatene . På slutten av analysen er mulig å generere en pdf rapport som omfatter alle de nevnte seksjonene.

Diskusjon

MiRComb analyse av miRNA-mRNA interaksjoner av 5 ulike fordøyelses kreft

Resultater og

Fem miRComb rapporter for coad, LES, ESCA, STAD og LIHC ble generert og de tilsvarende pdf-filer kan bli funnet i S1-S5 filer, henholdsvis. Som et eksempel viser figur 2 hovedtallene fra LIHC rapporten.

A) Hovedkomponentene analyse (PCA) (basert på korrelasjonsmatrise) av miRNA prøver. B) vulkan plott som viser mirnas i henhold til sine logratio mellom kreft og kontroll. C) Heatmap av de 50 mest deregulerte mirnas henhold til sin FDR. D) Tetthet plott av Pearson korrelasjonskoeffisienter på alle mulige miRNA-mRNA interaksjoner. Linjene viser forskjellig cutoff: p-verdi 0,05, p-verdi 0,01, FDR 0,05 og FDR 0,01. E) Korrelasjon av MIR-139-5p og CCNB1 som et eksempel. F) Venn-diagram som viser det totale antall sigifnicant korrelasjoner (FDR 0,05), det totale antall antatte interaksjoner i det minste en database (TargetScan eller mikrokosmos), og skjæringspunktet av begge. G) Nettverks av utvalgte interaksjoner. Hver miRNA-mRNA interaksjon er negativt korrelert (FDR 10-33) og spådde i det minste i en database (Targetscan eller mikrokosmos). Sirkler representerer mirnas og torg mRNA; rødt fyll betyr oppregulert miRNA /mRNA, mens grønn fill betyr downregulated miRNA /mRNA; linjer indikerer miRNA-mRNA par; rød linje betyr positiv score og grønn linje betyr negativ poengsum; pil bredden er proporsjonal med antall opptredener på databasene (TargetScan eller mikrokosmos). H) Pie diagram som viser antall mRNA regulert av 0, 1, 2, 3, 4, 5, og 5 miRNAs. I) Barplot viser antall mål per miRNA og andelen av mRNA som er kumulativt reguleres av miRNAs. J) Circos tomt på de beste 45 miRNA-mRNA interaksjoner sortert etter FDR, betyr en linje en miRNA-mRNA par. Blå linjer er posisjonen til de mirnas og appelsin linjer er posisjonen av mRNA.

Oppsummering av datasett blandingen.

Tabell 1 viser antall prøver tilgjengelige for hver kreft og det totale antall signifikante korrelasjoner. Coad, LIHC og STAD kreft hadde mer enn 400 prøver tilgjengelig for analyse, mens ESCA kreft og LES kreft datasett hadde 191 og 160 prøver, henholdsvis. Videre er forholdet mellom saker og kontroller også et begrep for å ta hensyn til. Mens ESCA, LIHC og STAD kastes en «rimelig» mengde kontroller (ca 01:13 for ESCA, 1: 7 for LIHC og 1:10 for STAD), i coad og LIHC kastes vi på bare 8 og 3 kontroller henholdsvis ( et forhold på 1:50 aproximately). Antallet tilgjengelige prøvene påvirker antall korrelasjoner med FDR 0,05 funnet: jo flere prøver vi har, jo større er kraften for å detektere korrelasjoner forskjellig fra 0. antall signifikante korrelasjoner funnet er høyere enn 15% (selv etter korrigering FDR) i datasettene med mer enn 400 prøver (STAD, LIHC, coad), mens denne andelen ikke nå 10% i tilfeller av LES og Esca (mindre enn 200 prøver tilgjengelig). Kort sagt, virker det som et datasett med en større utvalgsstørrelse og et balansert design skal gi et større antall sammenhenger som en som er mindre og ikke balansert.

Selv om 20.531 mRNA og 1025 miRNAs ble sekvensert , bare rundt 32-34% av mirnas ble vurdert uttrykt (mediane 10 i alle eksempler) i hvert kreft datasettet. I motsetning til dette, ble 70-90% av mRNA detektert med en median 10 teller. Generelt PCA analyse (side 1 og 2 av rapportene gjort av mkReport funksjon, for eksempel S1-S5 Files) av prøvene viste en veldig liten kontroll clusterization (med unntak av miRNA datasett i coad, LES og i begge datasettene i LIHC) . Samlet fører dette til ideen om at den største ulempen med datasettet er mangelen på et rimelig antall kontroller, forsterkende tanker som differensial uttrykk mellom de to gruppene kan beregnes og brukes som informativ artikkel, men ikke som en filtrering trinn (som kan føre til svikt i den forstand av falske negative).

Volcano plott (side 3 og 4 av rapportene eller figur 2B) høydepunkt i rødt de valgte mirnas og mRNA. Heatmaps er også plottet (side 3 og 4 av rapportene). Heatmap av LIHC som et eksempel er også vist i figur 2C.

Analyse av miRNA-mRNA interaksjoner.

Side 5 av pdf rapporter viser sammendrag av de beregnede sammenhenger. Det neste trinnet er å krysse de signifikante sammenhenger med spådd miRNA-mRNA potensielle interaksjoner fra Microcosm eller TargetScan prediksjon databaser (side 6 og 7 av rapportene). For tilfelle av LIHC (figur 2F), observerte vi at det forutsagte antall miRNA-mRNA-interaksjoner ble redusert 258233 til 57675, derfor, kunne vi regner med at ca 80% av den opprinnelige miRNA-mRNA forutsagt interaksjoner fra databaser var falske positiver for denne sykdommen fordi de ikke viser en negativ sammenheng mellom spesifikke miRNA og den spesifikke mRNA uttrykket

in vivo

i vevet.

Videre viser figur 3 at vi også kan skildre andelen av falske positive spådd målene for hver miRNA fra databaser i en gitt situasjon. Når det gjelder LIHC, antallet av falske postives varierer fra 22% til 99%. I tilfelle av MIR-122, MIR-122 * eller MIR-378c disse prosentandelene er ganske lav i forhold til de andre (22%, 27% og 24% henholdsvis), derfor disse mirnas viser en høy andel av spådd mål bekreftet av miRComb . Interessant er MIR-122 den hyppigste miRNA i voksen lever, og spiller en sentral rolle i leveren biologi og hepatokarsinom sykdom [24].

Plot viser prosenter av negativt korrelert spådd mål i forhold til alle spådd mål i henhold til databasene for hver miRNA. Intensiteten av den grå fargepunkt er relatert til den prosentandel av falske postive miRNA-mRNA forutsagt interaksjoner. I parentes, de eksakte prosenter av falske positivesfrom valgt mirnas (MIR-122, MIR-122 *, MIR-378c).

Side 6 av pdf-rapporten viser de 15 miRNA-mRNA interaksjoner ( sortert etter justert p-verdi, tatt i betraktning at de må ha blitt spådd i minst en database) i hvert kreft. Side 9 av pdf-rapporten viser nettverket av alle miRNA-mRNA interaksjoner. Alle interaksjoner er plottet som standard, og dette kan resultere i en meget tett figur vanskelig å tolke, da det er tilfelle i våre eksempler. For tilfelle av alle interaksjoner av LIHC (S5 File side 9) kan vi se to hovedmønstre: Til venstre vi kan finne det meste downregulated mirnas i LIHC (plottet som grønne sirkler) sammen med sine korrespondent mRNA mål (plottet som røde firkanter ). På høyre er rollene snudd, og de dominerende miRNA-mRNA interaksjoner vist bestå på oppregulert mirnas med downregulated mRNA. Dette generelle mønsteret er gjengitt i alle de undersøkte kreft (S1-S5 filer). For å løse dette problemet, foreslår vi å tilpasse i hvert tilfelle antall interaksjoner som skal plottes avhengig av målet av figuren. I figur 2G har vi plottet en redusert mengde av interaksjoner og vi kan se noen av detaljene. For eksempel er to mål (DNMT3A og MYBL2) av HSA-MIR-29C (nederst til høyre) spådd av to databaser, mens målet FAM136A er spådd av bare én database (pilen er thiner). Videre, om målene for HSA-let7c er AURKB mer deregulert i LIHC enn NME6, og interaksjoner av HSA-MIR-122 eller HSA-MIR-122 * (øverst til venstre) har lavere score (lavere intensitet av pil farge ) enn interaksjoner av HSA-MIR-139-3p og HSA-MIR-139-5p (høyere intensitet av pil farge;. øverst til høyre)

i LIHC mer enn 75% av de uttrykte mRNA blir målrettet ved hjelp av minst en miRNA (fig 2H og 2I og side 10 i rapporten pdf), i COAD og STAD at antallet er mellom 70% og 60%, mens i LES og ESCA er mindre enn 50%. Men vi må ta hensyn til at disse prosentandelene er delvis påvirket av det totale antall miRNA-mRNA spådd interaksjoner: jo høyere antall interaksjoner, jo høyere antall mirnas per mRNA (og omvendt). For eksempel, er mer enn 25% av miRNAs i LIHC spådd å bli målrettet av mer enn fem miRNAs. Denne prosentandelen er lavere i de andre kreftformer, men det er fremdeles 8% i LES. Det er verdt å nevne at dette er en første tilnærming som vil kreve interaksjoner som skal eksperimentelt bekreftet i en våt lab. Denne uvanlige antall mirnas rettet mot samme mRNA kan tilskrives det faktum at miRComb ikke tar hensyn til konkurranseevnen mellom ulike mirnas hybridiserer til samme mål.

Side 11 av pdf-rapporten viser de første 20 mirnas sortert etter antall mål. Som et eksempel, har MIR-106a 766 interaksjoner spådd i coad har MIR-27a 450 interaksjoner i ESCA, har MIR-27b 792 interaksjoner i LIHC, har MIR-106a 582 interaksjoner i LES, og MIR-29a har 798 interaksjoner i STAD . Selv om mirnas forventes å regulere opp til hundrevis av gener, bør disse interaksjonene kan eksperimentelt valideres for å forkaste falske positive eller indirekte relasjoner, som nevnt ovenfor. Fargene i disse sidene viser retningen av miRNA deregulering (red: oppregulert, grønn: nedregulert). Mens i coad, lese og ESCA de beste mirnas er generelt oppregulert i LIHC og STAD de er hovedsakelig nedregulert. MRNA kan også være sortert etter antall mirnas som er målgruppe dem (side 12 i rapporten) og er også farget i henhold til retningen av deregulering. Total, mRNA ikke ha mer enn 50 mirnas regulerer dem. Unntaksvis i STAD er det noen mRNA med mer enn 60 mirnas (f.eks. 74 for FOXP2). Men det er verdt å ta hensyn til at det store flertallet av mRNA som er regulert av minst en miRNA, samtidig regulert av inntil 4 mirnas.

I generelle termer, hovedretningen av de beste mRNA (sortert etter antall miRNA rettet mot dem, rapport side 12) er den inverse av den viktigste retning av de beste mirnas (sortert etter antall mål, rapport side 11).

Funksjonell berikelse analyse av miRNAs i henhold til deres målene.

i sidene 13-15 i rapporten, kan vi finne Gene ontologi (GO) og KEGG funksjonell analyse av resultatene. Som et eksempel, testet vi hvis mRNA som er regulert av mirnas er anriket i noen av GO og KEGG kategorier. Resultater av denne delen er ganske lik mellom alle fordøyelses kreft datasett fordi de inneholder alle mRNA som er målrettet med minst en miRNA og det inkluderer mer enn 50% av de uttrykte mRNA i gjennomsnitt. Avhengig av målet med studien ulike filtre kan brukes (differensial uttrykt mirnas og /eller mRNA, mål fra en bestemt miRNA …) og da ville resultatet bli annerledes. I dette tilfellet, BP (biologisk prosess) overrepresentert når det gjelder inkluderer cellulære prosessen og andre regulerende og signalprosesser. CC (Cellular Component) overrepresentert når det gjelder det meste relatert til intracellulære-cytoplasma avdelinger. MF (Molecular Function) overrepresentert begrepene er sentrert i proteinbinding og andre bindende (enzym, anionbindende) handlinger. KEGG trasé er mer kortfattet og alle av dem inkluderer begrepet «Pathways i kreft». Coad også inkludert prostata kreft og kronisk myelogen leukemi og gliom, ESCA også småcellet lungekreft, LIHC inkludert prostatakreft, tykktarmskreft, kreft i bukspyttkjertelen, kronisk myelogen leukemi og nyrecellekarsinom; LES inkludert nyrecellekarsinom, STAD også inkludert småcellet lungekreft og prostatakreft. Dette tyder på at, som kjent mange kreftformer dele lignende mønster. Andre veier som deles på tvers av de ulike studerte datasettene er: Focal vedheft, Fc-gamma R-mediert fagocytose (coad, ESCA, STAD), eller TGF-beta signalveien (coad, LES)

Mer. målrettede resultater kan oppnås ved å teste for anriking målene for en bestemt miRNA. For eksempel, målene fra Mir-148a i leverkreft beriket i antigen prosessering og presentasjon KEGG Pathway (FDR = 0,006) (S1 fig). I en praktisk forstand betyr dette at denne veien er involvert i leverkreft gjennom en deregulering av MIR-148a, og at denne bane kan være, i det minste delvis, moduleres ved å modifisere MIR-148a uttrykk. Andre måter med leverkreft som kan bli modulert ved å endre miRNA uttrykket er RNA transport (FDR = 0,030), Cell syklus (FDR = 0,031) og Ubiquitin mediert proteolyse (FDR = 0,031) for Mir-424, eller lysin degradering (FDR = 0,006) for MIR-29c.

Integrative analyse av miRComb miRNA-mRNA interaksjoner fra de 5 fordøyelseskreftformer

Delt og spesifikke miRNA-mRNA interaksjoner.

figur 4 viser antall delte miRComb miRNA-mRNA par blant de 5 undersøkte fordøyelseskreft datasett. 1570 miRNA-mRNA-interaksjoner er felles for alle 5 sett, men en mer relevant tall er delt i minst to eller flere av dem, blir bare mindre enn 40% av miRNA-mRNA-par spesifikke for hvert kreft datasett. STAD er den med flere miRNA-mRNA interaksjoner funnet

Venn-diagram som viser miRComb miRNA-mRNA interaksjoner. (FDR 0,05 og spådde i minst en database) som er til stede i minst én kreft. 1570 miRNA-mRNA interaksjoner vises i de 5 undersøkte fordøyelses kreft.

I S2 Fig et nettverk representerer de 1570 vanligste miRNA-mRNA interaksjoner mellom de fem undersøkte nevnte datasett. Vi kan se to nettverk: det store nettverket til venstre inneholder stort sett downregulted mirnas med sine oppregulert mRNA mål (780 mirnas + mRNA og 1305 miRNA-mRNA par), mens mindre nettverk på høyre inneholder stort sett oppregulert mirnas og deres downregulated mRNA mål (173 mirnas + mRNA og 187 miRNA-mRNA par). Vi har oppdaget at mRNA som har KEGG vilkår knyttet til kreft, for eksempel Cell Cycle (rød), Pathways i Cancer (gul) og MAPK signale Patway (blå). Kombinasjoner av disse vilkårene er også vist i forskjellige farger. Nettverket til høyre inneholder noen mRNA knyttet til cellesyklus, mens den store til venstre er hovedsakelig relatert til MAPK Signale Pathway, Pathways i Cancer, eller begge vilkårene (grønn).

Den vanlige interaksjoner kan være relatert til veier som er felles for alle de undersøkte fordøyelses kreft. Imidlertid er det også interessant å studere interaksjoner som kan være spesifikke for hver av dem. I S1 tabell, er alle de spesifikke miRComb miRNA-mRNA-interaksjoner for hver kreftdatasettet vist (en spesifikk interaksjon er det en som har blitt funnet signifikant negativt korrelert i ett datasett, men ikke i de andre). Tabeller 2-6 viser de 10 beste mirnas med flere miRComb miRNA-mRNA spesifikke interaksjoner for hver kreft.

Target mRNA er sortert i henhold til sin negativ korrelasjon verdi (topp 20 er dislplayed).

Target mRNA er sortert i henhold til sin negativ korrelasjon verdi (topp 20 er dislplayed).

Target mRNA er sortert i henhold til sin negativ korrelasjon verdi (topp 20 er dislplayed).

Target mRNA er sortert i henhold til sin negativ korrelasjon verdi (topp 20 er dislplayed).

Target mRNA er sortert i henhold til sin negativ korrelasjon verdi (topp 20 er dislplayed).

figur 5 viser også antall spesifikke interaksjoner avhengig involvert i LIHC miRNAs. Mirnas på linje svarende til forholdet 1: 1 er de som er bare uttrykkes i leveren. De andre er uttrykt i minst en annen kreft, men de har noen spesifikke interaksjoner i LIHC, jo nærmere forholdet 1: 1 linje er, jo høyere spesifisitet

Antall totale miRNA mål i LIHC versus nummer. av miRNA mål til stede bare i LIHC men ikke i coad, ESCA, lese eller STAD. Størrelse av punktene er proporsjonal med den gjennomsnittlige miRNA uttrykket på LIHC prøver inkludert.

Cluster analyse av miRNA-mRNA interaksjoner.

På verdensbasis er det 106.426 miRNA-mRNA interaksjoner målt i alle kreft datasett, og betydelig negativt korrelert i det minste en av dem. For å klassifisere dem i lignende mønstre, søkte vi clustering metoder for å oppsummere de viktigste trendene. Vi brukte K-middel metode med 4 klynger som det ga en rimelig tolkning av resultatene (fig 6). Interessant, hierarkisk clustering av kreft i henhold til de gjennomsnittlige korrelasjonskoeffisienter av klyngene gir følgende resultat: STAD og ESCA først gruppert, samt LES og coad.

Legg att eit svar