PLoS ONE: Identifisere Kreft Spesifikke Funksjonelt Relevante mirnas fra Gene Expression og miRNA-til-Gene Networks Bruke regularisert Regresjon

Abstract

Identifisere mikroRNA signaturer for ulike typer og undertyper av kreft kan føre til forbedret deteksjon, karakterisering og forståelse av kreft og bevege oss mot mer personlige behandlingsstrategier. Men ved å bruke mikroRNA forskjells uttrykk (tumor mot normalt) for å bestemme disse signaturene kan føre til unøyaktige spådommer og lav interpretability grunn av støyende karakter av miRNA uttrykk data. Vi presenterer en metode for seleksjon av biologisk aktive microRNAs ved hjelp av genuttrykk data og mikroRNA-til-genet interaksjon nettverk. Vår metode er basert på en lineær regresjon med et elastisk nett regularisering. Våre simuleringer viser at med vår metode, kan de aktive mirnas oppdages med høy nøyaktighet og vår tilnærming er robust for høye nivåer av støy og manglende informasjon. Videre er våre resultater på virkelige datasett for glioblastom og prostatakreft bekreftet av mikroRNA uttrykk målinger. Vår metode fører til valg av potensielt funksjonelt viktige microRNAs. Assosiasjonene til noen av våre identifiserte mirnas med kreftmekanismer er allerede bekreftet i andre studier (hypoksi relatert HSA-mir-210 og apoptose relaterte HSA-mir-296-5p). Vi har også identifisert flere mirnas som ikke tidligere har studert i sammenheng med kreft, men er sammenhengende forutsett som aktiv ved vår metode og kan garantere videre etterforskning. Anbefalingen er tilgjengelig i Matlab og R, og kan lastes ned på https://www.cs.toronto.edu/goldenberg/Anna_Goldenberg/Current_Research.html

Citation. Mezlini AM, Wang B, Deshwar A, Morris Q, Goldenberg A (2013) Identifisere Kreft Spesifikke Funksjonelt Relevante mirnas fra Gene Expression og miRNA-til-Gene nettverk ved hjelp regularisert regresjon. PLoS ONE 8 (10): e73168. doi: 10,1371 /journal.pone.0073168

Redaktør: Xin Yuan Guan, The University of Hong Kong, Kina

mottatt: 28. mars 2013, Godkjent: 18 juli 2013; Publisert: 02.10.2013

Copyright: © 2013 Mezlini et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Ingen strøm eksterne finansieringskilder for denne studien

konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

som en høyt konservert viktig faktor for post-transcriptional regulering , microRNAs antas å ha en betydelig innvirkning på genuttrykk og dermed på de fleste biologiske mekanismer og funksjoner. Koblingen mellom mirnas og kreft har vært gjenstand for flere nyere studier og vurderinger [1] – [4]. Troen på at miRNA profil endringen er ikke bare en tilskuer konsekvens av kreft, men kan også ha en aktiv rolle i den, er konsolidert etter flere observasjoner. For det første viser miRNA uttrykket data sammenhengende og drastiske endringer i nivåene av uttrykk mellom tumorvev og deres sunne kolleger. For det andre, har det blitt observert at mange mirnas er plassert på genomet i områder som er utsatt for CNVs /delesjoner i kreft [5]. Til slutt og viktigst, har mange mirnas vist seg å ha en direkte effekt på kreftrelaterte mekanismer som apoptose [6], spredning [7], angiogenese [8] og metastase [9].

Differensial analyse av miRNA ekspresjonsprofiler i kreft vs friskt vev alene kan føre til et stort antall falske positive på grunn av den støyende arten av miRNA ekspresjonsdata. I tillegg har vi dårlig kunnskap om hvor mye avvik i uttrykk for en bestemt miRNA kan indusere funksjonelt relevante endringer i genuttrykk. Det er mulig at genekspresjonen profilen er meget følsom for selv små forandringer i enkelte mirnas «mengder mens drastiske endringer i andre mirnas ikke har betydelig innvirkning på den.

Tidligere metoder for å detektere viktige mirnas i kreft lage en rekke viktige forutsetninger. For eksempel RegulatorInference [10] er en aller siste metode som tar sikte på å finne de aktive mirnas via en regresjon tilnærming. Det forutsetter implisitt at alle genene er påvirket av kopitallvariasjoner i den samme lineær måte, og at effekten av en miRNA på et målgen er lineær i antall bindingssteder. I tillegg bruker RegulatorInference miRNA uttrykket data til forhånds potensielt aktive mirnas, men dette trinnet er valgfritt. I [11], genekspresjon, miRNA uttrykk og genet-genet interaksjon nettverk brukes til å konstruere en antatt kompleks miRNA-target innflytelse nettverk med miRNA innflytelse koeffisienter som er beregnet på grunnlag av miRNA direkte /indirekte effekt på gener og gen-gen kommenterte interaksjoner.

i denne artikkelen presenterer vi en metode for å forutsi funksjonelt relevante mirnas fra differensial genuttrykk data ved hjelp av miRNA-genet interaksjon informasjon og mRNA uttrykk bare. I motsetning til tidligere metoder, bruker vi ikke miRNA uttrykket data i våre spådommer og vi gjør ingen forutsetninger om hvordan ulike mirnas, kan CNVs eller interaksjoner påvirke forskjellige gener. Ideen er å velge et sett av miRNAs ansvarlig for de fleste av de observerte endringene i genuttrykk basert på tidligere kjennskap til eksisterende miRNA-genet interaksjoner med noen ekstra forutsetninger om styrken av disse interaksjonene. Vår tilnærming er basert på en regresjonsmodell for genet differensial uttrykk. Vi har lagt en elastisk netto regularisering [12] for å unngå overfitting det høye nivået av støy i dataene, og velg et minimalt sett med aktive miRNAs. Den mirnas differensial uttrykk data brukes kun for valideringsformål. I den grad vi kjenner til, er dette den første tilnærmingen til å bestemme aktive mirnas i kreft fra genekspresjonsdata bare (ingen miRNA data), og derfor kan vi vurdere vår ytelse ved hjelp av differensial miRNA uttrykk data fra de samme pasientene.

våre simuleringer viser at vår metode er robust overfor flere typer støy og manglende data og at det er i stand til å forutsi de relevante mirnas så lenge innspill genuttrykk endringene er, i det minste, delvis på grunn av miRNAs. Vi har brukt våre data på 157 pasienter med glioblastom og 111 pasienter med prostatakreft og spådde flere relevante mirnas effekter som ble bekreftet av miRNA uttrykk målinger på de samme pasientene.

Våre resultater på reelle data identifiserte mirnas hvis rollene var tidligere validert i kreft som mir-210 og mir-296-5p, sammen med andre potensielt viktige mirnas: Mir-1, Mir-154, mir-339-3p, Mir-539, Mir-561, mir-607 i glioblastom og speil 143 *, mir-30c-2 *, mir-330-3p, mir-526b og mir-939 i prostatakreft.

Metoder

1 data~~POS=TRUNC pre-prosessering

En stor andel av variasjonen i genet /miRNA uttrykket målinger på tvers av forskjellige tumorprøver er på grunn av de ulike nivåer av forurensning med friske celler. Vanligvis til en svulstvevet består av friske celler som har genet /miRNA uttrykket signalet vil forstyrre kreften signal til en annen grad for de ulike prøvene (pasienter).

Vi bruker Isopure [13] for å hente ut det rensede kreft signal for alle pasientene. Dette gir en bedre sammenheng mellom kreftpasienter og mer nøyaktige resultater for miRNA prediksjon.

2 Normalisert differensial uttrykk beregning

Etter at vi renser tumor data, tar vi loggen av genet målinger hos pasienter og kontroller. Deretter, for hver pasient vi beregne den normaliserte differensial uttrykket for et gen eller en miRNA ifølge [14] 🙁 1) Hvor E og Y er henholdsvis den opprinnelige og den normaliserte genuttrykk for pasienten, n og m er henholdsvis antall av friske kontroller og kreftpasienter, og er gjennomsnittet og variansen uttrykk for at genet i friske kontroller. Uttrykket straffer gener med høy varians mellom kreftpasienter. Det samme normalisering brukes for miRNA data for å få differensial miRNA uttrykk for svulst vs friske prøver når vi bruker miRNA uttrykk for valideringsformål.

3 Velge aktive mirnas

Vi bestemmer listen over aktive mirnas ved å velge mirnas som ville ha måttet være aktiv for å observere den resulterende mRNA uttrykk endring mønster over hele genomet. Mer spesifikt vi modellere genom-wide endring i mRNA-ekspresjonsnivåer som en sum av ukjente miRNA påvirkninger. De påvirkninger har null bidrag for alle mirnas som er rettet mot en bestemt gen. Vi bruker miRNA-til-genet nettverk for genet målinformasjon og representere den som en matrise. Vi fikk nettverket fra europeiske Bioinformatikk Institute (ww.ebi.ac.uk/enright-srv/microcosm/cgi-bin/targets/v5/download. Pl) som ga et sett av målgener for hver miRNA (711 miRNAs, 16799 gener og 470.000 kanter). Hvis det ikke er noen merkbar effekt av miRNA uttrykket endring på skivene «uttrykk endring, blir innflytelsen anslått til å være null. Mirna påvirkninger er anslått per pasient. Dersom den forutsagte miRNA innflytelse ikke er null og har samme fortegn over mesteparten av pasientene, antar vi at den gitte miRNA er aktiv, og kan være en viktig faktor for en gitt sykdom. Flytskjemaet for vår metode er tatt i figur 1 og formuleringen er gitt nedenfor: (2)

Vi kan forutsi aktive mirnas for hver enkelt pasient, så vi undersøke sammenhengen i de aktive mirnas over pasientene.

Matrix av mikroRNA-genet interaksjoner er definert som følger: (3)

de negative verdier i matrisen viser at mirnas vanligvis ned-regulere genekspresjon. Siden informasjon om hvor mye en bestemt miRNA påvirker et gitt gen ikke er tilgjengelig, koeffisientene i løsningen representerer «innflytelse» av miRNAs på genuttrykk profilen fremfor mirnas differensial uttrykk (dvs. hvor mye av endringen i genuttrykk av miRNA mål kan tilskrives den aktuelle miRNA). indikerer to ting: 1) hvorvidt miRNA var aktiv (); og 2) på hvilken måte påvirket det ekspresjon, det vil si hvorvidt målet gener blir over-uttrykt i kreftvev sammenlignet med normalt vev indikerer at miRNA nivåene ble utarmet () eller under-uttrykk som angir over-ekspresjon av den gitte miRNA () .

Hvis påvirkning av en aktiv miRNA er av samme skilt med den gitte pasientens observert miRNA differensial uttrykk, sier vi at miRNA prediksjon er validert av mirnas målingene.

Siden vi ønsker for å unngå overtilpassing og oppmuntre modeller med et lite antall aktive mirnas (enklere modeller med kun noen få aktive mirnas er lettere å tolke og er biologisk mer relevant), bruker vi en elastisk netto typen straff. Den resulterende objektive funksjon for å minimere er: (4) der og er de elastiske parametrene net, er valget av parametrene omtalt nedenfor. Elastisk netto straffen er valgt her fordi det er i stand til å unngå noen av de begrensningene vi kan støte på ved hjelp av en enkel straff som i [10]. For eksempel, når vi har høyt korrelerte variabler (mirnas med mye mål i vanlig) en straff vil tendere til å velge en variabel tilfeldig og ignorere de andre, mens elastiske nettet vil velge alle relevante variabler.

4 valg av parametere (kryssvalidering)

parametrene av elastisk netto definere sparsity av løsningen: antall mirnas som er anslått til å være aktivt drive genene differensial uttrykk. For å finne ut, vi brukte kryssvalidering rammene foreslått i [12] (Gjennomføring er tilgjengelig i R glmnet pakken). Akseptable resultater oppnås med tilsvarende den minimale forutsigende feil ved bruk av 10-gangers kryssvalidering. Å velge den høyeste tilsvarende en prediksjonsfeil av en standardfeil pluss det minimale forutsigende feil kan føre til mer nøyaktige resultater i simuleringer med lavere nivåer av støy. Men det gir ofte altfor sparsomme løsninger når prediksjonsfeil har høy varians og derfor bruker vi minimalt prediksjonsfeil konvensjonen i disse tilfellene. I våre resultater, fikse vi det samme for alle pasienter for å være den gjennomsnittlige valgt verdi på tvers av pasienter. For valget av vi gjentok hele forsøket (simulering og reelle data) med ulike verdier (0,1, 0,25, 0,5) og ingen større forskjell ble observert for de endelige anslåtte mirnas, så vi setter vår til 0,25 for alle forsøk.

Resultater

1 Simuleringer og robusthet for støy

Først testet vi evnen til vår metode for å velge riktig undergruppe av gen-uttrykk-kjøring mirnas blant mengden av alle miRNAs, og evnen til å bestemme den riktige påvirkninger for de valgte mirnas (tegn på i (2)). For å gjøre det, vi tilfeldig valgt 30 mirnas å være aktive mirnas kjøre genuttrykket endringer og vi tildelt store positive eller negative bety uttrykk verdier til dem (absolutt verdi jevnt valgt fra og logge innhentet av objektiv myntkasting). Vi tilordnet null middelverdier for alle andre mirnas som ikke er simulert som aktiv. Vi deretter simulert 100 pasienter med miRNA differensial uttrykk profiler sentrert rundt disse gjennomsnittsverdiene (gaussisk fordeling med gitt middelverdi og standardavvik 0,5). Som et resultat, får vi for hver pasient et sett av miRNA differensial uttrykk målinger i hvilken de 30 mirnas simulert som aktiv vil bli konsistent uttrykt forskjellig og alle andre mirnas vil betegner en bakgrunnsstøy. Til slutt, for hver pasient vi multipliserer miRNA simulerte differensial uttrykk måler ved miRNA-genet interaksjon nettverk (matrise i ligning 2) for å oppnå simulerte gene differensial uttrykk måler (Dette trinnet vil senere bli referert til som genet differensial ekspresjon simulering trinn). Nettverket brukes her er den samme som den som er nevnt i punkt 2.3, og produsert av den europeiske Bioinformatikk Institute fange samspillet mellom 711 mirnas og 16799 gener, median miRNA har rundt 650 potensielle målgener.

Målet med dette eksperimentet er å teste om problemet kan løses på tross av at de mirnas ofte ha hundrevis av potensielle mål overlappende og at flere mirnas kan ha motsatte virkninger på genekspresjon nivåer.

Vi fors ett tusen simuleringer som genererer data beskrevet ovenfor. Vi fant at i de tilfellene vi var i stand til å identifisere den nøyaktige tilfeldig valgt undergruppe av miRNAs driver endringene i genuttrykk og tippe alle innflytelse tegn. I praksis betyr dette at vår metode fungerer riktig for noen prøve i reelle data hvor mirnas «differensial uttrykk er ansvarlig for en relativt høy andel av differensial uttrykk for mRNA. Dette betyr også at konsistens i hvilke grupper av gener er over /under uttrykt et sterkt nok signal for å påvise aktive mirnas selv om ulike mirnas kan ha motsatt effekt på vanlige målgener.

Neste vi testet robustheten våre metoder til de forskjellige typene av støy. Vi har undersøkt effekten av fire typer støy som kan gjøre dette problemet vanskeligere å løse:

Vi sto for strukturell støy (falske negative interaksjoner) i miRNA-genet nettverk ved å legge tilfeldige kanter før genet differensial uttrykk simulering og deretter ved hjelp av den opprinnelige miRNA-genet nettverk for forutsigelsene, noe som resulterer noen av de miRNA innflytelse informasjonen som brukes for å generere data manglet på forutsigelsen trinnet.

Vi står for ukorrekte kanter (falske positive interaksjoner) i miRNA-genet nettverk ved å fjerne tilfeldige kanter før genet differensial uttrykk simulering. Den opprinnelige miRNA-genet nettverk brukes fortsatt i spådommer.

Vi simulert effekten av uobserverte gen-gen-interaksjoner på gener uttrykk (vi bruker protein-protein interaksjon nettverk).

Vi øke nivåene av støy i uttrykket data (ved å legge Gaussian støy med 0-gjennomsnitt og varians proporsjonal med uttrykket nivåer) for å redegjøre for andre mekanismer som endrer gen-uttrykk i kreft som kopier antall variasjoner.

Figur 2 viser effekten av modellering mangler /feil informasjon i miRNA-genet nettverk. Vi legger merke til at fremgangsmåten er i stand til omtrent detektere riktig undergruppe av mirnas selv når vi antar at de miRNA-genet som er merket interaksjoner er feil (vi fjerne av kantene i nettverket grafen i løpet av genekspresjon simuleringstrinn), eller når vi antar merknader inneholder bare halvparten av de reelle miRNA-genet interaksjoner (vi legger kanter i løpet av genuttrykk simulering trinn). Det er dokumentert at metoden er mer robust overfor manglende informasjon (Falske negative kanter) enn feil informasjon (Falske positive kanter) som betyr at det er best å bruke konservative nettverk i denne sammenheng. Figur 3 viser robustheten av fremgangsmåten for høye støynivåer i genekspresjon. Genekspresjonen støyen parametrized av den variable regulering av styrken av støyen: for hvert gen, blir variansen av den siste type støy multipliseres med det gjennomsnittlige nivået av ekspresjon (gir en Poisson typen varians). Til slutt blir den gene-genet interaksjon støy kontrollert av diffusjon variable som følger: (5)

(A) Følsomhet og (B) presisjon av fremgangsmåten i å forutsi gen-ekspresjons-kjøre mirnas når vi varierende proporsjonene feil kanter og mangler kanter i miRNA-Gene interaksjoner nettverk (slette kanter /sette inn nye kanter). Alle miRNA ble også spådd å ha riktig retning innflytelse (demper vs onkogen effekt).

(A) Følsomhet og (B) presisjon av metoden i å forutsi gen-uttrykk-kjøring mirnas når å variere nivået av gen-interaksjoner støy (via diffusjon parameter) og intensiteten av støy i differensial genekspresjon nivå (via den variable). Alle spådde mirnas har riktige innflytelse tegn.

Hvor er genet differensial uttrykk vektor, er genet-genet direkte interaksjon matrise og er matrisen med andre ordens gen-gen-interaksjoner (andre ordens naboer i genet-genet interaksjoner nettverk representasjon). Dette betyr at en genekspresjon virker til en viss grad ekspresjonen av gener (kommunisere direkte naboer) og til en mindre grad gener som samvirker med de direkte naboer (andre rekkefølge naboer). Genet-genet interaksjon nettverk vi her brukt er et delsett av den kombinerte menneskelige nettverket ned fra Biogrid nettside. Den fanger informasjon for de 16,799 gener som er til stede i vår miRNA-genet nettverk og inneholder 85,590 kanter. Figur 3 viser at evnen til vår metode for å gjenopprette den virkelige mirnas er høy, selv i nærvær av andre påvirkninger, slik som påvirker av samvirkende gener, som modellen tar ikke hensyn til. Våre simuleringsresultatene tyder på at vår metode er robust overfor ulike typer støy.

2 Analyse av kreft data

2,1 evalueringskriterier.

Ved hjelp av vår metode, spådde vi funksjonelt relevante mirnas og deres innflytelse på genekspresjon fra differensial genuttrykk data for glioblastom multi og prostata kreft. Siden våre spådommer er på en per-pasient, velger vi de mirnas som ble spådd aktiv () med den samme retningen av innflytelse i mer enn av pasientene. Disse mirnas er mer sannsynlig å reflektere en ekte biologisk mekanisme som er felles for kreft siden de ble konsekvent predikert som aktiv ved vår fremgangsmåte i et stort antall uavhengige pasienter. Så ser vi på mirnas «uttrykk målinger for de samme pasientene. Hvis de aktive mirnas «differensial uttrykk har de samme tegn som sine spådd innflytelse i mer enn av pasientene, anser vi dem validert av miRNA målinger.

I miRNA differensial uttrykk data, noen mirnas er sammenhengende over- eller under-uttrykt på tvers av pasienter, og noen er ikke. Vi anslår betydningen av vår aktive miRNA satt ved å beregne p-verdien. Sannsynlighet for å ha like god eller bedre validerings resultater enn vår metoden hvis mirnas spådommer var tilfeldig

Vi beregner at p-verdien ved først å velge en tilfeldig subsett av mirnas fra dataene, sammen med den angitte størrelse lik antallet av mirnas forutsagt som aktiv ved vår metode. Så, vi tilfeldig tildele retning av innflytelse (skilt) for disse utvalgte miRNAs. Til slutt, anslår vi at andelen av disse tilfeldige spådommer som er validert av miRNA målinger ved hjelp av miRNA data tilsvarende de samme studerte pasienter (en miRNA er validert hvis det er sammenhengende over-uttrykt /under-uttrykk når dens innvirkning tegn er henholdsvis positiv /negativ). Vi gjentar dette eksperimentet 10.000 ganger. P-verdien er andelen av tilfeldige eksperimenter med høyere validering rente enn vår metode spådommer. En liten nok p-verdi indikerer at mirnas valgt av foreliggende fremgangsmåte var ikke tilfeldig, og at det er sannsynlig at en funksjonell betydning i forhold til den kreft indikert av sammenheng i miRNA /genekspresjon på tvers av pasienter.

2,2 Glioblastoma .

glioblastom genekspresjon data ble produsert av Broad Institute hjelp av Affymetrix HT_HG-U133A eksperimentell design. Den inneholder 157 kreftsaker og 10 kontroller. Denne informasjonen sammen med miRNA uttrykk vi bruker for validering er tilgjengelig på TCGA nettstedet.

Etter å rense genuttrykk data (se kapittel 2.1) og transformere det til normalisert differensial uttrykk (se kapittel 2.2), spådde vi 11 mirnas aktive over mer enn av pasientene. Ut av disse 11 mirnas spådommer, 7 ble validert av tilgjengelige miRNA uttrykket (bekreftet i flere enn av tilfellene) og 2 andre ble bekreftet i mer enn av tilfellene. Disse resultatene samsvarer med en p-verdi på 0,0005 (se avsnitt 3.2.1 for mer informasjon). Figur 4 viser mirnas sammenhengende spådd over pasientene. Blant de mirnas som ble spådd og bekreftet, fant vi mir-210, mir-339-3p, mir-561, mir-en, mir-154, mir-539, mir-607.

Pink er for over-uttrykt mirnas og blå er for under-uttrykk. Hver kolonne representerer en pasient og hver rad en miRNA.

MIR-210 er induserbar ved hypoksi og ble tidligere identifisert som en uavhengig markør for flere kreftformer (bryst [15], bukspyttkjertel [16], hode og nakke [17]). Det er også nevnt som en regulator for normoksisk genuttrykk som er involvert i startfasen [18]. Vi spådde det som aktiv og bekreftet sin over-uttrykk aktivitet ved hjelp av observerte data i glioblastom.

Vi har også spådd og bekreftet over-uttrykk for mir-339-3p, og under-uttrykk for mir-en, mir-154, mir-539, mir-561 og mir-607. I dag er det ingen kunnskap om de funksjonelle rollene til disse mirnas i kreft. Ytterligere validerings eksperimenter er nødvendig for en bedre forståelse av funksjonen av disse miRNA i glioblastom. mir-548b-5p, mir-548c-3p, mir-548c-5p ble også spådd i nesten alle pasienter selv om deres mål gensettene svært forskjellige, men de var bare validert i henholdsvis, av tilfellene.

2,3 prostatakreft.

prostatakreft data den ble produsert av Memorial Sloan-Kettering Cancer Center (MSKCC) og er tilgjengelig fra GEO under sjonsnummer GSE21032. Dataene inneholder informasjon om 111 pasienter og 28 kontroller der både gen og miRNA uttrykket data er tilgjengelig.

Etter preprosessering genuttrykket data for å få den rensede normalisert differensial uttrykk og bruke vår metode for å forutsi sett med aktive mirnas for hver pasient, valgte vi 10 mirnas: 7 av disse miRNAs ble validert ved hjelp av de observerte miRNA uttrykket data i mer enn pasienter, bekrefter retning av miRNA innflytelse. En annen miRNA: mir-574-5p ble validert i av pasientene. Disse resultatene samsvarer med en statistisk signifikant p-verdi.

Blant mirnas som ble spådd og bekreftet, mir-210 ble over-uttrykt på samme måte som våre funn i glioblastom data, og mir-296-5p ( over-uttrykt) ble tidligere forbundet med apoptose av androgen-uavhengig prostatakreftceller [19] mir-143 * ble spådd og bekreftet av de observerte data som under uttrykt i alle pasienter, men ble ikke nevnt som en kreftmarkør i litteraturen . Tilsvar mir-30c-2 *, mir-526b, mir-330-3p og mir-939 (alle spådd og bekreftet som over-uttrykt) ble sporadisk nevnt som forskjellig uttrykt mirnas i kreft litteratur, men med ingen solid eksperimentelle bevis for å karakterisere sin eksakte roller i kreft ennå.

til slutt ble mir-569 og mir-607 spådde i de fleste både prostatakreft og glioblastom pasienter, men ble bare validert i glioblastom fordi de ikke ble målt i prostatakreft data. Tilsvarende ble mir-574-5p spådde i begge datasett, men dens mål var utilgjengelig for pasienter med glioblastom, derfor ble det bare bekreftet i prostatakreft.

Den generelle oppsummering av våre resultater med høyeste validerings priser i prostatakreft og glioblastom er beskrevet i figur 4.

Diskusjoner

i denne artikkelen vi presenterte den første metoden som spår aktive mirnas i kreft fra miRNA-gennettverk og mRNA uttrykk data uten å stole på miRNA uttrykket selv. Vi bruker elastisk-net-regularisert regresjon rammeverk for å gjøre disse spådommer robust. Siden mRNA-ekspresjon data er ofte lett tilgjengelig, kan foreliggende fremgangsmåte brukes for å lede analyse av mirnas ved å prioritere dem for fremtidige eksperimenter. Vi validert vår metode med både simulering og reelle data kombinert med miRNA uttrykket målinger for å bekrefte våre funn. Våre simuleringer har indikert at vår metode robust identifiserer aktive mirnas og retning av sine innflytelse (dempere eller onkogener) på de globale genuttrykksmønster. Våre resultater på reelle data indikerte potensielt viktige mirnas i glioblastom og prostatakreft, hvorav noen var allerede validert i tidligere studier (The hypoksi relatert mir-210 og prostata kreft celle apoptose relaterte mir-296-5p) og andre for hvor eksakt rolle i kreft gjenstår å fastslå.

Fremtidige forbedringer av vår metode er nært knyttet til bedre modellering av støy i dataene. For eksempel, under hensyntagen til uttrykk endringene som er indusert av karyotypic variasjoner eller kopi-antall variasjoner i kreft ville bidra til å isolere effekten av funksjonelt relevante mirnas, særlig hvis virkningen av disse variasjoner på genekspresjon nøyaktig forstått og modellert i fremtiden. Bedre resultater kan også oppnås hvis vi har en solid modell av gene-genet interaksjoner som kan endre uttrykk uavhengig av miRNAs.

Legg att eit svar