PLoS ONE: miRConnect: Identifisere Effector Gener av mirnas og miRNA Familier i Cancer Cells

Abstract

micro (mi) RNA er små ikke-kodende RNA som negativt regulerer uttrykk for de fleste mRNA. De er sterke regulatorer av forskjellig differensieringstrinn, og ekspresjon av gener som enten negativt eller positivt korrelerer med uttrykkes mirnas ventes å inneholde informasjon om den biologiske tilstanden til cellen og dermed av funksjonen av de uttrykte miRNAs. Vi har sammenliknet den store mengden av tilgjengelige gen array-data på den stabile tilstand system av NCI60 cellelinjer i to forskjellige datasettene som inneholder informasjon om ekspresjonen av 583 individuelle miRNAs. I tillegg har vi generert tilpassede datasett som inneholder uttrykk opplysninger av 54 miRNA familier som deler samme frø kamp. Vi har utviklet en ny strategi for å korrelere mirnas med individuelle gener basert på en summert Pearson korrelasjonskoeffisient (SPCC) som etterligner en

i silico

titrering eksperiment. Ved å fokusere på de gener som korrelerer med uttrykk for miRNAs uten nødvendigvis å være direkte mål av mirnas, har vi gruppert mirnas i ulike funksjonelle grupper. Dette har resultert i identifisering av tre nye mirnas som er knyttet til epithelial-til-mesenchymale overgang (EMT) i tillegg til de kjente EMT regulatorer av

MIR-200

miRNA familien. I tillegg er en analyse av genet signaturer assosiert med EMT, c-MYC-aktivitet, og ribosomalt protein genekspresjon mulig for oss å tildele forskjellige aktiviteter til hver av de funksjonelle grupper av mirnas. Alle korrelasjons data er tilgjengelig via et web-grensesnitt som gjør at etterforskerne for å identifisere gener som uttrykk korrelerer med uttrykk for enkelt mirnas eller hele miRNA familier. miRConnect.org skal hjelpe til med å identifisere pathways regulert av mirnas uten at det krever spesifikk kunnskap om miRNA mål

Citation. Hua Y, Duan S, Murmann AE, Larsen N, Kjems J, Lund AH, et al. (2011) miRConnect: Identifisere Effector Gener av mirnas og miRNA familier i kreftceller. PLoS ONE 6 (10): e26521. doi: 10,1371 /journal.pone.0026521

Redaktør: Lin Zhang, University of Pennsylvania School of Medicine, USA

mottatt: 16 september 2011; Godkjent: 28 september 2011; Publisert: 26 oktober 2011

Copyright: © 2011 Hua et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Disse forfatterne har ingen støtte eller finansiering for å rapportere

konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Micro (mI) RNA er små, 19- 22 nukleotid lange, ikke-kodende RNA som regulerer genuttrykk hovedsakelig ved å målrette den 3’UTR av mRNA som resulterer i redusert oversettelse av proteiner eller degradering av mRNA. mirnas er grunnleggende regulatorer av celledifferensiering og utviklingsprosesser. De har også vært kjent for å være svært relevant i kreftdannelse og progresjon [1]. Nylig ble det vist at nesten alle menneskelige gener er under kontroll av miRNAs [2]. Men fordi mirnas regulere uttrykk for hundrevis av målgener [3], og mange gener er målrettet av flere mirnas [4], tildele biologiske funksjoner til mirnas eller miRNA familier har vært en vanskelig oppgave.

mirnas inneholde ved deres 5 «ender en kort strekning på 6-8 nukleotider komplementære til frøet match i mål-mRNA. Dette komplementaritet er tilgjengelig for matematisk analyse og flere algoritmer har blitt utviklet for å forutsi miRNA målene [5]. Men målet spådommer gjort med disse algoritmene er ikke nøyaktig nok til å utlede biologisk funksjon av miRNAs utelukkende basert på listene over anslåtte mål. Målet validering gjøres vanligvis ved enten overekspresjon mirnas eller ved å inhibere deres funksjon fulgt ved å måle endringer i mRNA eller proteinnivåer i transfekterte celler [2], [6]. Men både overekspresjon og hemming av miRNAs har begrensninger [7], og det er ikke klart om de observerte endringene på mRNA og protein nivå er et resultat av direkte reguleringer av mirnas eller er et resultat av endringer nedstrøms av miRNA målrettede gener.

Vi har nylig brukt NCI60 cellene [8], til et panel av 60 cancercellelinjer opprettholdt ved NCI, identifisere og validere forbindelsen mellom mirnas og deres mål. Uaffisert rekke datapunkter på uttrykk nivåer av hundrevis av mirnas og mer enn hundre tusen gener på flere array-plattformer gjør NCI60 cellene et unikt system for å identifisere kreft relevante sammenhenger mellom mirnas og gener reguleres av miRNAs. Bruke NCI60 systemet vi tidligere validert

HMGA2 Hotell og

IMP1

som mål for

la-7

familie av miRNAs [9], [10]. I tillegg har vi identifisert medlemmene av

MIR-200

familie og validert to E-box bindende transkripsjonsfaktorer,

ZEB1 Hotell og

ZEB2

som mål [11]. Sist vi validert tyrosin fosfatase

FAP1

som en

MIR-200

målrette [12]. Disse eksemplene viser kraften i NCI60 datasett for å koble mirnas med sine mål. Men, identifisering av enkelt miRNA mål uten en mobil kontekst eller kjennskap til alle målene for en miRNA gjør det vanskelig å koble mirnas med biologi eller patologi. Våre studier av

la-7 Hotell og

MIR-200

i NCI60 cellene også tillatt prediksjon og bekreftelse av den biologiske funksjonen til disse miRNAs.

La-7

ble funnet å være en markør for differensierte kreftceller [9], [13], og

MIR-200

ble identifisert som en kraftig markør og regulator av epitel-to -mesenchymal overgang (EMT) [11], [14].

de fleste av våre funn ble gjort ved å sammenligne miRNA og mRNA uttrykk nivåer, som på den tiden var overraskende, med tanke på at mirnas i pattedyrceller ble antatt å hovedsakelig handle ved translasjonsforskning stanse uten at det påvirker mRNA uttrykk nivåer. Men det hadde også blitt vist at mRNA overflod av flertallet av målrettede gener ble noe preget av mirnas [15], [16]. Mens det fortsatt er uenighet om den dominerende måten som mirnas regulere genuttrykket [17], en fersk studie antydet at for et betydelig antall gener målrettet av mirnas, destabilisering av mRNA er den viktigste mekanismen for protein undertrykkelse av mirnas [18] , en observasjon som gjør NCI60 mRNA /miRNA datasettene et verdifullt verktøy for å studere miRNA funksjon i kreftceller.

transfeksjon av celler med enten mirnas eller miRNA inhibitorer resulterer vanligvis i endringer i mengde av et stort antall mRNA. Interessant, mRNAer som er negativt regulert av mirnas funnet, så vel som et stort antall mRNA som positivt korrelerer med miRNA uttrykk. Disse endringer i mRNA-nivåer er generelt blitt ansett for å være forårsaket av gener coregulated med mirnas eller for å være sekundære arrangementer. Det er faktisk sannsynlig at flertallet av gener hvis ekspresjon responderer på endringer i ekspresjonen av mirnas ikke er direkte mål for den miRNA

per se

, men er biologiske effektorer som er relevante for funksjonen av miRNA. Spesielt når oppdages med steady state system av NCI60 celler, kan disse biologiske effektor genene holde viktig informasjon om den endogene funksjon av miRNAs. Dette var mest åpenbare for

MIR-200

. En liten endring i

MIR-200

uttrykk (ca 2 ganger) resulterte i en moderat endring i mRNA nivåer av sine mål

ZEB1 Hotell og

ZEB2 plakater (ca 5-7 fold), noe som resulterte i en massiv endring i

E-cadherin Twitter /

vimentin

ratio (over 8 størrelsesordener) [11]. Den enorme positiv korrelasjon mellom uttrykk for

MIR-200

og

E-cadherin Twitter /

vimentin

ratio tillatt oss å tildele funksjonen «epithelial regulator» til MIR-200 familien selv før vi hadde identifisert

ZEB1 Hotell og

ZEB2

som mål. Oppmuntret av denne analysen har vi nå brukt NCI60 system for å identifisere sekundære korrelatorer av mirnas (som kan være i tusenvis som i tilfellet med EMT [19]), i et genom-bred analyse som de kan inneholde viktig informasjon om den biologiske tilstand av en celle.

Vi har utviklet en ny metode for å klynge mirnas eller miRNA familier i henhold til deres biologiske correlators framfor spådd mål eller deres kromosom colocalization eller deres vev spesifikke uttrykk. mirnas ble gruppert inn i forskjellige funksjonelle grupper i henhold til uttrykk av deres biologiske effektor gener. Vi har validert aktiviteten av en av disse klyngene som inneholder alle medlemmer av

MIR-200

familie, i regulering av epiteliale natur av celler. Dette resulterte i identifisering av tre nye miRNAs,

MIR-7

,

MIR-203 Hotell og

MIR-375

, til å fungere i epitel vedlikehold. I tillegg har vi identifisert klynger av kreft relevant mirnas som enten er vekstfremmende eller vekst undertrykkende i naturen basert på korrelasjonen av deres ekspresjon med ekspresjonen av enten ribosomale proteiner eller

c-MYC

regulerte gener. Vi har laget en web-basert grensesnitt, miRConnect.org, som gir en robust og lett-å-bruke verktøy for etterforskere å identifisere nye forbindelser mellom mirnas eller miRNA familier og grupper av gener som er markører for ulike biologiske stater.

Resultater

Generering av sammenhenger mellom miRNA og genuttrykk

for å utforske biologiske aktiviteter av miRNA vi først etablert sammenhengene mellom uttrykk av miRNAs og gener. Vi har gjort bruk av flere datasett tilgjengelig for NCI60 celler (59 cellelinjer): 1) uttrykket profilen til 208 menneskelige mirnas kvantifisert ved real-time PCR ( «Q» datasettet) [20]; 2) fire datasett for menneskelig genuttrykk profiler (Stanford, GENELOGIC_U95, GENELOGIC_U133 og NOVARTIS) er tilgjengelig på NCI Developmental Therapeutics Program (DTP) server. I Q datasettet, ble 136 mirnas definert som blir uttrykt ved detekterbare nivåer (vurdert av real-time PCR) på minst 30 av 59 cellelinjer (tabell S1). De NCI60 celler representerer 9 forskjellige kreftformer. Cut-off på 30 cellelinjer ble valgt for å omfatte minst halvparten av cellelinjer, og for å sikre at minst fire forskjellige vev opprinnelse var representert. En fordel med NCI60 system er muligheten for å kombinere individuelle endogent miRNA uttrykk på en måte som representeres ved korrelering av genekspresjon med uttrykk for en hel familie miRNA (dvs. alle 9 la-7-aktivitet som er representert i datasettet Q). De 136 mirnas inneholdt medlemmer av 24 frø familier (mirnas som deler samme frø sekvens med mer enn ett familiemedlem, Tabell S2). I tillegg, på grunn av deres forutsagte overlappende funksjon, genererte vi en ytterligere tilpasset familie av alle familiemedlemmer MIR-200; MIR-200 faller inn i to ulike frø familier, MIR-141 /200A og MIR-200BC /429, kjennetegnet av bare ett nukleotid forskjell i sentrum av frø sekvens [11], [14].

vanligste og veldefinert strategi for å utforske miRNA-genet foreninger er Pearsons korrelasjonskoeffisient (PCC) [21], [22]. Mens PCC er et kraftig verktøy for å oppdage sammenhenger, har det begrensninger. For eksempel, PCC gir lik vekten til hver prøve som skal måles (for eksempel en cellelinje, et spesifikt vev eller en pasientprøve). Det skiller ikke mellom prøver med høy uttrykk og de med lav uttrykk. Dette kan føre til forvrengning av korrelasjonsanalyse, fordi: 1) uttrykket nivået av miRNAs inneholder viktig informasjon om forskrifter; og 2) støyen er mer sannsynlig å eksistere i prøver som inneholdt gener som er av lav ekspresjon. Vi tenkte derfor på en måte for å overvinne noen av disse begrensningene. En løsning ville være å tildele forskjellige vekter til høye og lave nivåer. Imidlertid, fordi beregningen PCC er ikke en lineær prosess, er det ikke praktisk å legge vekt direkte til hver prøve. I stedet vekting ved nivået for den utvalgs ble funnet å være mer praktisk fordi PCC med forskjellige sammensetninger av cellelinjedata kan legges opp og den tilsvarende modellering vil igjen være lineær. Basert på denne vurderingen, har vi utviklet en ny metode, den «oppsummerte PCC» (SPCC). En standard (direkte) PCC (dPCC), ble det SPCC og en randomisert SPCC (rsPCC) brukes til å generere sammenhenger mellom uttrykk av miRNAs og gener, for å teste reproduserbarheten av sammenhenger og utforske spesielle biologi hvordan mirnas arbeid.

Direct (d) PCC

i denne metoden vi utført en standard SAMMENLIGN analyse [23], som produserer PCC, for å identifisere mRNA som korrelert med ekspresjonen av hver av de 136 miRNAs. I denne og alle påfølgende SAMMENLIGN analyserer vi satt 30 som minimalt antall påvisbare cellelinjer. Å normaldeteksjons variasjon blant sonder henholdsvis inngår i de fire genet array-plattformene ble grunnfondsbevis i gjennomsnitt for hvert gen. Denne metoden ga en PCC verdi for hver mRNA som signifikant korrelert med uttrykk for en miRNA.

Summert (e) PCC

I denne metoden (figur S1) vi endret beregningen prosessen av miRNA-mRNA korrelasjon ved å legge opp en serie av grunnfondsbevis verdier som etterligner en «titrering» av miRNA ved å rangere cellelinjer i henhold til deres uttrykk for miRNAs. For hver miRNA-mRNA par, vi sortert miRNA uttrykket i 59 cellelinjer fra høyeste til laveste, og valgt ut de 30 beste cellelinjer som den opprinnelige tilstanden, fordi disse 30 cellelinjer representert den øverste halvdelen av alle cellelinjer og inkludert celler fra minst 4 forskjellige vev opprinnelse. Vi har utført en sammenligningsanalyse for slike 30 cellelinjer (mønster 30). Deretter cellelinjen med rang No. 31 ble inkludert, og en sammenligningsanalyse ble gjentatt for disse 31 cellelinjer (mønster 31). Gjentatte SAMMENLIGN analyser ble utført inntil alle 59 cellelinjene ble inkludert på en trinnvis måte, og totalt 30 PCC-verdier ble samlet (30 mønster til mønster 59). Vi fikk ikke bruke en glidende vindu av en fast størrelse (1-30, 2-31, …, 30-59) fordi vi alltid har ønsket å inkludere cellelinjer med det høyeste uttrykk for en miRNA forventer å ha størst effekt på målet /effektor-genene i disse cellelinjene. Dette additive metode tildelt vekter i en gradient (eller titrering) måte basert på miRNA uttrykket nivåer. De 30 cellelinjer med det høyeste uttrykk var alltid inkludert i hver SAMMENLIGN beregning og tildelt høyeste vekter, siden vi forventet den største effekten på mål /effektor gener fra disse cellelinjene. Grunnfondsbevis summer ble i gjennomsnitt for hvert gen blant de fire gene array-plattformer.

Randomiserte summeres (rs) PCC

For å teste stabilitet og reproduserbarhet av SPCC metoden, har vi designet en randomisert fra av SPCC som en intern kontroll. Den eneste forskjell mellom denne fremgangsmåte og den SPCC metode var at cellelinjene ble sortert i en randomisert måte. For hver miRNA-mRNA par, ble randomisert sortering gjentas 10 ganger, og de 10 rsPCCs ble i gjennomsnitt.

Den SPCC metoden nøyaktig oppdager både nedstrøms effektor gener og spådd mål sammenfaller med mirnas

Det er kjent fra flere studier at selv endre miRNA uttrykk nivåer i kreftceller fører både opp og ned regulering av gener, miRNAs hovedsakelig arbeide gjennom negativ regulering av nedstrøms effektor gener [15], [16]. For å teste denne observasjonen med våre metoder ble log2 ratio verdiene av alle negative vs alle positive korrelasjoner beregnet for 136 mirnas henholdsvis med de tre metodene (dPCC, SPCC og rsPCC). En sammenligning av fordelingen av 136 forholdsverdier påvist at negative korrelasjoner vesentlig underlegne positive i SPCC analyse, men ikke i de to andre analyser (figur 1A). Den log2 forholdet med SPCC metoden betydelig forskjøvet til høyre i forhold til den dPCC metode. Et høyere antall mirnas i SPCC metode hadde negative korrelerer gener, som ble kansellert ut ved tilfeldig støy i dPCC metoden (medianverdi var omtrent null). Den kumulative kurven av rsPCC var lik som dPCC, men var signifikant forskjellig fra SPCC. Dette viser at SPCC metoden var mer effektiv i å detektere negative korrelasjoner enn både den dPCC eller rsPCC metode.

(A) Kumulativ plott av log2 forholdet mellom negativt vs. positivt korrelerer gen-tall for 136 mirnas beregnet med den dPCC, SPCC og rsPCC metoder, henholdsvis. X-aksen betegner log2 ratio verdiene av 136 mirnas henhold til deres rangering fra laveste til høyeste, og Y-aksen betegner den kumulative brøkdel av 136 miRNAs. Forskjellene i de kumulative kurver ble målt ved ensidig Kolmogorov-Smirnov test. (B) Sammenligning av tre metoder for å identifisere de mest sannsynlig bevart TargetScan spådd mål i det menneskelige genom (totalt 33 535 spådd rettet mot hendelser). Target spådommer ble rangert etter total sammenheng score fra høyeste til laveste. Trinnvis fra topp 50 til topp 500 miRNA-genet parene med høyest total sammenheng score, ble forholdet verdiene av negativ kontra positiv korrelasjon tall beregnet og plottet for de tre metodene.

Neste vi søkt å sammenligne effektiviteten av de tre metodene i å oppdage spådd mål. Vi valgte TargetScan, et mye brukt mål prediksjon algoritme, for å sette sammen en liste over alle menneskelige miRNA-genet parene som involverer de 136 miRNAs. Listen ble sortert etter total sammenheng poengsum (definert av TargetScan for de konserverte mål) fra høyeste til laveste (tabell S3). Deretter trinnvis fra topp 50 til topp 500 miRNA-genet parene ble prosenter av negativ kontra positiv korrelasjon tall beregnet og plottet. Bare med den SPCC metode økte dette forholdet sammen med økningen av total sammenheng stillingen (figur 1B). Derfor resultater for alle sammenhenger og korrelasjoner med hensyn til anslåtte mål både antydet at SPCC metoden utviklet seg vesentlig bedre på teoretisk nivå enn både dPCC eller rsPCC metoden.

Den SPCC Metoden påviser nøyaktig uttrykk for miRNAs som er knyttet til én vertsgener, så vel som til klynger av

HOX

gener

i tillegg til det teoretiske nivå, var det nødvendig å teste evnen til det SPCC metode for å identifisere miRNA /gen tilkoblinger som er etablert i kjente biologiske systemer. Vi har derfor gjort bruk av både vert gener og homeobox (

HOX

) gener som har godt karakteriserte linker til uttrykk for visse miRNAs.

Mange mirnas er kodet innen samlokaliserte gener (vertsgener ) og dele arrangører med dem. Ekspresjon av disse mirnas er drevet av promoterene fra vertsgener, og positive korrelasjoner mellom ekspresjon av mirnas og deres verts gener har blitt rapportert [22], [24]. Ved å benytte denne informasjonen, analyserte vi hvor ofte co-transkripsjon av miRNAs og deres verts gener kan føre til positive korrelasjoner i NCI60 datasett. Av de 136 mirnas, er 65 kodet innen vertsgener (figur 2). I både SPCC og dPCC analyserer antall positive korrelasjoner mellom verts gener og deres samlokaliserte mirnas langt ut nummererte de negative korrelasjoner (Figur 2A og 2B). I motsetning til analysen med rsPCC metoden resulterte i en tilfeldig fordeling av positive og negative korrelasjoner (data ikke vist). Resultatene av SPCC /dPCC metoder var sammenlignbare, noe som tyder på at reproduserbarheten av NCI60 datasett var høy og SPCC metode for å identifisere korrelasjoner var så god som den dPCC metode i tilfellet med enkeltvertsgener.

(

A

) SPCC og (

B

) dPCCs verdier er gitt for de 73 miRNA /verts genet parene representert i Q-datasettet og genekspresjon datasett som forekom med i det minste en av de metoder. Ny analyse av dataene ved å sammenligne SPCC /30 med dPCC verdier med en cutoff på 0,2 viste at de to metodene ikke avviker i deres evne til å forutsi vertsgener (enten av paret t-test eller sammen Wilcoxon test).

Deretter ønsket vi å finne ut om SPCC metoden ville gi bedre resultater enn dPCC metode for å identifisere spesifikke co-transkripsjon. Vi tok fordel av

HOX

gener som et unikt system av fire genet klynger, som hver inneholder minst ett intergeniske miRNA.

HOX

genene regulerer embryoutvikling og hos pattedyr de er gruppert i 4 grupper (

Hoxa-D

) inkludert 9 til 11 gener [22], [24]. De fleste av Hox-genene ble positivt korrelert med samlokalisert mirnas (røde boksene i figur 3A). Interessant,

Hoxa

,

HOXC

, og

HOXD

klynger havn en miRNA gen hver og

HOXB

inneholder to (figur 3A). Vi først beregnet dPCCs og sPCCs mellom de fire mirnas (

MIR-10a

,

-10b

,

-196a

,

-196b

), som er kodet innenfor HOX klynger, og alle menneskelige gener. Vi observerte at i SPCC metoden, i tre av

4

av klyngene en HOX genet som grenser til samlokalisert mirnas hadde høyest positiv korrelasjon med disse mirnas av ~18,000 menneskelige gener (

MIR -196b Twitter /

HOXA9

,

MIR-196a Twitter /

HOXC10 Hotell og

Mir-10b Twitter /

HOXD8

; fet røde boksene i figur 3A). Men i dPCC metoden, dette var bare sant for to klynger (

MIR-196b Twitter /

HOXA10 Hotell og

MIR-196a Twitter /

HOXC10

) (data ikke vist). For hver av de 136 mirnas beregnet vi SPCC verdier med gener i 4

HOX

gensamlingene. De sPCCs til alle

HOX

gener i en klynge ble lagt opp og mirnas ble rangert i henhold til den kumulative SPCC for hver

HOX

klynge (figur S2). Bemerkelsesverdig, for hver gruppe var der en miRNA som tydeligst korrelert med ekspresjonen av

HOX

gener i den klyngen (rød kolonne i fig S2), og i hvert tilfelle var det miRNA kodet innenfor den klyngen. For ytterligere å sammenligne resultatene av SPCC og dPCC metoder vi plottet de kumulative SPCC og dPCC score for hvert

HOX

clusteret versus samkjøre mirnas (figur 3B og 3C). Den kumulative SPCC og dPCC av negativt korrelere

HOX

gener er også vist, men var ubetydelig. Vi har også tatt med

MIR-99a /99b Hotell og

MIR-100

i denne analysen fordi de deler utstrakt homologi med

MIR-10a Hotell og

Mir-10b

[25]. Igjen, SPCC gjorde det bedre enn dPCC metoden å detektere riktig

HOX

genet klynge for hver korrelere miRNA mot en minimal bakgrunnssignal fra andre klynger.

(

A

) Oppbygging av fire pattedyr

HOX

gensamlingene med plasseringen av vert miRNAs.

HOX

gener eske i rødt ble oppdaget som positivt korrelert med vert miRNA med SPCC metoden. For hver klynge

HOX

genet sterkest korrelert med miRNA som er i denne klyngen er eske i fet rød. (

B

) sPCCs av alle individuelle

HOX

gener i hver klynge ble kumulert og plottet mot medlemmer av

MIR-10 Twitter /

MIR-196

familie og

MIR-99a

,

-99b Hotell og

-100

. (

C

) Samme som

B

men generert ved hjelp av dPCC metoden.

I sammendraget, disse dataene viser at steady state system av NCI60 mRNA og miRNA data er nyttig for å påvise biologisk meningsfulle forbindelser mellom mirnas og deres verts gener. Den SPCC metoden, som er designet for å etterligne en miRNA titrering eksperiment, var overlegen til dPCC metoden i to analyser (negativ korrelasjon med uttrykt mRNA og

HOX

clusteret korrelasjon) som brukes for å karakterisere vår tilnærming. Den SPCC Metoden ble derfor brukt i senere analyser.

miRConnect.org, en søkbar web-grensesnitt for å utforske sammenhenger mellom mirnas og deres biologiske effektor gener

Som introdusert ovenfor, i tillegg til selve målet gener, gener som ikke er spådd å være miRNA mål samt det store antall både positivt og negativt samkjøre gener kan holde viktig informasjon med hensyn til status for miRNA cellular uttrykk nivåer, noe som kan gi innsikt i de biologiske aktiviteter miRNAs. Alle negativt og positivt korrelerer gener for 136 miRNA og de 25 miRNA familier fastsatt med både dPCC og SPCC metode i Q-datasettet, samt informasjon om hvor mange av dem er spådd mål ved TargetScan 5.0, kan bli funnet henhold miRConnect-Q på en søkbar webgrensesnitt: miRConnect.org (eller miRConnect.net)

Clustering av miRNAs basert på overlapping av sine samkjøre gener

Våre data antydet at bruk av NCI60 datasett og SPCC metoden kan være nyttig for å oppdage biologisk relevante sammenhenger mellom mirnas og deres nedstrøms effektor gener, noe som kan gi ny innsikt i biologiske aktiviteter av miRNAs. Vi hevdet at gener enten negativt eller positivt korrelert med en spesifikk miRNA vil være like viktig fordi hvert sett kan inneholde markører for en biologisk status regulert i motsatte retninger. For eksempel

E-cadherin Hotell og

vimentin

som positivt og negativt korrelert med uttrykk for

MIR-200

familie, henholdsvis (

CDH1

og

VIM

i tabell 1), begge peker på EMT-relatert funksjon av

MIR-200

. Derfor foreslo vi at enten negative eller positive korrelasjoner kan uavhengig definere en spesifikk biologisk status for en miRNA eller en gruppe av miRNAs.

For å teste denne antakelsen, valgte vi toppen 2000 positive og topp 2000 negative korrelasjoner og de tilsvarende gener for hver av 136 miRNAs, og utført en hierarkisk clustering å gruppere de 136 miRNAs. Vi valgte 2000 som en cutoff fordi dette tallet dekket omtrent 10% av alle gener, noe som bør resultere i eliminering av de bakgrunnsstøy. Clustering, som er basert på parvise sammenligninger representerer skjæringspunktet mellom de genene som i vesentlig grad korrelerer i deres ekspresjon med ekspresjonen av to forskjellige mirnas (figur 4 og figur S3). Når positivt samkjøre genene ble vurdert, en rekke mirnas tett klynget sammen (figur 4). På samme måte mange av de samme mirnas gruppert sammen når negativt korrelerer-gener ble anvendt (figur S3). Selv om mange mekanismer kan være ansvarlig for dette clustering, vil vi referere til disse som «funksjonelle klynger».

mirnas ble delt inn i 13 funksjonelle klynger (I-XIII). Informasjon er gitt for hver miRNA på vev bestemt uttrykk, genomisk samlokalisering, og frø familie. Stiplede linjen. Grensen på 12,5% av gruppene som ble valgt til definerte de 13 klyngene

Interessant, alle 5 medlemmer av

MIR-200

familie ble tett samlet, konsistent med deres tilsvarende biologisk aktivitet (klynge i i figur 4 og klynge VI på fig S3). I tillegg til

MIR-200

, en rekke andre strukturelt beslektede mirnas dannes funksjonelle grupper i henhold til de delte antall deres effektor-gener. Flere frø familier, som

MIR-181abc

,

MIR-19ab

,

MIR-221/222

,

MIR-103/107 Hotell og

MIR-135ab

, ble gruppert sammen tett. I kontrast, ble medlemmer av flere andre frø familier funnet spredt over ulike funksjonelle grupper (f.eks

la-7

eller

MIR-30

familie). Dette fenomenet antydet at gruppering av miRNAs ble delvis basert på, men ikke begrenset til miRNA frø sekvenser.

clustering av miRNAs i denne analysen var delvis på grunn av det faktum at noen familiemedlemmer er en del av det samme transkripsjonen enhet. mirnas som deler kromosom samlokalisering og også funnet i de samme funksjonelle klynger inkludert transkripsjons enheter av

MIR-106b /93/25

,

MIR-17~92

,

MIR -194-2/192

,

MIR-183~182

,

MIR-99b /la-7e /125a

,

MIR-206 /133b

.

i noen tilfeller miRNA clustering var basert på verken frø kampen heller genomisk lokalisering. For eksempel medlemmer av både

MIR-141 /200a Hotell og

MIR-200BC /429

frø familier ble gruppert sammen selv om de utgjør to gensamlingene på separate kromosomer (cluster jeg » Gene cluster «-kolonnen i figur 4).

NCI60 cellelinjer representerer 9 forskjellige kreft hos mennesker. For å avgjøre om den observerte gruppering av miRNAs var delvis på grunn av vev bestemt uttrykk for enten mirnas eller mRNA, identifiserte vi mirnas som ble fortrinnsvis uttrykt i noen av de 9 humane krefttyper (tabell S4, tabell S5). Noen korrelasjoner med vev av opprinnelse ble funnet. For eksempel både klynger I (inkludert

MIR-200

familie og

MIR-194

) og XI (inkludert

MIR-30

familie) inneholdt det meste av miRNAs som er beriket i tykktarm kreft celler (figur 4). Colon kreft celler kan ha en mer epitel-lignende karakteristikk enn de fleste andre kreftcellelinjer.

I sammendraget, disse dataene antydet at mens vanlige frø sekvenser, kromosom samlokalisering og vev bestemt uttrykk sannsynlig påvirket co- uttrykk for miRNAs med visse gener og dermed deres gruppering, ble mange mirnas gruppert av andre grunner. En viktig faktor som bestemmer gruppering kan være den biologiske funksjonen til en miRNA, siden clustering er basert på skjæringspunktet mellom gensettene som positivt korrelerer signifikant med to sammenkoblede mirnas. For eksempel

MIR-200

,

-203

,

-375 Hotell og

-7

, som er gruppert sammen i Figur 4 og Figur S3 , har ikke den samme frø-sekvensen, genomisk colocalization eller spesifikk ekspresjon i samme vev. Grunnen for dem å gruppere sammen synes å være at de deler lignende biologisk funksjon i EMT regulering.

Identifikasjon av miRNA familier som er involvert i cellevekst regulering

c-MYC

er ikke bare en generell regulator av miRNA funksjon og ekspresjon, men også i seg selv regulert av mirnas [26], [27]. For å avgjøre om gruppering mirnas henhold til identiteten til korrelere gener vil oppdage sammenhengen mellom mirnas og

c-MYC

, brukte vi lister over gener som enten er oppregulert (460 gener) eller nedregulert (211 gener) ved

c-MYC product: (hentet fra https://www.myc-cancer-gene.org/) og bestemt hvor mange av dem ble enten positivt eller negativt korrelert med uttrykk for hver av de 136 miRNAs. Resultatet er anskueliggjort på figur 5. Betydningen av anrikning av korrelerer genene ble bestemt ved å utføre en Wilcoxon Rank-Sum Test. Signifikansnivået er angitt med bokser med forskjellige farger. Åpenbart enkelte klynger av mirnas var positivt, og andre var negativt korrelert med enten

c-MYC

indusert eller

c-MYC

trykt gener.

Legg att eit svar