PLoS ONE: Dysfunksjoner Associated med Metylering, mikroRNA Expression og genuttrykk i Lung Cancer

Abstract

Integrering high-throughput data fra ulike molekylære nivåer er avgjørende for å forstå mekanismene for komplekse sykdommer som kreft. I denne studien er integrert vi metylering, mikroRNA og mRNA data fra lungekreft vev og normalt lungevev ved hjelp av funksjonelt gen sett. For hver Gene ontologi (GO) sikt, ble tre sett definert: metylering settet, mikroRNA sett og mRNA sett. Den diskriminerende evne til hvert gen sett var representert ved Matthews korrelasjonskoeffisient (MCC), som vurderes av leave-one-out kryssvalidering (LOOCV). Deretter ble MCC-ene i metylering sett, de mikroRNA sett og mRNA-settene rangert. Ved å sammenligne MCC rekkene av metylering, mikroRNA og mRNA for hver GO sikt, klassifisert vi GO setter inn i seks grupper og identifisert den dysfunksjonelle metylering, mikroRNA og mRNA gensettene i lungekreft. Våre resultater gir en systematisk oversikt over de funksjonelle endringer i tumordannelse som kan bidra til å belyse mekanismene for lungekreft og føre til bedre behandling for pasienter

Citation. Huang T, Jiang M, Kong X, Cai YD ( 2012) Dysfunksjoner Associated med Metylering, mikroRNA Expression og genuttrykk i lungekreft. PLoS ONE 7 (8): e43441. doi: 10,1371 /journal.pone.0043441

Redaktør: Daotai Nie, Southern Illinois University School of Medicine, USA

mottatt: 08.12.2011; Godkjent: 23 juli 2012; Publisert: 17 august 2012

Copyright: © Huang et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet med tilskudd fra National Basic Research Program of China (2011CB510102, 2011CB510101, 2011CB910200 og 2010CB912702), Natural Science Foundation National of China (90913009), Research Program av den kinesiske Academy of Sciences (KSCX2-EW-R-04) og innovasjonsprogram av Shanghai Municipal Education Commission (12ZZ087). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kreft er en systembiologi sykdom [1] som innebærer feilregulering av flere veier på flere nivåer [2]. Høy throughput teknologier, for eksempel genomsekvensering og transcriptomic, proteomikk og metabolomic profilering, har gitt store mengder forskningsdata. Imidlertid krever systembiologi ikke bare nye high-throughput «-omics» data-generasjons teknologi, men også integrerende analysemetoder som kan kaste lys over mulige mekanismer for komplekse sykdommer. Lungekreft er en av de viktigste årsakene til kreft død på verdensbasis [3]. Det er for tiden kjent genetisk, epigenetisk, transcriptomic, proteomikk, metabolomic, og mikroRNA markører for lungekreft [4]. Fordi forekomme epigenetiske forandringer tidlig under tumorgenese, bør metylering markører betraktes [4]. Proteinet er den endelige, funksjonell form av den genetiske informasjonen; derfor, proteomikk markørene er også viktig. Transcriptomic markører er lett å måle, og mRNA nivåer er ofte brukt som en proxy for protein overflod [5]. MikroRNA, som en viktig regulerende bidragsyter, er også en utmerket lungekreft biomarkør [6], [7]. Hvorvidt en metylering markør, mRNA markør, eller mikroRNA markør vurderes, disse markørene funksjon ved å påvirke biologiske mekanismer eller nettverk. De funksjonelle banene er de vanlige broer mellom forskjellige markører og sykdommen

For tiden er det flere studier på multi-dimensjonal dataintegrering [8] -. [11]. De fleste av dem er basert på regresjon mellom ulike dimensjoner [10], og krever at hver prøve for å ha flere nivådata [11]. De dysfunksjonelle banene ble identifisert ved anrikning analyse av avvikende gener [9].

I denne studien vi direkte analysere dysfunksjoner av ikke-småcellet lungekreft (NSCLC) ved å sammenligne de funksjonelle sett av metylering, og mikroRNA mRNA data mellom lungekreft vev og normal lunge vev. Alle de funksjonelle sett tilsvarer en Gene ontologi (GO) [12] sikt. Tre sett med denne funksjonelle enheten er definert: metylering settet, mikroRNA sett og mRNA sett. Matthews Korrelasjonskoeffisienten (MCC), evaluert ved leave-on-out kryssvalidering (LOOCV), blir brukt til å representere den diskriminerende evne til hvert gen set. MCC rekkene av hver metylering sett, mikroRNA sett og mRNA sett er analysert. Seks grupper av GO sett er klassifisert, og 20 dysfunksjonell metylering, er mikroRNA og mRNA gensettene i lungekreft identifisert. Disse dysfunksjonelle sett karakterisere prosesser tumorigenesis. Med en nøyaktig karakterisering av tumordannelse, kan vi bedre forstå mekanismene for lungekreft og forbedre tidlig diagnostisering, behandling effektivitet evaluering, og prognosen for lungekreft.

Materialer og Metoder

datasett

Vi har lastet ned de metylering profiler av 1,413 gener i 57 NSCLC pasienter og 52 kontrollprøver [13] fra GEO (Gene Expression Omnibus) med tiltredelse nummer GSE16559. De mikroRNA uttrykk profiler av 549 microRNAs i 187 NSCLC pasienter og 188 kontrollprøver [14] ble hentet fra GEO med tiltredelse nummer GSE15008. De mRNA genuttrykk profiler av hadde 19.700 gener i 46 NSCLC pasienter og 45 kontrollprøver [15] ble oppnådd fra GEO med tiltredelse antall GSE18842.

Siden metylering data, mikroRNA data og mRNA data ble innhentet fra ulike NSCLC studier, vi sammenlignet klinisk informasjon av pasienter fra disse tre studiene. De to typer klinisk informasjon som ble gitt i minst to studiene var alder, og grad av differensiering. Den kliniske opplysninger fra disse tre studiene er vist i Tabell 1. Gjennomsnittsalderen for pasienter fra metylering studien er 68,2 og deres standardavviket er 11,4; i mellomtiden, gjennomsnittsalderen for pasienter fra mikroRNA studien er 59,9 og standardavviket er 9,8. Alderen pasienter i disse to studiene er like. De prosenter av godt, moderately- og dårlig differensierte kreftpasienter i mikroRNA studien og mRNA studien wereand hhv. Fordelingen av karakterer av differensiering i disse to studiene var svært like. Basert på tilgjengelig klinisk informasjon om disse NSCLC pasienter, tror vi at disse tre datasettene kan representere noen vanlige dysfunksjoner av NSCLC.

Målgenene av microRNAs

Vi definerer målet gener av microRNAs å være de som ble spådd av minst tre av følgende seks programvareverktøy: miRBase [16] (https://microrna.sanger.ac.uk/targets/v5/), TargetScan [17] ( https://www.targetscan.org/), Miranda [18] (https://www.microrna.org/microrna/), TarBase [19] (https://diana.cslab.ece.ntua.gr/tarbase /), mirTarget2 [20] (https://mirdb.org/miRDB/download.html), og PicTar [21] (https://pictar.mdc-berlin.de/). Tabell S1 gir mikroRNA -. Målet genet parene som er spådd av minst tre verktøy

De GO gensettene for metylering, mikroRNA og mRNA

For hver GO sikt, definerer vi tre gensettene å representere det: først, metylering genet sett, som består av gener som er kommentert til GO sikt og hvor metylering nivået har blitt målt; sekund, mikroRNA genet sett, som består av microRNAs som har målgener kommenterte til dette begrepet; og tredje, mRNA genet sett, som består av alle genene kommenterte til dette begrepet.

Den diskriminerende evne gensettene

Vi har evaluert den diskriminerende evne gensettene ved å konstruere en prediksjon modell . Først nærmeste nabo algoritme (NNA) [5], [22] – [30] ble brukt til å bygge prediksjon modell. Deretter ble prediksjonsmodeller testet under anvendelse av LOOCV [5], [22] – [31]. Til slutt, Matthews korrelasjonskoeffisienten (MCC) [26], [30] fra LOOCV ble anvendt som målingen av genet settet diskriminerende evne

NNA [5], [22] -. [30] er en mye brukt maskin læringsmetode. Den NNA gjør sin forutsigelse ved å sammenligne avstandene mellom spørringen prøven og prøver med kjente klasser, dvs. lungekreft prøver eller kontrollprøver. Forespørselen Prøven ble forutsagt å ha den samme klasse som nærmeste nabo, dvs. prøven med kjent klasse som har den minste avstanden. I denne analysen, er avstanden mellom to stikkprøver og er definert som en minus cosinus likheten mellom de to prøvene [5], [23] – [27], [30], [32] – [34] 🙁 en)

NNA programmet kan lastes ned fra https://pcal.biosino.org/NNA.html.

i løpet LOOCV [32], [35], [36], hver prøve i referansedatasettet vil bli valgt som test satt en gang og testet av prognosemodellen trent av resten av prøvene.

Matthews korrelasjonskoeffisient (MCC) er en balansert måling av prediksjon ytelse som tar hensyn til både sensitivitet og spesifisitet [26], [30]. Den beregnes ved hjelp av følgende formel:. (2) hvor TP, TN, FP og FN er tallet på sanne lungekreftprøver, true kontrollprøver, falske lungekreft prøver og falske kontrollprøver, henholdsvis

Klassifisering av gensettene basert på deres dysfunksjonelle nivå: metylering, mikroRNA eller mRNA

Etter vi beregnet MCC av hvert gen satt på hvert nivå, rangert vi gense sett av hvert nivå basert på deres MCC og sammenlignet rekkene av de tre nivåene, metylering, mikroRNA og mRNA, i hvert gen sett. Med visse verdier viser seg å være like, ble deres rekker erstattet av sine middel rekker. Som et eksempel på en GO sikt, hvis dens metylering nivået hadde endret seg mellom normale og kreftvevet, men dens mikroRNA og mRNA-nivåer hadde ikke forandret seg, det ble definert som en metylering dysfunksjonell GO-genet sett. På samme måte kan vi definere andre typer GO gensettene. Totalt definerte vi seks grupper av gensettene, ett for hver mulig rang bestilling av metylering, mikroRNA og mRNA.

Arbeidet flyten av dysfunksjonell metylering, mikroRNA og mRNA genet sett analyse

strategi dysfunksjonell metylering, er mikroRNA og mRNA genet sett analyse viste i figur 1. Først, for hver GO sikt, vi definert tre sett: metylering satt, mikroRNA sett og mRNA sett. Deretter beregnet vi hvert gen sett MCC, som vurderes av LOOCV. Vi rangert MCC-ene i metylering sett, de mikroRNA sett og mRNA-sett. Deretter sammenlignet vi MCC rekkene av metylering, mikroRNA og mRNA i hvert GO sikt og klassifisert GO setter inn i seks grupper basert på disse rekkene. Til slutt har vi identifisert den dysfunksjonelle metylering, mikroRNA og mRNA gensettene i lungekreft

Først, for hver Gene ontologi (GO) sikt, vi definert tre gensettene. Metylering settet, mikroRNA-apparatet og mRNA sett. Deretter beregnet vi Matthews korrelasjonskoeffisient (MCC), som vurderes av leave-one-out kryssvalidering (LOOCV), for hvert gen sett. Deretter rangeres vi MCC-ene i metylering sett, de mikroRNA sett og mRNA-sett, og vi sammenlignet MCC rekkene av metylering, mikroRNA og mRNA for hver Gene ontologi (GO) sikt og klassifisert GO setter inn i seks grupper. Til slutt har vi identifisert den dysfunksjonelle metylering, mikroRNA og mRNA gensettene i lungekreft.

Resultater og Diskusjon

De GO gensettene av metylering, mikroRNA og mRNA

Vi krysser refererte de tre datasettene som målte metylering, mikroRNA og mRNA av lungekreft vev og kontroll vev med GO og funnet 4,381 GO gensettene som har metylering, mikroRNA og mRNA-data. De tre nivåer av gensettene for disse 4,381 GO vilkårene ble utarbeidet som følger: metylering sett for hver GO sikt består av genene som hadde metylering data og ble kommentert i dette begrepet, den mikroRNA Settet består av microRNAs som hadde målgener kommentert til dette begrepet, og mRNA settet~~POS=HEADCOMP består av alle de gener som ble kommentert i dette begrepet. De 4,381 GO sett av mRNA, mikroRNA og metylering kan bli funnet i Dataset S1, Dataset S2 og Datasett S3 hhv.

Den diskriminerende evne til metylering, mikroRNA og mRNA gensettene

målte evnen til genet sett til å diskriminere mellom kreft og normalt vev ved hjelp av Matthews korrelasjonskoeffisienten (MCC) til NNA forutsigelse modellen evaluert av LOOCV. Vi sammenlignet MCC av metylering, mikroRNA og mRNA. Figur 2 viser MCC distribusjoner av metylering, mikroRNA og mRNA gensettene. Den gjennomsnittlige MCC av mRNA, mikroRNA og metylering gensettene er 0,897, 0,702 og 0,561, henholdsvis. Den ene-side-økt t-test p-verdi for mRNA og mikroRNA setter er mindre enn 2.2E-16. Den ene-side-økt t-test p-verdi for mikroRNA og metylering sett er også mindre enn 2.2E-16. Disse resultater indikerer at den MCC av mRNA-settene er betydelig større enn den MCC-ene av de mikroRNA sett, som i sin tur betydelig større enn MCC-ene av de metylering settene.

Middelverdien MCC av mRNA, mikroRNA og metylering gensettene var 0,897, 0,702 og 0,561, henholdsvis. Den MCC av mRNA settene var signifikant større enn den MCC-ene av de mikroRNA setter med en ensidig t-test p-verdi på mindre enn 2.2E-16, og MCC-ene av de mikroRNA settene var i sin tur signifikant større enn MCC-ene av metylering setter med en ensidig t-test p-verdi på mindre enn 2.2E-16.

de grønne linjene viser tumorprøver og de blå søylene angir normale prøver. Tumor og normale prøver ble tydelig differensiert etter de høye frekvens gener.

De grønne noder betegne høyfrekvente microRNAs. De røde noder betegne høyfrekvente gener i både metylering og mRNA dysfunksjonelle sett. De gule nodene indikerer høy frekvens gener i bare mRNA dysfunksjonelle sett. Det finnes ingen spesifikk høyfrekvent genet i metylering dysfunksjonelle sett. De hvite noder indikerer ikke-høyfrekvente gener. De sorte kanter viser interaksjoner fra KEGG bane «hsa05223 Ikke-småcellet lungekreft». De grønne kanter viser regulering av høyfrekvente microRNAs på sine målgener

Klassifisering av gensettene basert på deres dysfunksjonelle nivå. Metylering, mikroRNA eller mRNA

Ved å sammenligne MCC rekkene av genet sett på metylering, mikroRNA eller mRNA nivå, definert vi seks grupper av gensettene. Det er 960 gensettene der metylering rang mikroRNA rang mRNA rang; 638 gensettene der metylering rang mRNA rang mikroRNA rang; 721 gensettene der mikroRNA rang metylering rang mRNA rang; 684 gensettene der mikroRNA rang mRNA rang metylering rang; 584 gensettene der mRNA rang metylering rang mikroRNA rang; og 794 gensettene der mRNA rang mikroRNA rang metylering rang. Tabell S2 viser metylering, mikroRNA og mRNA dysfunksjon grupper av 4,381 GO gensettene.

Den dysfunksjonelle gensettene i lungekreft

Vi rangert de dysfunksjonelle gensettene i lungekreft basert på summert MCC rangerer av metylering, mikroRNA og mRNA. De 20 beste dysfunksjonell gensettene i lungekreft vist i tabell S3 ble analysert. Disse 20 dysfunksjonelle gensettene i lungekreft er GO: 0048585 (negativ regulering av respons på stimuli), GO: 0007517 (muskel organ utvikling), GO: 0048514 (blodåre morphogenesis), GO: 0051146 (tverrstripet muskelcelledifferensiering), GO : 0001525 (angiogenese), GO: 0045595 (regulering av celledifferensiering), GO: 0007162 (negativ regulering av celle adhesjon), GO: 0060191 (regulering av lipase aktivitet), GO: 0006275 (regulering av DNA-replikasjon), GO: 0061061 (muskelstruktur utvikling), GO: 0022008 (neurogenesis), GO: 0008543 (fibroblast growth factor receptor signalveien), GO: 0035107 (vedheng morphogenesis), GO: 0035108 (lem morphogenesis), GO: 0001568 (blodåre utvikling), GO: 0005576 (ekstracellulære region), GO: 0050793 (regulering av utviklingsprosesser), GO: 0010648 (negativ regulering av cellekommunikasjon), GO: 0023057 (negativ regulering av signalering), og GO: 0019216 (regulering av lipid metabolske prosesser) . Mange av disse GO vilkårene har blitt rapportert å være assosiert med lungekreft. Vi analyserer flere GO sett som eksempler

GO. 0045595 (regulering av celledifferensiering, rangert

th 6) og GO. 0050793 (regulering av utviklingsprosesser, rangert

th 17)

Utviklingsprosesser og celledifferensiering er regulert av en rekke lignende gener i normale vev. Derfor blir endringer i disse genene ofte assosiert med kreftutvikling. Naveen Babbar et al. rapportert at TNFa kan aktivere NFkB signalering i NSCLC-celler [37], noe som resulterer i redusert cellevekst og øke apoptose [37]. En rolle for FGF /FGFr familiemedlemmer har også blitt antydet i lungekreft. For eksempel ble hyppig forsterkning av FGFR1 identifisert i humant plateepitelkreft lungekreft [38]. I tillegg ble somatiske mutasjoner i flere av disse genene identifisert i lungekarsinomer, inkludert FGFR1, FGFR2, og FGF2 /10 [39] – [42]. Vanligvis, tumorsuppressorgener slik som P53, CDKN2A /B, og STK11, blir nedregulert, og onkogener (for eksempel KRAS og ErbB2 /4) blir oppregulert i lungekreft [40]. MicroRNAs er involvert i lungekreft på grunn av den epigenetiske endringer som oppstår i kreftceller. Den lave ekspresjon av MIR-200 og MIR-205 er forbundet med den epiteliale-mesenkymale overgang (EMT) og stamcelle-lignende egenskaper til kreftceller og fremmer invasjon og translokasjon [43] – [45]. Den håndheves uttrykk for MIR-29 familiemedlemmer i lungekreftceller kan gjenopprette normale mønstre av DNA metylering, indusere re-uttrykk for metylering-forstummet tumorsuppressorgener som FHIT og WWOX, og hemme tumorgenisiteten [46].

GO: 0022008 (neurogenesis, rangert

th 11)

Flere gener kommenterte på denne GO sikt er forbundet med Acantha og hjernemetastaser,. for eksempel ble mutasjoner i aktivering av epidermal vekstfaktor-reseptor (EGFR) som finnes i mange lungekreftpasienter [47]. Menneskelig lungekreft har omfattende endringer av mikroRNA uttrykk som kan deregulere kreftrelaterte gener; for eksempel HSA-MIR-125a-5p stanse uregulert ROCK1, Mir-34b metylering forårsaket c-Met overekspresjon, og MIR-200c ble brakt til taushet av metylering og downregulated TCF8 og E-cadherin, noe som resulterte i kreft invasjon og forringelse [48] – [50]. Demetylering og mutasjon i gener (erbB2, KRAS) kan også føre til kreftutvikling [51], [52]. Metylering av døds-assosiert proteinkinase (DAPK) promotor og opioidet bindende protein /celleadhesjonsmolekyl-lignende gen (OPCML) har blitt funnet i både adenokarsinom og plateepitelkreft [53], [54].

GO: 0005576 (ekstracellulære region, rangert

th 16)

epithelial Mesenchymale Transition (EMT) er den viktigste prosessen som kreves for tumorinvasjon og trans.. Mutasjoner i TIMP3 er LAMA /B /C, TMEFF2, CDH13 og andre gener involvert i lungekreft forverring [55]. IL-8 kan initiere en airway epithelial signalveien, og deregulering av dette genet kan føre til tobakksrelatert lungekreft [56]. Fem microRNAs (HSA-MIR-155, HSA-MIR-17-3p, HSA-la-7a-2, HSA-MIR-145, og HSA-MIR-21) er sett til å bli uttrykt forskjellig i lungekreft vev versus tilsvar noncancerous lunge vev. Blant disse microRNAs, la-7a kan regulere RAS aktivitet [57]. Epigenetisk aktivering av human kallikrein 13 (KLK13) forbedrer malignitet av lunge adenokarsinom ved å fremme N-cadherin uttrykk og laminin degradering [58]. Nylig, MMP1 ble rapportert å være assosiert med lungekreft. Den -16071G-2G polymorfisme av MMP1 resultater i transkripsjonen opp regulering [58]. X Xiang et al. rapporterte at stabil ekspresjon av MIR-155 reduserer aggressivitet av tumorcelle spredning i betydelig grad ved å hindre EMT av tumorceller in vivo [59]. Videre MIR-155 direkte undertrykker uttrykk for transkripsjonsfaktoren TCF4, som er en viktig regulator av EMT [59].

De høyfrekvente gener og microRNAs i toppen dysfunksjonelle gensettene

Vi beregnet hyppigheten av gener eller microRNAs i topp 300 dysfunksjonelle gensettene. Genene i enten mRNA eller metylering gensettene med frekvens som er høyere enn 50 ble definert som høyfrekvente gener. Tilsvarende ble de høyfrekvente microRNAs definert som microRNAs som har frekvens høyere enn 50 på topp 300 dysfunksjonelle gensettene. Den høye frekvens gener og microRNAs er gitt i tabell S4.

Vi testet diskriminerende evne til disse høyfrekvente genene i en uavhengig datasett som omfatter 58 lungekreft prøver og 58 tilstøtende normale prøver. Den uavhengige datasett ble lastet ned fra GEO med tiltredelse nummer GSE32863. Det ble funnet at de høyfrekvente genene kan perfekt differensiere lungekreft vev fra tilstøtende normale vev. Prediksjonen MCC var 1, noe som betyr at alle prøvene ble korrekt klassifisert i deres faktiske gruppe, tumor eller normal. Heatmap av de høye frekvens genene og tumor /normale prøver er vist i figur 3. De tumor- og normale prøver ble tydelig differensiert av de høye frekvens-genene.

Vi gjorde en hypergeometriske test [5], [24 ], [25], [32], [36] for å undersøke om de høyfrekvente genene er betydelig overlappes med KEGG bane «hsa05223 ikke-småcellet lungekreft». Den hypergeometriske test p-verdien var en svært signifikant 1.61E-26. Dette resultatet tyder på at mange høyere frekvens gener er kjent «hsa05223 Ikke-småcellet lungekreft» gener.

I figur 4 har vi fremhevet de høyfrekvente genene vi oppdaget i KEGG bane «hsa05223 Ikke-småcellet lungekreft kreft». Mange hub gener fra KEGG pathway «hsa05223 Ikke-småcellet lungekreft» var høyfrekvente dysfunksjonelle gener som KRAS, EGFR, ErbB2, CDKN2A og RB1. Og navet høyfrekvens gener har en tendens til å være dysfunksjonell både ved metylering og mRNA-nivåer. Det er kjent at KRAS kan initiere tumorgenesis ved å påvirke endodermal progenitor [60]. Kopiantallet endringer av KRAS er sterkt forbundet med kliniske utfall av lungekreftpasienter [61]. EGFR er en reseptor av epidermal vekstfaktor familien. Binding av EGFR til en ligand vil indusere celleproliferasjon [62]. EGFR mutasjoner er svært vanlig i lungekreft [63] og er forbundet med prognose for NSCLC [64]. De kan endre signal kaskader av NSCLC [65]. ErbB2 er mutert i 4% av NSCLC [66] og dets polymorfismer øke faren for lungekreft [67]. Metylering av CDKN2A forekommer oftere hos NSCLC vev enn hos ikke-tumorvev [68]. CDKN2A er involvert i p16 /pRb /cyclin-D1 veien [69]. RB1 kan regulere celleproliferering, differensiering og apoptose i humane NSCLC [70]. I avanserte NSCLC, er frekvensen av Rb tap høy [71].

i figur 4, er det noen høyfrekvente microRNAs, slik som HSA-MIR-495, HSA-MIR-96, har-MIR -106a har-MIR-137, har-MIR-372, HSA-MIR-183, HSA-MIR-182, HSA-MIR-203, HSA-MIR-15a, HSA-MIR-15b og HSA-MIR-7 . HSA-MIR-495 regulerer to høyfrekvente dysfunksjonelle gener, STK4 og PRKCB. Det ble rapportert at MIR-495 er oppregulert i KRAS-positiv NSCLC [72]. HSA-MIR-96 er nedregulert i NSCLC [73]. har-MIR-106a er relatert til lungekreft pasienten overlevelse [56]. Pasienter med høyt uttrykk for har-MIR-106a har en tendens til å ha en dårligere prognose [56]. har-MIR-137 og har-MIR-372 er både oppregulert i NSCLC og deres uttrykk nivåer er assosiert med overlevelse og tilbakefall hos NSCLC pasienter [74]. har-MIR-183 er en potensiell metastase-hemmer av lungekreft og kan regulere migrasjon og invasjon gener [75]. HSA-MIR-183 og HSA-MIR-182 ble rapportert som de forskjellig uttrykt microRNAs mellom lungekreft vev med tilstøtende normalt vev [76]. HSA-MIR-203 er oppregulert i lungekreft vev [56]. HSA-MIR-15a blir ofte slettet eller nedregulert i NSCLC [77] og dets ekspresjon inverst korrelert med ekspresjonen av cyclin D1 [77]. HSA-MIR-15 b er forskjellig uttrykt i tumor nekrose faktor (TNF) -relaterte apoptose-induserende ligand (TRAIL) resistente NSCLC celler [73]. HSA-MIR-7 er nedregulert i lungekreft, og det kan regulere epidermal vekstfaktor reseptor signalisering [78].

De fordeler og begrensninger av våre metoder

Innhenting av en systematisk forståelse av patologiske endringer er et viktig problem i medisinske og farmasøytiske studier. Tumorigenesis innebærer endringer i mange proteiner, molekyler og veier. Til slutt, men alle disse endringene føre til kreft gjennom funksjonelle effekter. I denne studien brukte vi GO for å beskrive biologiske funksjoner og stratifisert funksjonene inn i tre nivåer: metylering, mikroRNA og mRNA. I hvert nivå, beregnet vi og rangeres den diskriminerende evne til den funksjonelle satt for dette nivået som ble målt ved hjelp av MCC på riktig måte å klassifisere kreft og normale vev. For hvert funksjonssett, sammenlignet vi MCC rangeringen av hvert nivå, og vi senere gruppert funksjonssettene inn i seks mønstre basert på relasjoner av MCC rekkene av de ulike nivåene. Noen funksjonelle sett kan fungere på metylering nivå; andre kan fungere på mikroRNA nivå. Tar alle tre nivåer i betraktning, rangert vi funksjonssett basert på deres samlede rekker på tre nivåer. Den samlede rangeringen av de funksjonelle sett synes rimelig og er konsistent med flere publiserte studier.

Det er fortsatt flere begrensninger i denne forskningen. For det første, metylering, mikroRNA og mRNA-data for lungekreft og normale vev ble oppnådd fra ulike studier som kan påvirke resultatene. Ideelt sett alle data ville bli avledet fra den samme studien. For å delvis løse dette problemet, vi brukte MCC rang, i stedet for MCC seg selv, når man sammenligner mellom de ulike nivåene. For det andre er koblingene mellom microRNAs og deres mål gener basert på spådommer. På grunn av den lave andelen av eksperimentelt bekreftet mikroRNA og målet genet parene brukte vi mikroRNA og målet genet parene som ble spådd av minst tre populære mikroRNA target-genet prediktorer. For det tredje, ikke alle funksjonssett ble analysert. Metylering, ble mikroRNA og mRNA data vi brukte generert med microarray teknologi. Visse gener eller microRNAs ble ikke målt, særlig med hensyn til metylering status av gener. Med utviklingen av sekvenseringsteknologi og sekvensfangstteknologi, økende antall gener kan måles, slik at vi kan analysere mer funksjonelle sett og få et mer helhetlig syn på tumorigenesis.

Totalt våre metoder gi et middel til å utføre «multi-omics» dysfunksjonell sett analyse, noe som kan være nyttig ved undersøkelsen av komplekse sykdommer. Våre resultater gir en systematisk oversikt over tumorigenesis som kan kaste lys over diagnose og prognose for lungekreft.

Hjelpemiddel Informasjon

Dataset S1.

Den 4381 Gene ontologi (GO) sett av mRNA. Hver linje beskriver et gen sett. Det første feltet inneholder Gene ontologi (GO) sikt navn, inneholder det andre feltet antall mRNA i settet, og de resterende feltene liste mRNA i settet

doi:. 10,1371 /journal.pone.0043441.s001 product: (TXT)

datasett S2.

Den 4381 Gene ontologi (GO) sett av mikroRNA. Hver linje beskriver en mikroRNA sett. Det første feltet inneholder Gene ontologi (GO) sikt navn, inneholder det andre feltet antall microRNAs i settet, og de resterende feltene liste microRNAs i settet

doi:. 10,1371 /journal.pone.0043441.s002 product: (TXT)

datasett S3.

4381 Gene ontologi (GO) sett av metylering. Hver linje beskriver et gen sett. Det første feltet inneholder Gene ontologi (GO) sikt navn, inneholder det andre feltet antall gener i settet, og de resterende feltene liste genene i settet

doi:. 10,1371 /journal.pone.0043441.s003 product: (TXT)

Tabell S1.

mikroRNA – Målet genet parene som ble spådd av minst tre verktøy.

doi: 10,1371 /journal.pone.0043441.s004 plakater (XLSX)

Tabell S2.

metylering, mikroRNA og mRNA dysfunksjon grupper av 4381 Gene ontologi (GO) gensettene.

doi: 10,1371 /journal.pone.0043441.s005 plakater (XLSX)

tabell S3.

topp 20 dysfunksjonelle gensettene i lungekreft.

doi: 10,1371 /journal.pone.0043441.s006 product: (PDF)

Tabell S4.

Den høyfrekvente gener og microRNAs.

doi: 10,1371 /journal.pone.0043441.s007 plakater (XLSX)

Legg att eit svar