PLoS ONE: En Ensemble Prognostic Modell for tykktarmskreft

Abstract

Tykktarmskreft kan grupperes i Dukes A, B, C og D etapper basert på sin utvikling. Generelt sett, mer avanserte pasienter har dårligere prognose. Å integrere progresjon scenen prediksjon systemer med tilbakefall prediksjon systemer, vi foreslått et ensemble prognostisk modell for tykktarmskreft. I denne modellen, ble hver pasient gitt en mest mulig scene og et mest mulig gjentakelse status. Hvis en pasient ble spådd til å bli tilbakefall pasient i avansert stadium, ville han bli klassifisert i risikogruppe. Ensemblet modellen vurderes både progresjonstrinn og gjentakelse status. Høyrisikopasienter og lavrisikopasienter spådd av ensemblet modellen hadde en signifikant forskjellig sykdomsfri overlevelse (log-rank test p-verdi, 0,0016) og sykdomsspesifikk overlevelse (log-rank test p-verdi, 0,0041). Ensemblet modellen bedre kan skille høy risiko og lav risiko pasienter enn scenen prediksjon modellen og tilbakefall prediksjon modellen alene. Denne metoden kan brukes til studier av andre sykdommer, og det kunne gi en betydelig bedre prognose ytelsen ved ensembling heterogen informasjon

Citation. Li BQ, Huang T, Zhang J, Zhang N, Huang GH, Liu L, et al. (2013) En Ensemble Prognostic Modell for tykktarmskreft. PLoS ONE 8 (5): e63494. doi: 10,1371 /journal.pone.0063494

Redaktør: Jie Zheng, University of Akron, USA

mottatt: 04.02.2013; Godkjent: 03.04.2013; Publisert: 02.05.2013

Copyright: © 2013 Li et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet med tilskudd fra National Basic Research Program of China (2011CB510102, 2011CB510101), Innovasjon Program of Shanghai Municipal Education Commission (12ZZ087), og tildeling av «The førsteklasses Discipline of Universities in Shanghai». de bevilgende myndighet hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

tykktarmskreft (CRC) er en av de mest ondartede kreftformer. Dens forekomst og progresjon involvere komplisert utviklingsprosess påvirkes av flere gener [1]. I Amerika og Europa, er CRC den nest hyppigste kreft som fører til døden rangeringen nedenfor lungekreft [2]. Tidlig påvisning av CRC kan redusere sykelighet og bedre prognosen [3].

CRC kan grupperes i Dukes A, B, C og D etapper basert på sin utvikling [4]. Dukes «A karsinom er de begrenset til den innerste slimhinnen i tykktarmen eller endetarmen uten invaderende inn i extrarectal vev og ingen metastaser i lymfeknuter. Dukes «B karsinom er de som har invadert muskulaturen i tykktarmen eller endetarmen, men har ennå ikke involvert lymfesystemet. Karsinomer i Dukes «C har spredd seg til minst en regional lymfeknute. Mens Kreftsvulster av Dukes «D har spredning til et annet sted i kroppen som lever eller lunge [4]. I 1954 ble Dukes «etapper B og C videre inndelt i B1, B2 og C1, C2 av amerikanerne Astler og Coller [5]. B1 carcinoma var de hvor lesjoner har invadert inn muscularis propria med negative noder, men uten å trenge gjennom. Mens type B2 carcinoma var de hvor lesjoner har trengt inn i muscularis propria med negative noder. Kreftsvulster av type C1 har invadert inn muskularis propria med positive noder, men ikke har trengt gjennom. Mens de av typen C2 har trengt gjennom muskularis propria med positive noder. Utviklet mer enn 70 år siden, gir nå endret Dukes «iscenesettelse system tilstrekkelig prognostisk informasjon for pasienter i stadium A eller D. Men de mellomliggende stadier B og C er ikke så nyttig i diskriminerende god prognose pasienter fra fattige [6].

Så langt, ble microarray analyse brukt i flere studier på primære vevsprøver for å identifisere genekspresjon signaturer prediktiv av CRC prognose [6], [7]. Den generelle tilnærmingen for undertegning oppdagelse var å analysere pasienter valgt for gode og dårlige resultater, etterfulgt av vurdering av signaturen i flere tilfeller. Imidlertid er signatur funn basert på utfallet generelt uklar for pasienter som gjennomgår adjuvant behandling. Derfor er det vanskelig å skille markører for prognose fra de som behandlingen reaksjon [6], [7].

Det er blitt rapportert at ekspresjon forskjellene mellom ekstreme stadier av kreft kan brukes til å forutsi tilbakefall hos pasienter mellomliggende stadier. Fordeler med denne tilnærmingen er at ingen oppfølging data er nødvendig i tumorstadium basert oppdagelse og at konfunderende effekt av tidligere behandling kan unngås ved å velge pasienter som ikke har gjennomgått adjuvant behandling [8].

I denne studie, ved å kombinere progresjon scenen prediksjon systemer og tilbakefall prediksjon systemer, vi foreslått et ensemble prognostisk modell for CRC. Høyrisikopasienter og lavrisikopasienter spådd av ensemblet modellen hadde en signifikant forskjellig sykdomsfri overlevelse og sykdomsspesifikk overlevelse. Utførelsen av ensemblet modellen var bedre enn den scenen prognosemodellen og tilbakefall prediksjon modell alene.

Materialer og metoder

Datasett

genuttrykk profiler av ulike CRC stadier .

genuttrykk profiler av 290 CRC pasienter ble hentet fra NCBI Gene Expression Omnibus (GEO) (sjonsnummer: GSE14333), hvor 44 pasienter tilhørte Dukes fase A, 94 til scenen B, 91 med trinn C og 61 å iscenesette D, henholdsvis. Uttrykket profiler ble bestemt med Affymetrix menneskelige genom U133Plus 2,0 arrays avhør 19621 gener.

genuttrykk profiler av pasienter med og uten tilbakefall.

genuttrykk profiler av 77 CRC pasienter med tilbakefall og 121 CRC pasienter uten tilbakefall ble hentet fra GEO (sjonsnummer: GSE12032). Pasienter med og uten tilbakefall ble betegnet som 1, 0, respektivt. Uttrykket profiler ble bestemt med AceGene Menneskelig Oligo Chip 30K en Chip versjon avhør 10583 gener.

genuttrykk profiler av pasienter med overlevelse.

genuttrykk profiler av 176 CRC pasienter med sykdomsfrie overlevelse (DFS) og sykdomsspesifikk overlevelse (DSS) ble hentet fra GEO (sjonsnummer: GSE17538). Uttrykket profiler ble bestemt med Affymetrix Human Genome U133 Plus 2.0 Array avhør 20068 gener.

Disse tre datasett helt inneholdt 644 CRC pasienter avhør 10166 felles gener. Alle datasettene ble quantile normalisert med «AFFY» pakke med R for videre analyse [9].

mRMR metode

Vi brukte Minimum Redundancy Maximal Relevans (mRMR) metode for å rangere viktigheten av funksjonene [10]. Den mRMR metoden rangerer funksjoner i henhold til både relevans i forhold til målet og redundans mellom funksjoner. En rangert funksjon med en mindre indeksen indikerer at den har en bedre avveining mellom det maksimale relevans til målet og minimum redundans.

Både relevans og redundans ble kvantifisert ved gjensidig informasjon (MI), som anslår omfanget til hvilken en vektor er knyttet til en annen. MI er definert som:. (1) hvor er vektorer, er deres felles sannsynlighetstetthet, og og er de marginale sannsynlighetstettheter

Anta betegner hele funksjonssettet, betegner den allerede valgte funksjonssettet inneholder

m

funksjoner og betegner å-være-valgte funksjonssettet inneholder

n

funksjoner. Relevansen mellom en funksjon og målet kan beregnes ved: (2)

redundancybetween funksjonen og alle funksjonene i kan beregnes ved: (3)

For å bestemme funksjonen i med maksimal relevans og minimum redundans, det mRMR funksjonen kombinerer ligning (2) og ligning (3) og er definert som: (4)

mRMR funksjonen evalueringen vil fortsette

N

runder gitt en funksjon sett med

N product: (

N

=

m

+

n

) funksjoner. Etter mRMR funksjonen evaluering, setis en funksjon oppnådd: (5) der hovedside

h

for hver funksjon viser hvilket runde funksjonen er valgt. Jo mindre hovedside

h

, jo tidligere har tilfreds ligning (4) og bedre funksjonen er.

Nærmeste nabo algoritme (NNA)

I denne studien, Nærmeste nabo Algorithm (NNA), som har blitt mye brukt i bioinformatikk og databiologi [3], [11], [12], [13], [14], ble tatt i bruk for å forutsi den klassen av kolorektale vevsprøver. Vi betraktet hver prøve som en vektor med uttrykket verdiene av gener som dets komponenter. NNA beregner likheter mellom hver to prøver og gjør sin klassifisering avgjørelse. I vår studie, avstanden mellom to samplesandis definert som følger: (6) der er modulen av prøven. betegner den indre produkt av og. Jo mindre er, jo flere lignende de to prøvene er

I NNA, gitt en prøve setand en prøve, vil bli utpekt til den samme klassen av nærmeste nabo i, som er den prøve som har den minste.: (7)

Fem ganger kryssvalidering Metode

Fem-fold kryssvalidering ble ofte brukt til å evaluere resultatene av en klassifikator [15]. I fem-fold kryssvalidering, er alle prøver i datasettet først deles likt inn i fem deler. Deretter blir hver del i sin tur brukt til testing og de resterende 4-deler for opplæring. Dermed blir hver prøve testet nøyaktig en gang

For å evaluere resultatene av prediktor for CRC etapper, totalt nøyaktighet (ACC) av prediksjon er beregnet nedenfor:. (8) der står for antall korrekt klassifisert pasienter for

i

-te kreft stadium, og representerer det totale antall pasienter.

for å evaluere resultatene av prediktor for tilbakefall, prediksjon nøyaktighet, spesifisitet, sensitivitet og MCC (Matthews korrelasjon koeffisient) ble beregnet ved: (9) der

TP

,

TN

,

FP

,

FN

betegne antall sanne positive, sanne negative , falske positive og falske negative, henholdsvis.

Inkrementell funksjonsvalg (IFS)

Basert på rangert funksjoner innhentet av mRMR metoden brukte vi IFS [16], [17], [18], [19] tilnærming for å bestemme de optimale egenskaper. Under IFS prosedyre ble funksjoner i rangert funksjonen listen lagt med en trinnvis av funksjoner fra høyere til lavere rang. En ny funksjon sett ble bygget da ytterligere funksjoner ble lagt. Helt har sett ble komponert fra

N

rangert funksjoner.

i

-te funksjonene er: (10) der

N

betegner det totale antall funksjoner i den opprinnelige datasettet og

l

er antall funksjoner i hvert trinn, noe som er et positivt heltall. I denne studien har vi satt. For hver av de [

N Twitter /

l

] har sett, en NNA klassifikator ble konstruert og undersøkt ved hjelp av fem-fold kryssvalidering på referansedatasettet. En IFS bord ble oppnådd med en kolonne for indeksen

i

og de andre kolonner for prediksjon ytelse. Den optimale funksjonssettet () ble valgt, med som prediktor ga best prediksjon ytelse.

Fire forskjellige kriterier for vurdering av risiko

I denne studien, 4 forskjellige kriterier ble foreslått å vurdere risikoen av CRC pasienter. I det første forslag, pasienter i trinn B med tilbakefall, så vel som de i trinn C og D uavhengig gjentakelse status ble vurdert høy risiko, mens alle andre pasienter ble ansett som lav risiko. I den andre forslag ble bare krefttrinn vurdert. Pasienter i trinn A ble betegnet som lav risiko, mens de i trinn B, C og D som høy risiko. I det tredje forslag ble pasienter i trinn A og B anses som lav risiko, mens de i trinn C og D var høy risiko. I det siste forslag ble bare gjentakelse informasjonen som blir brukt. Pasienter med residiv ble betraktet som høy risiko, mens pasienter uten tilbakefall ble ansett som lav risiko. Deretter ble Kaplan-Meier estimatoren [20] benyttes for å vurdere betydningen av sykdomsfri overlevelse og sykdomsspesifikk overlevelse mellom høy og lav risikogruppene.

Resultater

Modell for å predikere CRC stadier

Etter å ha kjørt mRMR programvare, fikk vi to tabeller (se Fil S1). En ble kalt MaxRel tabellen vurdering genene i henhold til deres relevans til stadier av prøvene. Den andre ble kalt mRMR funksjonen tabell over genene med maksimal relevans og minimum redundans til stadier av prøvene.

På bakgrunn av utgangene på mRMR, bygget vi 500 har undergrupper i henhold til Eq.10. En NNA prediktor for hvert delsett ble modellert tilsvarende, som deretter ble evaluert ved fem gangers kryssvalidering. Antallet funksjonene som brukes i hver prediktor var 1,2,3, …, som beskrevet i Materialer og metoder. IFS Resultatet kan bli funnet i saksdokumenter S2. Vist på fig. 1 er den IFS kurven plottet basert på tilleggsinformasjon S2. X-aksen er det antall gener som brukes for klassifisering, og y-aksen er den prediksjon nøyaktighet av nærmeste nabo prediktorene evaluert etter fem gangers kryssvalidering. Maksimal nøyaktighet nådde 0,4759 når 25 gener ble utnyttet. Disse 25 gener ble ansett som den optimale biomarkører for prediksjon av CRC stadier (se de 25 beste genene i «mRMR Table» av File S1).

IFS kurvene ble trukket på grunnlag av dataene i File S2 . Den samlede prediksjonsnøyaktigheten nådd toppen når antall gener var 25. De 25 gener dermed oppnådd ble brukt til å komponere det optimale genet satt for CRC scenen prediktor.

Modell for å predikere CRC tilbakefall

på samme måte, ved hjelp av mRMR metoden, også hentet vi MaxRel og mRMR tabeller for CRC tilbakefall prediksjon (se Fil S3). Basert på disse to tabellene, ble 500 har undergrupper konstruert i henhold til Eq.10. En NNA prediktor ble modellert for hver undergruppe og ble evaluert av fem-fold kryssvalidering. Vist på fig. 2 er IFS kurven plottet basert på dataene i saksdokumenter S4. X-aksen er det antall gener som brukes for klassifisering, og y-aksen er MCC-verdiene av klassifiserere evaluert ved fem gangers kryssvalidering. Den maksimale MCC var 0,6926 da 110 gener ble utnyttet. Med en slik klassifikator, prediksjon sensitivitet, spesifisitet og nøyaktighet var 0,8182, 0,8760 og 0,8535, henholdsvis. Disse 110 gener ble ansett som den optimale biomarkører for prediksjon av CRC tilbakefall (se de beste 110 gener i «mRMR Table» av File S3).

IFS kurvene ble trukket på grunnlag av dataene i File S4 . MCC nådd toppen når antall gener var 110. De 110 gener dermed oppnådd ble brukt til å komponere det optimale genet satt for CRC tilbakefall prediktor.

Sammenligning overlevelsestid på fire ulike kriterier for å vurdere risiko

Vi brukte de to modellene som er nevnt ovenfor for å forutsi kreft stadier og tilbakefall status av pasienter med overlevelsestider. Disse pasientene ble delt inn i høy risiko og lav risikogrupper i henhold til de fire ulike kriterier. Overlevelsestider for de fire pasienter forslagene ble sammenlignet.

I henhold til den første forslag, var det en signifikant forskjell i sykdomsfri overlevelse (DFS) tid (logrank test, p-verdi = 0,0016) og sykdoms spesifikk overlevelse (DSS) tid (logrank test, p-verdi = 0,0041) mellom høy risiko og lav risikogruppene (tabell 1 og figur 3). For det andre forslag, er det også en signifikant forskjell i DFS (logrank test, p-verdi = 0,0021) og DSS (logrank test, p-verdi = 0,0055) mellom høy og lav risikogrupper. Imidlertid er det ikke så viktig som den for den første forslag (tabell 1). For det tredje forslaget, forskjellen i DFS (logrank test, p-verdi = 0,3313) og DSS (logrank test, p-verdi = 0,2556) var ikke signifikant mellom høy og lav risikogruppene (tabell 1). Ifølge den siste forslaget, forskjellen i DFS (logrank test, p-verdi = 0,5525) og DSS (logrank test, p-verdi = 0,5606) mellom pasienter med høy og lav risiko var ikke signifikant, enten (tabell 1).

(A) Sykdomsfri overlevelse (log-rank test, p-verdi = 0,0016). (B) Disease spesifikk overlevelse (log-rank test, p-verdi = 0,0041).

Diskusjoner

25 CRC scenerelaterte kandidat gener

i denne studien har vi identifisert 25 kandidatgener som kan brukes til å skille CRC pasienter fra ulike stadier (se de 25 beste genene i «mRMR Table» av File S1). Noen av genene har allerede blitt rapportert å være relatert til CRC. Nedenfor vil vi kort diskutere sine relasjoner med CRC

ZC3H12A (sink finger CCCH-type som inneholder 12A), er en MCP1 (CCL2; MIM 158105). Indusert protein som fungerer som en transkripsjonen aktivator og forårsaker celledød av cardiomyocytes, muligens via induksjon av gener assosiert med apoptose. Nylig har ZC3H12A blitt identifisert som en av de oppregulert gener i S100A8 /A9-aktiverte kolon kreftceller, hvis produkter fremme leukocytt rekruttering, angiogenese, tumor migrasjon, sårheling, og dannelse av premetastatic nisjer i distal metastatisk organer [21].

CADPS koder en roman neural /endokrine-spesifikke cytosol og perifer membranprotein som kreves for Ca

2 + -regulated eksocytose av sekretoriske vesikler. Nylig CADPS har blitt oppdaget til havn mutasjon p.R722W og p.R787 * i colon carcinoma [22]. Videre har dette genet er rapportert økt uttrykk i eggstokk forhold til omentum i 47 analyserte prøvene av microarray [23].

FZD8 (frizzled-8) er et medlem av frizzled genet familien, som er transmembrane reseptorer transduse wnt signaler basert på ligand-avhengige preferentiality for caveolin- eller clathrin endocytose [24], [25]. Wnt signalveien har blitt godt dokumentert å være relatert til CRC [26], [27], [28]. I tillegg har nylig FZD8 blitt foreslått å være en antatt terapeutisk mål i human lungekreft [29]. Videre har det vist seg at frizzled-10, et medlem av rizzled genfamilien, er oppregulert i primær CRC, og er en positiv regulator av WNT-beta-catenin-TCF signalveien [30].

CAV3 (caveolin 3) samt caveolin-1, -2 er hoved proteiner fra caveolae, vesicular invaginations av plasmamembranen. Studier har antydet at caveolins spilte en viktig rolle i cellulær signalisering og, eventuelt, i tumorigenese [31]. Nylig har Caveolin-1, som et medlem av familien caveolin, har blitt rapportert å virke som en anti-apoptotiske protein i tykktarmskreftceller ved å binde seg til og inhibere Ku70 Bax-avhengig celledød [32]. I tillegg har det blitt vist at tap av Caveolin-3 kan indusere en lactogenic mikromiljø som er beskyttende mot brysttumordannelse [33].

PACS2 (phosphofurin surt klynge sortering protein 2) har blitt rapportert å være påkrevet for effektiv apoptose av kolorektal cellelinjer. PACS-2 er en essensiell TRAIL effektor, som kreves for å drepe tykktarmskreftceller in vitro og virusinfiserte hepatocytter in vivo [34], [35].

SOX11 koder for et medlem av den SRY relaterte HMG-boksen familie av transkripsjonsfaktorer som er involvert i reguleringen av embryoutvikling og ved bestemmelsen av den celle skjebne. Uttrykk for Sox4 og Sox11 har vist seg å øke i mange forskjellige typer kreft hos mennesker, inkludert basalcellekreft (BCC) og Medulloblastomas. De karsinomer kan angripe forskjellige steder i kroppen, inkludert lever, prostata, ovarie, lunge og tykktarm. I tillegg har meget spesifikk overekspresjon av transkripsjonsfaktoren SOX11 blitt detektert i humane maligne gliomer [36]. Dessuten korrelerer SOX11 uttrykk til promoter metylering og regulerer tumorvekst i hematopoietiske maligniteter [37].

PRKCDBP koder for et bindende protein ifølge proteinkinase C, delta (PRKCD). PRKCDBP er en proapoptotiske tumor suppressor som vanligvis endres i CRC ved promoter hypermethylation, og dens gentranskripsjon blir direkte aktivert av NF-kB som respons på TNFa, noe som antyder at PRKCDBP inaktivering kan bidra til tumorprogresjon ved å redusere cellulær følsomhet for TNFa og annen påkjenninger, særlig i henhold til kronisk inflammatorisk mikro [38].

110 CRC gjentakelse knyttet kandidat gener

i denne studien har vi identifisert 110 kandidat gener som kan brukes til å forutsi CRC tilbakefall (se toppen 110 gener i «mRMR Table» fra File S3). Noen av genene har blitt rapportert å være relatert til CRC. Nedenfor vil vi kort diskutere sine relasjoner med CRC.

SLC26A2 koder for et protein som tilhører det oppløste bære familien. Den diastrophic dysplasi sulfat transporter er et trans glykoprotein innblandet i patogenesen av flere menneskelige chondrodysplasias. SLC26A2 har blitt oppdaget å bli nedregulert i tykktarm kreft biopsier sammenlignet med omkringliggende normalt vev [39]. I tillegg har SLC26A2 og SLC6A14 mRNA-nivåer blitt brukt som en del av en syv-gen panel hvilket ga hastigheter på korrekt forutsigelse, sensitivitet og spesifisitet høyere enn med tidligere tilgjengelige diagnostiske indekser for ulcerøs kolitt, Crohns sykdom og irritabel tarmsyndrom [40] .

SLPI (sekretorisk leukocytter peptidase hemmer) koder for et utskilt inhibitor som beskytter epitelvev fra serin proteaser. Høyere spli avskrift uttrykk har blitt påvist i mange kreftcellelinjer, inkludert eggstokkene, nyre- og tykktarmskreft ved hjelp RTQ-PCR uttrykk analyse [41]. I tillegg er det en hypotese er foreslått som et humant monoklonalt antistoff som nøytraliserer SLPI er protease-aktivitet kan være terapeutisk nyttig for ovarial og kolonkarsinom [41].

CLEC4M koder for et transmembran reseptor og er ofte referert til som L -tegn på grunn av dets ekspresjon i endotelceller i lymfeknuter og lever. CLEC4M har blitt identifisert som en av de genene som forskjellig uttrykt i pasienttykktarmskreft levermetastase prøver og dens xenograft [42]. I tillegg CLEC4M signifikant forskjellig uttrykt på maligne versus ikke-ondartet brystvev [43].

ISCU koder for de to isomere former, ISCU1 og ISCU2, av Fe-S-klynge scaffoldprotein, som er nødvendige for flere mitokondrie enzymer og andre subcellulære rommets proteiner. Det har vist seg at ekstra mitokondrie lokalisering av frataxin og sin tilknytning til ISCU1 spille en nøkkelrolle i enterocyte lignende differensiering av den menneskelige kolon adenokarsinom cellelinje Caco-2 [44]. I tillegg, ved å målrette ISCU, MIR-210 reduserer aktiviteten av Krebs syklus enzymer og mitokondriell funksjon, bidrar til en økning i frie radikal generering i hypoksi, øker celleoverlevelse etter hypoksi, induserer en bryter for glykolyse i både normoxia og hypoksi, og oppregulerer jernopptaket er nødvendig for cellevekst. Spesielt, analyse av mer enn 900 pasienter med forskjellige tumortyper, inkludert brystkreft, viste at undertrykkelsen av ISCU ble korrelert med en dårligere prognose [45].

PANK2 koder for et protein som tilhører pantotenat kinase familien og er det eneste medlem av denne familien å komme til uttrykk i mitokondriene. Det har blitt rapportert at tapet av en undergruppe av kinaser, inkludert PANK2 resulterte i redusert β-cat-avhengig transkripsjon i tykktarm carcinoma-celler, som representerer potensielle målrette terapeutiske gener [46].

Protein-protein interaksjon mellom scene beslektet gener og tilbakefall relaterte gener

Vi kartlagt de 25 scenerelaterte gener og 110 tilbakefall relaterte gener til protein-protein interaksjon nettverk konstruert basert på data fra STRING [47]. Fra fig. 4, kan det sees at nære forbindelser eksistert mellom scene og tilbakefall relaterte gener. Det er blitt vist at fasen relatert gen RB1CC1 (RB1-induserbar kveil-spole 1) kan undertrykke cellesyklusprogresjon og hemme proliferasjon gjennom aktivering av promoteren og ekspresjon av tilbakefall relatert gen RB1 i human kreft [48], [49], [ ,,,0],50]. I tillegg er samspillet mellom disse to genene var også involvert i prognosen for kreftpasienter. Det har blitt rapportert at RB1CC1 sammen med RB1 og p53 spiller viktige roller i langsiktig overlevelse av japanske brystkreftpasienter [51]. Dessuten Paun et al. har avdekket RB1CC1 som en roman målet for hyppige mutasjoner og avvikende oppregulering i MSI-H (høyt nivå av mikro ustabilitet) CRC [52]. Derfor er det rimelig å anta at samspillet mellom disse to genene er også involvert i tumordannelse og prognosen av CRC. Videre samspillet mellom scene relatert gen ZC3H12A og tilbakefall relatert gen TANK ble også støttet av en stor skala av protein-protein interaksjonsstudie [53]. Totalt sett samspillet mellom disse kandidat gener kan forklare etiologi av CRC og påvirke prognosen.

bransje runde rektangler representerer scenerelaterte gener mens røde ellipser representerer tilbakefall relaterte gener. 20 av de 25 scenerelaterte gener og 61 av de 110 tilbakefall relaterte gener ble presentert.

Prospect av vår metode

I de tidligere prognosemodeller, ble ingen gjentakelse anses å være tilsvar til lav risiko. Men fra vårt ståsted, kan prognosen av de avanserte CRC pasienter med stadium C eller D bli verre selv om de ble spådd å ikke gjenta seg. Tvert imot, kan pasienter fra fase A overleve uansett om de ble spådd til å gjenta seg. Derfor, i vår studie, foreslo vi en roman kriterium for å vurdere risikonivået, der pasienter spådd til å gjenta seg i stadium B samt pasienter med stadium C og D uavhengig tilbakefall status ble vurdert høy risiko. Alle andre pasienter ble ansett som lav risiko. Det ble avslørt at den overlevelsestiden mellom risikopasienter høye og lave vurdert ved dette kriteriet var mer betydelig enn det som er avledet av kun vurderer tilbakefall status- eller tumorstadier.

Det kan sees at når kun vurderer tumorstadier, er forskjellen av overlevelsestid i den andre forslaget var betydelig, men det var ikke tilfelle i den tredje. Grunnen kan være at nøyaktig klassifisering av pasienter i mellom turer er fortsatt problematisk. Eschrich et al. har vist at overlevelseskurver gruppert på begge Dukes fase B og C kan videre deles inn i gode og dårlige prognoser grupper (ref fig. 2) [6]. Det er derfor overlevelsestiden forskjellen var signifikant når bare pasienter i trinn A ble betegnet som lav risiko.

Samlet den første forslag bedre resultater enn de andre tre fordi det integrerte kreft stadier og gjentakelse status, snarere enn bare en tanke av dem. Denne metoden kan brukes til studier av andre sykdommer, og det kunne gi en betydelig bedre prognose ytelsen ved ensembling heterogen informasjon.

Hjelpemiddel Informasjon

Fil S1.

mRMR resultat for CRC scenen prediksjon modell. Denne filen inneholder to ark. Den første er den MaxRel funksjonen tabellen, som rangert de 500 beste genene i henhold til relevans mellom funksjoner og klasse av prøvene. Den andre er mRMR funksjonen tabellen, som rangeres disse 500 genene i henhold til redundans og relevanskriterier

doi:. 10,1371 /journal.pone.0063494.s001 plakater (XLSX)

File S2. .

Prediksjonsnøyaktigheten hver tumorstadium og generell Prediksjonsnøyaktigheten alle kreft etapper på hver kjøring av IFS

doi: 10,1371 /journal.pone.0063494.s002 plakater (XLSX)

File S3.

mRMR resultat for CRC tilbakefall prediksjon modell. Denne filen inneholder to ark. Den første er den MaxRel funksjonen tabellen, som rangert de 500 beste genene i henhold til relevans mellom funksjoner og klasse av prøvene. Den andre er mRMR funksjonen tabellen, som rangeres disse 500 genene i henhold til redundans og relevanskriterier

doi:. 10,1371 /journal.pone.0063494.s003 plakater (XLSX)

File S4.

følsomhet (Sn), spesifisitet (Sp), nøyaktighet (Ac), Matthews korrelasjonskoeffisient (MCC) for hver kjøring av IFS for CRC tilbakefall prediksjon modell

doi:. 10,1371 /journal.pone.0063494.s004 product: (XLSX)

takk

forfatterne ønsker å takke redaktøren for å ta seg tid til å redigere denne artikkelen. Forfatterne vil også gjerne takke de to anonyme lesere for deres konstruktive kommentarer, som var svært nyttig for å styrke presentasjonen av denne studien.

Legg att eit svar