PLoS ONE: Robust Prognostiske genekspresjonssignaturer i blærekreft og Lung Adenocarcinoma Avhengig av cellesyklusen relaterte gener

Abstract

Få prognostiske biomarkører er godkjent for klinisk bruk først og fremst fordi deres opprinnelige ytelsen ikke kan gjentas i uavhengige datasett. Vi har hevdet at robuste biomarkører kan oppnås ved å identifisere deregulerte biologiske prosesser deles blant tumortyper som har en felles etiologi. Vi utførte et gen som angitt anrikning analyse i 20 offentlig tilgjengelige genekspresjon datasett som omfatter 1968 pasienter som har én av de tre vanligste tobakksrelaterte krefttyper (lunge, blære, hode og nakke), og identifiserte cellesyklusrelaterte gener som den mest konsekvent prognostisk klasse av biomarkører i blæren (BL) og lunge adenokarsinom (LUAD). Vi fant også prognostisk verdi på 13 av 14 publiserte BL og LUAD signaturer var avhengig av cellesyklusrelaterte gener, som støtter betydningen av cellesyklus relaterte biomarkører for prognosen. Interessant, ble ingen prognostiske genet klasser identifisert i plateepitelkarsinom lungekarsinom eller hode og hals plateepitelkarsinom. Deretter ble en bestemt 31 gen cellesyklusen spredning (CCP) signatur, tidligere utledet i prostatakreft vurdert og funnet prediktiv av utfallet i BL og LUAD kohorter i univariate og multivariate analyser. Spesielt CCP poengsum forbedret betydelig prediktiv evne multivariate modeller basert på standard kliniske variabler for progresjon i BL pasienter og overlevelse i LUAD pasienter i flere kohorter. Vi genererte tilfeldige KKP signaturer i ulike størrelser og funnet sett med 10-15 gener hadde robust ytelse i disse BL og LUAD kohorter, et funn som ble bekreftet i en uavhengig kohort. Vårt arbeid karakteriserer betydningen av cellesyklus relaterte gener i prognostiske signaturer for BL og LUAD pasienter og identifiserer en bestemt signatur sannsynlig å overleve ytterligere kontroll

Citation:. Dancik GM, Theodorescu D (2014) Robuste Prognostic genekspresjonssignaturer i blærekreft og Lung Adenocarcinoma Avhengig av cellesyklusen relaterte gener. PLoS ONE 9 (1): e85249. doi: 10,1371 /journal.pone.0085249

Redaktør: John D. Minna, Univesity of Texas Southwestern Medical Center i Dallas, USA

mottatt: 22 april 2013; Godkjent: 24 november 2013; Publisert: 22 januar 2014

Copyright: © 2014 Dancik, Theodorescu. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet støttes delvis av National Institutes of Health gir CA075115 og CA104106. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet. Ingen ekstra ekstern finansiering ble mottatt for denne studien

Konkurrerende interesser:. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Gene uttrykk profilering av kreft hos mennesker har revolusjonert. vår forståelse av sykdommen og fremskyndet oppdagelsen av prognostiske og prediktive biomarkører [1] – [3]. Imidlertid har noen multi-genet biomarkører blitt godkjent for klinisk bruk [4] delvis fordi de mangler robusthet på tvers av flere datasett. Dette er spesielt påfallende for blærekreft der Lauss og kollegaer [5] evaluert 28 publiserte gen signaturer som er laget for diagnostiske og prognostiske formål for blærekreft og fant at ingen av de 6 overlevelse signaturer gjorde det bedre enn sjansen når den brukes til uavhengige datasett.

Her er vi løse denne mangelen på robuste prognostiske biomarkører ved å postulere eksistensen av felles cellulære prosesser (moduler) på tvers av flere krefttyper felles etiologi, hvis unormal aktivitet kan bli fanget av en transkripsjonen signatur. Som vårt mål var å utvikle robuste blærekreft biomarkører, valgte vi flere krefttyper med røyking som en veldefinert viktig etiologisk faktor. Identifiseringen av en slik prosess ville formodentlig tillate utvikling av robuste biomarkører som er prognostiske på tvers av flere pasientkullene og tumortyper.

en oversikt over vår analyse er gitt i figur 1. Først, et gen som angitt anrikning analyse av genuttrykk profiler fra 1968 pasienter med tobakksrelaterte kreftformer (blære urothelial cellekreft, lungekreft adenokarsinom, lunge plateepitelkarsinom, og hode og hals plateepitelkarsinom) ble utført og identifisert sykkelrelaterte moduler som konsekvent prognostiske i blæren og lunge adenokarsinom. Vi fant ut at en bestemt cellesyklus gen signatur var prediktiv av utfallet i blæren og lunge adenokarsinom og at resultatene av publiserte blære og lunge adenokarsinom signaturer avhengig av cellesyklus-korrelert gener. Neste vi utviklet og evaluert en 12 gen panel av cellesyklus relaterte gener og fant dem effektive i stratifying klinisk utfall i en uavhengig kohort. Våre resultater karakterisere kjernen betydningen av cellesyklus relaterte biomarkører i prognostiske gen signaturer hos pasienter med vanlige krefttyper og implisere celleproliferasjon som den primære driveren av sykdom utfallet. Mer generelt definerer denne tilnærmingen funksjonelt dominerende biologiske moduler kjøre menneskelig kreft prognose og identifiserer robuste prognostiske biomarkører.

A, biologiske prosesser knyttet til overlevelse i tobakksrelaterte tumorer ble identifisert gjennom et gen sett berikelse analyse. Denne analysen identifiserte cellesyklusen som den eneste biologiske prosessen konsekvent assosiert med utfall, i blære og lunge adenokarsinom mens noen prosesser som ble identifisert som var prediktiv av utfallet i lunge adenokarsinom, plateepitelkreft lungekreft, eller hode og hals plateepitelkarsinom. B, Gitt funnene i A, ble den kliniske relevansen av cellesyklus relaterte gener vurderes på to måter. Først vurderte vi den prognostiske verdien av en bestemt 31 gen cellesyklusen spredning (CCP) signatur i blæren og lunge adenokarsinom i univariat og multivariat analyse. For det andre, fant vi at den prognostiske verdien av tidligere publiserte gen signaturer forutsi overlevelse i blæren progresjon og lunge adenokarsinom var avhengig av cellesyklus korrelerte gener. C, fordi ytterligere analyse viste at den prognostiske verdien av KKP stillingen var avhengig av signatur størrelse, optimalisert vi KKP signatur og funnet ut at en mindre 12 gen signatur (CCP-12) var prognostisk i en ekstern datasettet.

Materialer og metoder

genuttrykk datasett og kliniske endepunkter

Vi analyserte 20 genekspresjon datasett som omfatter 1968 pasienter med blære urothelial cellekreft (BL, fem årskull, 42

%

), lunge adenokarsinom (LUAD, åtte kohorter, 39%), lunge plateepitelkarsinom (LUSC, tre kohorter, 8%), og hode og hals plateepitelkarsinom (HNSCC, fire kohorter, 10%). Alle genuttrykk datasett er brukt i denne analysen er offentlig tilgjengelig og kan lastes ned fra Gene Expression Omnibus (GEO) [6] eller som supplerende materiale til publikasjonen, som vist i tabell S1-S4 i File S2. Referanser til den opprinnelige studien for hvert kull er også gitt i tabell S1-S4 i File S2. For mer informasjon se Hjelpemiddel og metoder i File S1.

endepunkter inkluderte progresjon i BL pasienter. Tre BL kohorter hadde progresjon informasjon, som ble definert av den originale forfatterne som økning fra NMI til MI sykdom (Lindgren og Dyrskjot kohorter, Ref # [7], [8]), eller noen økning i stadium (CNUH, Ref # [9 ]). For to gruppene (Lindgren og CNUH) tid til progresjon var ikke tilgjengelig, og muligheten for et gen eller signatur poengsum for å forutsi utviklingen (Progressor vs. non-Progressor) ble evaluert av arealet under mottaker drift karakteristikk (AUC). I Dyrskjot, kliniske oppfølgingstiden var tilgjengelig slik at for progresjonsfri overlevelse (PFS) analyse.

overleve endepunktet ble valgt som følger. Sykdomsspesifikk overlevelse (DSS) ble alltid brukt hvis tilgjengelig (tre BL kohorter). Total overlevelse (OS) ble brukt om DSS var utilgjengelig (to BL, sju LUAD, og ​​to LUSC kohorter). Tilbakefall overlevelse (RFS) ble brukt om verken DSS eller OS var tilgjengelig (en LUAD og to HNSCC kohorter). Hendelsene for disse endepunktene er død av sykdom, død uansett årsak, og tilbakefall av sykdommen, for DSS, OS, og RFS, henholdsvis. I en ytterligere HNSCC kohort (Colo, Ref # [10]) gjentakelse status ble levert, men klinisk oppfølging ganger var ikke, og evnen av et gen for å forutsi gjentakelse ble evaluert ved AUC. I tillegg nodal involvering korrelerer sterkt med resultat i HNSCC [11] og ble anvendt som et surrogat for å overleve i to cohorts slik at for en mer omfattende analyse. De kliniske endepunkter for hvert årskull er oppsummert i tabell S1-S4 i File S2.

Cellesyklus spredning (CCP) scorer

I microarray datasett, ble prober konvertert til genet symboler basert på Affymetrix annotering , GenBank tilgangsnummer, eller Unigene klynge ID. For gener med flere sonder, ble proben med den høyeste middelverdi uttrykket anvendes [12]. Ekspresjonen av hvert gen var

z

-normalized tvers prøver for å ha en middelverdi på null og et standardavvik på en. CCP poengsum er gjennomsnittet uttrykk for alle norm KKP signatur gener på tabellen. I prostatakreft datasettet, er CCP poengsum gjennomsnittlig uttrykk av 31 KKP gener målt ved kvantitativ RT-PCR. For mer informasjon se Hjelpemiddel og metoder i File S1.

Gene sett berikelse og generelle statistiske analyser

Database for visualisering og Annotated Discovery (DAVID, Ref # [13]) ble brukt for genet satt berikelse analyse for å identifisere høy- est over Gene ontologi (GO) [14] vilkårene og KEGG trasé [15] i lister over gener. Ytterligere detaljer for dette og generelle statistiske analyser er gitt i Hjelpemiddel og metoder i File S1. Alle analyser med unntak av genet sett berikelse analyse ble utført ved hjelp av

R plakater (https://cran.r-project.org). Prøve

R

kode og utgang er gitt i form av en Sweave dokument som inneholder utdata fra vår analyse sammenvevd med tilsvarende

R

kode (File S3). Tilleggs R kode er tilgjengelig på forespørsel.

Resultater

Gene sett berikelse analyse identifiserer cellesyklusen relaterte gener som mest konsekvent prognostisk klasse av biomarkører i blæren og lunge adenokarsinom

Data fra 1968 pasienter ble undersøkt for utfallet av tumorprogresjon (hvor tilgjengelig) og overlevelse (definert i Materialer og metoder). I hvert årskull identifiserte vi lister over gener som predikerer utfallet (P 0,01) og utført en berikelse analyse som identifiserer overrepresentert moduler (GO vilkår [14] og KEGG trasé [15], Figur 2, Figur S1, og tabell S5 i File S6 ) i disse genet lister. Cellesyklus relaterte moduler var de mest konsekvent beriket moduler på tvers av BL og LUAD pasient kohorter (for mer informasjon se Støtte Resultater og diskusjon i File S1). I kontrast, gjorde LUSC og HNSCC pasient kohorter ikke har en felles overrepresentert veien (for mer informasjon se diskusjon Støtte Resultater og File S1).

I hvert årskull, over-representert Gene Ontologi (GO) Kjøps KEGG trasé ble identifisert fra lister over gener betydelig prediktiv av sykdom utfall (P 0,01) ved hjelp av DAVID genet merknaden berikelse analyse verktøykasse. Konsekvent prognostiske moduler ble identifisert ved å rangere alle modulene først med antall kohorter med betydelige resultater (FDR 20%) og deretter på gjennomsnittlig p-verdi. Hver subfigure omfatter ti moduler: de konsekvent prognostisk moduler og det øverste treffet «for hvert kull, merket med en stjerne (*), som er definert som modulen med lavest FDR i den kohorten som har en FDR 20% i flere årskull. A, overrepresentert GO begreper knyttet til overlevelse i blærekreft. B, overrepresentert GO begreper knyttet til overlevelse i lunge adenokarsinom. C, overrepresentert GO begreper knyttet til overlevelse i plateepitelkarsinom lungekarsinom. D-F, samme som A-C bortsett overrepresentert KEGG veier er identifisert. Det var ingen signifikant overrepresentert prognostiske moduler i hode og nakke plateepitelkarsinom kohorter på FDR 20%. LUSC: Squamous celle lungekreft, FDR. Falske funnrate

Univariat og multivariat analyse av en poengsum cellesyklus spredning i blæren og lunge adenokarsinom

For å bestemme den kliniske relevansen av disse funnene vi vurdert en tidligere utgitt cellesyklusen spredning (CCP) score (gjennomsnitt uttrykk av 31 cellesyklus gener) som spådd tid til tilbakefall eller død i prostata kreft [16], [17]. Hvis overrepresentert cellesyklus modulene var bestemmende klinisk utfall, da man ville også forvente CCP score for å være

Totalt CCP poengsum var signifikant prediktiv (P 0,05). Progresjon og overlevelse i alle BL kohorter med disse endepunkter, og for å overleve i 5/8 LUAD kohorter, med høye KKP score assosiert med dårlig prognose i alle tilfeller. Spesielt CCP poengsum var prediktiv av progresjon i CNUH (AUC = 0,68, P 0,05), Lindgren (AUC = 0,70, P 0,05), og Dyrskjot (HR = 4,73, P 0,001, figur 3A) kohorter. CCP minutter ble prediktiv for overlevelse (P 0,05) i alle fem BL gruppene (HR 1,81 til 4,73, figur 3B) CCP poengsum var også prediktive for utfallet (P 0,05) i 5/8 LUAD kohorter (HR 1,53 til 2,68, figur 3C).

A, prognostisk verdi av CCP score for progresjon i blærekreft i CNUH (N = 165), Lindgren (N = 97), og Dyrskjot (N = 353) kohorter. I CNUH og Lindgren kohorter, oppfølgingstid var ikke tilgjengelig så vi evaluert evne CCP score for å diskriminere mellom ikke-progressors (NP) og progressors (P) som beskrevet i materialer og metoder. I Dyrskjot kohorten ble Kaplan-Meier (KM) kurver for progresjonsfri overlevelse (PFS) genereres for pasienter med CCP score på lavere (grønn), middels (blå), og øvre (rød) 33% og log rank P-verdien av den kontinuerlige CCP resultatet er rapportert. B, prognostisk verdi av CCP score for å overleve i blærekreft. KM kurver ble generert som i (A) for total overlevelse (OS) i Blaveri (N = 74) kohort og for sykdomsspesifikk overlevelse (DSS) i CNUH (N = 165), Dyrskjot (N = 366), Lindgren (N = 142), og MSKCC (N = 87) kohorter. C, prognostisk verdi av CCP score for å overleve i lunge adenokarsinom. KM kurver ble generert for OS eller tilbakefall overlevelse (RFS) i CAN /DF (N = 82), MSK (N = 104), Son (N = 62), Takeuchi (N = 90), og Tomida (N = 117) kohorter. Forkortelser: Hr., Hazard ratio, tilsvarende en-enhet økning i CCP poengsum

Vi har evaluert ved om CCP poengsum bidrar uavhengig prognostisk informasjon. Vi utførte en multivariat analyse og inkludert klinisk relevante variabler som alder, kjønn og klasse i BL og LUAD kohorter hvor CCP poengsum var prognostisk i de univariate analysene. For hver årsklasse vi også utviklet en best multivariat modell (dvs.

endelige modellen

) gjennom frem trinnvis utvalg av informative variabler (P 0,05). En slik modell velger en kortfattet, «optimal» sett av variabler og kan velge CCP poengsum over standard kliniske variabler. Fordi kliniske variabler er lett tilgjengelig dette

endelige modellen

kan ikke være kostnadseffektivt for tiden, men kan være så i miljøer hvor kreften er iscenesatt og gradert i henhold til deres molekylær patologi. Til slutt, evaluert vi om CCP poengsum økte prognostiske verdien av en

beste tilgjengelige

modell som inkluderte kliniske variabler som er lett tilgjengelig i gjeldende innstillinger. En slik økning tyder på at KKP poengsum har klinisk nytte. For flere detaljer om metodikken se Hjelpemiddel og metoder i File S1.

CCP Poengsummen ble valgt for

endelige modellen

i alle BL kohortene når progresjon var endepunktet (Tabell 1, Tabell S6 File S4), og var den eneste signifikante variabelen i multivariat analyse. Når overlevelse var endepunktet, KKP poengsum var den mest konsekvent betydning ved multivariat analyse (P 0,05), sammen med scene, som var hver betydelig i tre kohorter. CCP Poengsummen ble valgt for

endelige modellen

i to av disse gruppene (Tabell 1, Tabell S7 i File S4). Hos pasienter med LUAD, CCP poengsum var den mest konsekvent betydning ved multivariat analyse og også den mest valgte variabelen i

endelige modellen plakater (Tabell 2, Tabell S8 i File S4). I

beste tilgjengelige

modeller, tillegg av CCP poengsum førte til en økning i prognostisk evne (P 0,05) i to BL, en BL, og tre LUAD kohorter når progresjon, overlevelse, og overlevelse var endepunktene, henholdsvis (Tabeller S9-S10 i File S5). Disse resultatene antyder at CCP stillingen kan være bedre enn standard kliniske variabler i begge BL og LUAD kreft og at CCP resultatet kan ha umiddelbar klinisk anvendelse for å forutsi progresjon i BL pasienter og overlevelse i LUAD pasienter. For mer informasjon, se Støtte Resultat og diskusjon i File S1. I samsvar med genet satt berikelse analysen over, CCP poengsum var ikke prognostisk hos pasienter med plateepitelkreft svulster (LUSC og HNSCC) (figur S2).

Prognostiske signaturer i blære og lungekarsinom avhenge cellesyklusrelaterte gener

Fordi moduler mest konsekvent assosiert med progresjon i BL pasienter og overlevelse i LUAD pasienter ble cellesyklusen relatert (figur 2 og figur S1), vi en hypotese om at resultatene av tidligere definerte BL progresjon og LUAD overlevelse signaturer vil være avhengig av cellesyklusrelaterte gener. BL overlevelse signaturer ble ikke undersøkt fordi en tidligere studie fant at resultatene deres var dårlig i uavhengige datasett [18]. Vi testet vår hypotese på publiserte gen signaturer ved hjelp av en justering tilnærming (for mer informasjon se Hjelpemiddel og metoder i File S1) som demper den prediktive evne signatur gener som er korrelert med CCP poengsum [19].

I hvert datasett, ble uttrykk nivåer av signatur gener justert for CCP poengsum eller ved en konstant begrep som omfatter en «negativ kontroll» (se Hjelpemiddel og metoder i File S1 for detaljer) og evaluert for progresjon i BL kohorter og overlevelse i LUAD kohorter. En heatmap indikerer hver signatur er prognostisk verdi og om dens prediksjonsevne er tapt når det justeres for CCP score (figur 4). Generelt underskriftene mistet sin prediksjonsevne følgende CCP poengsum justering. Spesielt blære signaturer mistet sin prediktiv evne i alle uavhengige kohorter, mens lunge signaturer som var intelligent i 2 kohorter mistet sin prediktiv evne i 83% av gruppene de var prediktiv i, i gjennomsnitt. For mer informasjon se Støtte Resultater og diskusjon i File S1.

Uttrykket verdiene av prognostiske signatur gener ble justert for CCP poengsum eller ved en konstant (negativ kontroll) som beskrevet i Hjelpemiddel og metoder i File S1. A, heatmap viser virkningen av KKP poengsum justering på prediktiv evne til hver signatur (rader) på hver årsklasse (kolonner). Signaturer enten mister sin prediksjonsevne følgende justering (P 0,05 i kontroll, men P 0,05 i KKP justert kohort, blå boks); forbli prognostisk etter justering (P 0,05 i både kontroll og CCP justerte kohorter, grønn boks); eller var ikke prognostisk i begge tilfeller (P 0.05 i begge grupper, hvit boks). B, stablet stolpediagram som oppsummerer den prognostiske verdien av hver undertegning av kategoriene beskrevet i (A). Tap av prediktiv evne blir beregnet som prosentandelen av signaturer som mister sin evne til prediktiv følgende justerings (blå bokser) i forhold til det totale antall styrekullene en signatur er i prognostisk (blå + grønne bokser). C-D, justering resulterer i lunge adenokarsinom kohorter, i samme format som A-B.

Ekstern validering av raffinerte cellesyklus uttrykk signaturer i human prostatakreft

Fordi CCP signatur gener er sterkt korrelert [16] og måle den samme biologiske prosessen, hypotese vi at en mindre gen signatur ville utføre sammenlign til fulle 31-genet signatur. Først preget vi viktigheten av signaturen størrelse gjennom gjentatte stikkprøvekontroll av KKP gener å generere gen signaturer i ulike størrelser og vurdert deres prognostisk verdi i BL og LUAD kohorter. Vi fant at den prediktive kraft CCP resultatet avhenger signatur størrelse og ikke nødvendigvis genet sammensetning, og at 10-15 gener er tilstrekkelig til å opprettholde den prognostiske kraften i full signatur (Tall S3, S4) (se Diskusjon Støtte Resultater og File S1 for detaljer). Til selvstendig bekrefte dette funnet, og for å vurdere mindre raffinerte signaturer vi analysert 4 «robuste» signaturer (KKP-4, -7, -10 og -12) (tabell S12 i File S8) som inkluderer gener som predikerer utfallet i flere kohorter ( se Hjelpemiddel og metoder i File S1 for detaljer).

KKP-4, -7, -10, og -12 underskrifter ble levert til Myriad Genetics (Salt Lake City, Utah) for «blindet» evaluering , dvs. uten angivelse av vår hypotese med hensyn til forholdet mellom signaturen størrelse og prognostisk verdi. Den prediktive evne signatur score til biokjemisk tilbakefall i prostatakreft ble undersøkt i 353 pasienter som fikk radikal prostatektomi [17], med genuttrykk målt ved kvantitativ RT-PCR (se Hjelpemiddel og metoder i File S1). Alle score var prediktiv (P 0,05) i univariate og multivariate analyser som inkluderte CAPRA-S [20], et mål på klinisk risiko regnskap for preoperativ PSA, patologisk Gleason score, kirurgiske marginer, ekstra kapsel forlengelse, sædvæske invasjon og lymfeknute invasjon. Generelt fare- forholdstall økt og p-verdier ble redusert med økende antall genet (Tabell 3). De raffinerte signatur scorene ble så analysert i en multivariat analyse teste om den fulle signatur lagt prediktiv verdi til en modell som også inkluderte CAPRA-S. Den fulle signatur lagt betydelig prediktiv verdi (P 0,05) til KKP-4, CCP-7, og CCP-10-modeller, men ikke til CCP-12-modellen, som definerer denne signaturen (BIRC5, BUB1B, CDC20, CDCA8, CENPF , FOXM1, KIF11, NUSAP1, PTTG1, TK1, TOP2A) som tilstrekkelig.

til slutt vurderte vi CCP-12 signatur i en ekstra kohort bestående av 88 pasienter med lunge adenokarsinom av blandet subtyper. Genuttrykk profiler for disse pasientene ble innhentet gjennom RNA sekvensering (RNASeq) og lastet ned fra Kreft Genome Atlas (TCGA) (https://cancergenome.nih.gov). CCP Poengsummen ble beregnet som før (gjennomsnittlig rad-normalisert uttrykk for de 12 KKP gener) ved hjelp av normaliserte RNA tellinger (RNAseq av forventning-maksimering, [21]) tilgjengelig fra TCGA. Fig. 5 viser at CCP-12 spår betydelig OS hos disse pasientene (HR = 1,95, P = 0,023), noe som bekrefter den prediktive evne CCP-12 i en ekstern kohort og indikerer at CCP poengsum er robust på tvers av flere genuttrykk profilering teknologier (mikromatriser og RNAseq).

prognostisk verdi av en raffinert 12-genet cellesyklusen spredning (CCP-12) score i lunge adenokarsinom pasienter med genuttrykk profilering av RNASeq vises. Kaplan-Meier (KM) kurver for total overlevelse (OS) ble generert for pasienter (N = 88) med CCP-12 score på lavere (grønn), middels (blå), og øvre (rød) 33% og log rank P-verdien av den kontinuerlige CCP-12 resultatet er rapportert. Forkortelser: Hr., Hazard ratio, tilsvarende en-enhet økning i CCP-12 poengsum

Diskusjoner

Vi utførte et gen sett berikelse analyse av genuttrykk profiler hos pasienter med fire tobakksrelaterte kreftformer og identifisert cellesyklusen som funksjonell prosessen mest konsekvent assosiert med pasientens utfall i tumorer med ikke-plateepitel histologier. Avvikende celleproliferasjon er et kjennetegn på kreft [22] og økt ekspresjon av cellesyklus-gener er funnet i flere tumortyper, [23], inkludert de som ikke er årsaksmessig sammenheng med røyking, for eksempel brystkreft [19] og prostatakreft [16], [17 ]. Det er imidlertid interessant å merke seg at røykere med prostatakreft har økt risiko for tilbakefall og dødelighet [24]. Overraskende, cellesyklus tilhørende genene var ikke prognostisk i tobakksrelaterte tumorer med plateepitel histologi. Men vi oppmerksom på at disse kohortene hadde relativt få pasienter ( 85) som kan ha utelukket identifisering av funksjonelle prosesser knyttet til utfallet i disse krefttypene

Våre data gir viktig innsikt utover identifisering av en bestemt prognostisk signatur (CCP-12). Først, tyder det på at i BL og LUAD kreft, vil prognostiske biomarkører ikke validere på tvers av flere årskull med mindre de er (direkte eller indirekte) forbundet med cellesyklusen (figur 4). Sekund, våre funn at genekspresjonssignaturer kunne forutsi overlevelse i flere blærekreft kohorter var uventet fordi en fersk valideringsstudie fant at flere signaturer [25], [26] avledet fra datasettene undersøkt her (Blaveri, MSKCC) hadde dårlig prediktiv evne [18 ]. Tredje, viser vår data for første gang at robust overlevelse genekspresjonssignaturer eksisterer i blærekreft, men bare når definert basert på funksjonelle genet moduler. Hvis brukt på andre krefttyper, kan dette konseptet føre til utvikling av robuste signaturer som er mer sannsynlig å nå klinisk praksis.

Vårt arbeid takler også en viktig, men sjelden adressert problemet i utvikling av biomarkører, virkningen av signatur størrelse på prediktiv evne. Kostnadseffektivitet og gjennomførbarheten av å vurdere flere gener i en liten mengde av vevsprøver veie mot behovet for store nok signaturer som overvinne teknisk variabilitet fra analysen og biologisk variabilitet fra tumorprøve heterogenitet. Våre resultater tyder på den prognostiske utførelsen av cellesyklus gener platåer ved 10-15. I kontrast, Haibe-Kains

et. al

. fant at i brystkreft den prognostiske verdien av AURKA uttrykk var sammenlignbare med multi-genet modeller. AURKA er en av cellesyklus genene vi undersøkte, men var ikke like robust som CCP poengsum, blir prediktiv (P 0,05) på bare 5/13 BL og LUAD gruppene (figur S5). Generelt kan redundans oppnådd fra flere gener overvinne den variable kvaliteten av RNA avledet fra fast vev, noe som kan føre til at enkelte gen-analyser for å svikte, og dermed sikre robuste analyseresultater. Mens vi funnet at CCP-12 forutsagte resultat i en uavhengig kohort ytterligere trinn slik som definerer grensene som ville skille pasienter i høy og lav risikogrupper og prospektiv evaluering i uavhengige kullene ved bruk av forhåndsdefinerte endepunkter er nødvendig før dette panel er klar for klinisk bruk.

Hjelpemiddel Informasjon

fil S1.

støtte materialer, Resultater og Diskusjon

doi:. 10,1371 /journal.pone.0085249.s001 plakater (docx)

File S2.

Oppsummering av blærekreft (tabell S1), lunge adenokarsinom (tabell S2), lunge plateepitelkarsinom (tabell S3), og hode og hals plateepitelkarsinom (tabell S4) pasient kohorter

doi:. 10,1371 /journal .pone.0085249.s002 product: (PDF)

Fil S3.

Sweave dokument som inneholder prøven

R

kode og utgang

doi:. 10,1371 /journal.pone.0085249.s003 product: (PDF)

fil S4.

Multivariate analyser av utviklingen i blærekreft (tabell S6), overlevelse i blærekreft (tabell S7), og overlevelse i lunge adenokarsinom (tabell S8)

doi:. 10,1371 /journal.pone.0085249.s004

(PDF)

Fil S5. Host Sammenligning av prognostisk effekt av CCP score og beste tilgjengelige kliniske variabler i blæren (tabell S9) og lunge adenokarsinom (tabell S10)

doi:. 10,1371 /journal.pone.0085249.s005 product: (PDF)

File S6.

Prognostiske moduler knyttet til utfallet i tobakksrelaterte kreftformer (tabell S5) (Excel XLSX fil). I hver årsklasse, overrepresentert Gene ontologi (GO) vilkårene og KEGG trasé ble identifisert fra lister over gener betydelig prediktiv av sykdom utfall (progresjon i BL pasienter og overlevelse i BL, LUAD, LUSC, og HNSCC pasienter, P 0,01) ved hjelp DAVID genet merknaden berikelse analyse verktøykasse. Konsekvent prognostiske moduler ble identifisert ved å rangere alle modulene først med antall kohorter med betydelige resultater (FDR 20%) og deretter på gjennomsnittlig p-verdi. Det var ingen signifikant overrepresentert prognostiske moduler i HNSCC pasient kohorter på FDR 20%

doi:. 10,1371 /journal.pone.0085249.s006 plakater (XLS)

File S7.

Prognostiske blære progresjon og lunge adenokarsinom overlevelse genet signaturer brukt i justerings analysen (tabell S11) (Excel XLSX fil)

doi:. 10,1371 /journal.pone.0085249.s007 plakater (XLS)

fil S8.

KKP gener i fem raffinerte signaturer (Tabell S12). Signaturer er merket med antall KKP gener

doi:. 10,1371 /journal.pone.0085249.s008 plakater (docx)

File S9.

Prognostiske moduler forbundet med blære progresjon og lunge adenokarsinom overlevelse signaturer (Tabell S13) (Excel XLSX fil). Overrepresentert Gene ontologi (GO) vilkårene og KEGG trasé ble identifisert for hver signatur ved hjelp av DAVID genet merknaden berikelse analyse verktøykasse. Moduler er rangert først av antall signaturer med betydelige resultater (FDR 20%) og deretter på gjennomsnittlig p-verdi

doi: 10,1371 /journal.pone.0085249.s009 plakater (XLSX)

figur. S1.

Prognostiske moduler knyttet til progresjon i blærekreft. I hver årsklasse, overrepresentert Gene ontologi (GO) termer og KEGG trasé ble identifisert fra lister over gener signifikant predikerer progresjon (P 0,01) ved bruk av DAVID genet merknaden berikelse analyse verktøykasse. Konsekvent prognostiske moduler ble identifisert ved å rangere alle modulene først med antall kohorter med betydelige resultater (FDR 20%) og deretter på gjennomsnittlig p-verdi. Hver subfigure omfatter ti moduler: de konsekvent prognostisk moduler og det øverste treffet «for hvert kull, merket med en stjerne (*), som er definert som modulen med lavest falske funnraten (FDR) i den kohorten som har en FDR 20% i flere kohorter. A, overrepresentert GO begreper knyttet til progresjon i blærekreft. . B, overrepresentert KEGG pathways assosiert med progresjon i blærekreft

doi: 10,1371 /journal.pone.0085249.s010 plakater (TIF)

Figur S2.

prognostisk verdi av CCP score i squamous celle lunge kreft og hode- og nakke plateepitelkarsinom. A, prognostisk verdi av CCP poengsum i squamous celle lungekarsinom (SCLC). Kaplan-Meier (KM) kurver ble generert for total overlevelse (OS) i Bild (N = 53) og Takeuchi (N = 35) kohorter og for tilbakefall overlevelse (RFS) i Son (N = 76) kohort.

Legg att eit svar