PLoS ONE: En data Likhet-basert strategi for Meta-analyse av Transkripsjon Profiles i Cancer

Abstract

Bakgrunn

Robuste transkripsjons signaturer i kreft kan identifiseres ved data likhet drevet meta analyse av genekspresjonsprofiler. En upartisk data integrasjon og forhør strategi har ikke tidligere vært tilgjengelig.

Metoder og funn

Vi gjennomført og utført en stor metaanalyse av brystkreft genuttrykk profiler fra 223 datasett som inneholder 10 581 menneske bryst kreftprøver ved hjelp av en ny data likhet basert tilnærming (iterativ opphøye). Kreft genekspresjonssignaturer hentet fra individuelle datasett ble gruppert etter data likhet og konsolidert inn i en meta-signatur med en tilbakevendende og konkordant genuttrykk mønster. En retrospektiv overlevelsesanalyse ble utført for å evaluere den prediktive kraften i en roman meta-signatur utledet fra transkripsjons profilering studier av menneskelig brystkreft. Valideringskullene består av 6,011 brystkreftpasienter fra 21 forskjellige brystkreft datasett og 1110 pasienter med andre kreftformer (lunge og prostata kreft) ble brukt til å teste robustheten av våre funn. Under iterativ opphøye analysen ble 633 underskrifter gruppert etter deres data likhet og dannet 121 signatur klynger. Fra de 121 signatur klynger, identifiserte vi en unik meta-signatur (BRmet50) basert på en klynge av 11 underskrifter som deler en fenotype relatert til svært aggressiv brystkreft. I pasienter med brystcancer, var det en signifikant sammenheng mellom BRmet50 og sykdomsforløp, og den prognostiske kraft BRmet50 var uavhengig av vanlige kliniske og patologiske kovarianter. Videre den prognostiske verdien av BRmet50 var ikke spesifikke for brystkreft, som det også spådd å overleve i prostata og lunge kreft.

Konklusjoner

Vi har etablert og implementert en ny data likhet drevet meta -analysemetoder strategi. Ved hjelp av denne tilnærmingen, har vi identifisert en transkripsjons meta-signatur (BRmet50) i brystkreft, og den prognostiske ytelsen BRmet50 var robust og anvendelig over et bredt spekter av kreftpasientpopulasjoner

Citation. Qiu Q, Lu P, Xiang Y, Shyr Y, Chen X, Lehmann BD, et al. (2013) En data Likhet-basert strategi for Meta-analyse av Transkripsjon Profiles in Cancer. PLoS ONE 8 (1): e54979. doi: 10,1371 /journal.pone.0054979

Redaktør: Aedín C. Culhane, Harvard School of Public Health, USA

mottatt: Mai 29, 2012; Godkjent: 22 desember 2012; Publisert: 29 januar 2013

Copyright: © 2013 Qiu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet delvis av en Howard Temin Award fra National Cancer Institute ved National Institutes of Health (CA114033 til YY), American Cancer Society-Institutional stipend (# IRG-58-009-51 til YY), og Vanderbilt Clinical og translasjonell Science Awards (CTSA) UL1 RR024975 fra National Center for Forskning Resources (NCRR), en del av National Institutes of Health (NIH), (CRC1838 til YY). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

brystkreft er den vanligste krefttypen hos kvinner og den nest største årsaken til kreft dødsfall blant kvinner i USA. En molekylær biomarkør som kan forutsi sannsynligheten for kreft progresjon til invasiv eller metastatisk sykdom kan veilede hvor aggressivt pasienter blir først behandlet [1]. Det er et klart behov for en bedre forståelse av hvordan molekylære profiler forholder seg til kreft fenotyper og kliniske resultater og for nye kreft biomarkører med definerbare og reproduserbar ytelse i ulike pasientgrupper.

Innføring av genom-skala genuttrykk profilering har ført til identifisering av spesifikke transkripsjons biomarkører som kalles genuttrykk signaturer. Oppdagelsen av genekspresjon signaturer fra en enkelt brønn drevne studien er relativt grei. Noen signaturer har verktøyet som transkripsjons biomarkører for klassifisering av pasienter med signifikant forskjellige overlevelses utfall i brystkreft [2], [3]. For eksempel har transcriptional profilering av primær brystkreft blitt brukt tidligere for å identifisere en 70-gen signatur (markedsført som MammaPrint men her betegnet som BRsig70) [3], et distinkt 76-genet signatur (BRsig76) [2], og andre ( Oncotype DX [4], [5], TAMR13 [6], geni [7], GGI [8], PAM50 [9] og PIK3CAGS278 [10]). Typisk for andre transkripsjons biomarkører, ble både BRsig70 og BRsig76 avledet fra et treningssett fra en enkelt studie og deretter validert med en test sett fra de samme retrospektive pasient kohorter. Når utsatt for ytre validering, kan de fleste signaturer bare valideres ved hjelp av en datasettet (NKI295) [11] eller noen mindre datasett med retrospektivt påløpte prøver. Denne godkjenningen metoden har uunngåelige begrensninger statistisk styrke eller utvalgsskjevhet. Som et resultat av en vanlig svakhet ved denne fremgangsmåte er dens mangel på konsistens og reproduserbarhet [12] -. [16]

Med hundrevis av brystkreft genekspresjon datasett deponert i offentlige databaser, vi nå har evnen til å utnytte disse dataene til sitt fulle potensial og oppdage tilbakevendende og pålitelige genekspresjonssignaturer for brystkreft prognose anslag. Men identifiseringen av en prognostisk uttrykk signatur gjennom meta-analyse av offentlig tilgjengelige kreft genuttrykk profiler representerer en underutnyttet mulighet. Det er flere rapporter om meta-analyse rammeverk som bruker flere brystkreft datasett for å bygge og validere prognostiske classifiers [7], [17], [18]. Disse tilnærminger fokuserer på å velge prediktorer fra kombinerte treningssett, enten ved å benytte gjennomsnitts Cox-score [18] eller tar hensyn til prøve molekylære subtyper [7], [17]. Men en ubesvart spørsmål hvordan å identifisere homogene genuttrykkstudier bruker en raffinert og upartisk valgmetoden [19]. For å ekstrapolere validerte prognostiske underskrifter til et bredere pasientpopulasjon, er nye biostatistiske metoder ved hjelp av data likhet basert analyse nødvendig [20].

For å unngå svakhetene ved enkelte studie-avledet signaturer og til å generere en ny strategi å bedre utnytte de tilgjengelige genuttrykk data fra uavhengige studier, har vi utviklet en meta-analyse strategi kalt opphøye (uttrykk analyseverktøyet) [21], [22]. Det vesentlige trekk ved opphøye er en database som inneholder tusenvis av genekspresjonssignaturer hentet fra publiserte studier som muliggjør signatur sammenligninger. I denne studien brukte vi opphøye i en iterativ måte (iterativ opphøye) å gjennomføre en data likhet drevet meta-analyse og belyse transkripsjons signaturer med forbedret prognostisk verdi i brystkreft. Vi viste at heterogene signaturer fra 223 offentlige datasett som inneholder 10 581 brystkreftprøver kan bli systematisk organisert av deres felles dataelementer (dvs. indre likheter og sykdoms fenotyper) og satt sammen til en ny signatur datatype som kalles en meta-signatur. Vi identifiserte en spesifikk meta-signatur som består av 50 gener (BRmet50) som er robust prediktiv av kreft prognose i 6,011 brystkreftpasienter fra 21 forskjellige brystcancer datasett, så vel som på andre maligniteter, inkludert lunge- og prostatakreft. Disse funnene illustrerer verdien av BRmet50 i brystkreft prognose uavhengig av behandlingsvariabler og indikerer at iterativ opphøye er en roman meta-analyse metode stand til å utføre informativ og robust funn av meta-signaturer i kreft.

Resultater

Utvinning av kreft hos mennesker Signatures

for å organisere komplekse transkripsjons data, har vi etablert en hierarkisk datastruktur. Det øverste nivået består av transkripsjons studier, og hver transcriptional studien ble delt inn i tre nivåer: datasett, grupper og prøver. En undersøkelse kan omfatte én eller flere datasett avhengig av eksperimentell design [21]. Fra 56 brystkreftstudier (tabell S1), har vi samlet 223 brystkreft datasett som representerer 10,581 brystkreftprøver. Primære brystkreftprøver innenfor hvert datasett ble gruppert etter deres kliniske attributter. Hvert datasett er inkludert i det minste to grupper av tumorprøver med forskjellige kliniske fenotyper (figur 1 øvre panel). For eksempel, de fenotyper relatert til kreft tilbakefall eller dårlig prognose omfatter svulststørrelse, nodal engasjement, karakter, lymphovascular invasjon, p53 status, BRCA1 mutasjon, BRCA2 mutasjon, østrogenreseptor (ER), og human epidermal vekstfaktor-reseptor-2 (HER2) status [23], [24]. To eller flere grupper per datasett var nødvendig for å generere statistiske sammenligninger. Totalt 633 betydelig genet lister ( «enkle signaturer») fra alle mulige parvise gruppesammenligninger ble generert tilsvarende ved hjelp av en t-test [21]. Alle 633 «enkle signaturer» ble deretter lagret i et menneskelig kreft signaturdatabase (HuCaSigDB) som er tilgjengelig på nettet (https://seq.mc.vanderbilt.edu/exalt/) [22]. De viktigste prosessuelle skritt for utvinning av signaturer er gitt i Methods S1.

Arbeidsflyten av iterative opphøye metode omfatter tre store prosesser. (1) Utvinning av 633 brystkreft signaturer. Alle sammenkoblede utvalgsgrupper innenfor hvert brystkreft datasett (n = 223) ble sammenlignet basert på alle mulige kliniske og patologiske kovariater som tumorstørrelse, lymfeknuteaffeksjon, klasse, men da status, lymphovascular invasjon, tilbakefall, metastaser, p53 status, BRCA1 og BRCA2 mutasjoner. Student t-test ble deretter utført for alle parvise sammenligninger, og en total av 633 brystkreft signaturer ble samlet og lastet inn i en database (HuCaSigDB). (2) Signatur klynger og klassifisering. Iterativ søk ble utført med hver av 633 underskrifter som en spørring (forankret eller frø) underskrift mot HuCaSigDB gjentatte ganger for å identifisere homologe signaturer med betydelig data likhet definert av opphøye. 121 ute av 633 spørre signaturer funnet minst ett tilsvarende signatur i HuCaSigDB og dannet 121 klynger, mens de resterende 512 (enkelts) ikke klarte å generere klynger. To typiske resultater er avbildet med skjematisk beskrivelse merket med forankrede signaturer: Singleton Sig21 og klyngen Sig24 inkludert 11 signatur medlemmer som Sig544, Sig128, Sig140, etc. Kunnskapsbasert analyse av signatur fenotyper og størrelser ble utført blant 121 signatur klynger. Åtte klynger hadde åpenbart metastase fenotyper. Av de åtte klynger, ble den største klyngen forankret ved søket signatur (sig24) valgt for videre analyse. (3) Identifisering av meta-signatur BRmet50. Alle 6,526 signatur gener fra de 11 underskrifter fra klyngen Sig24 ble montert sammen for å danne et syntetisk signatur (BRmet). Genene innenfor BRmet ble rangert basert på tilbakevendende frekvens og konkordans av differensial uttrykk representert av en meta-heat kartet. De 50 gener (BRmet50) representert i rader ble bestemt av en 100% tilbakevendende frekvens og genuttrykk profil samsvar blant de 11 signaturene representert i kolonner. Fargene i kart meta-varmen representerer retning av differensial genekspresjon innen en gitt transkripsjonen profil (rød for opp, grønt for ned, og svart for en manglende kamp). Fargeintensitet gjenspeiler tillit nivåer av differensial uttrykk.

En genuttrykk signatur ( «enkel signatur») som definert av opphøye er et sett med viktige gener med sine tilsvarende statistiske score og genuttrykk retningskoder ( opp eller ned). Noen «enkle signaturer» er biologisk knyttet til brystkreft prognose, men de ble avledet fra enkelt transkripsjon profilering studier og er alt for ofte underpowered, avkortet, eller lav kvalitet. Det er iboende begrensninger for ethvert individ profilering studie med liten utvalgsstørrelse i forhold til det store antallet potensielle prediktorer, begrensninger av teknologiske plattformer, sample variasjon og bioinformatikk eller statistisk metode bias. En underliggende forutsetning vi har gjort i å formulere denne tilnærmingen er at ethvert individ transkripsjonen profilering studien ikke dekode en hel uttrykk signatur. Snarere disse «enkle signaturer» representerer bare fragmenter av en komplett og felles transkripsjonen profil (meta-signatur).

Identifisering av en roman Breast Cancer Meta-signatur

Vi antok at en meta signatur med forbedret prediktiv makt kunne bli oppdaget av data likhet drevet meta-analyse av transkripsjons profiler fra flere relaterte studier. Opphøye analyse ga grunnlag for gruppering eller clustering «enkle signaturer» deling betydelig data likhet. Den iterative opphøye prosessen samlet homologe underskrifter fra «enkle signaturer» og konsolidert dem inn i meta-signaturer (Figur 1 midtre og nedre panel). Kort fortalt ble hver brystkreft signatur sammenlignet med alle brystkreft signaturer i HuCaSigDB og signatur parene med betydelig likhet ble gruppert sammen. Den iboende Forholdet mellom parvise signaturer ble først bestemt av genet symbol kamp og samstemmighet i retning av genekspresjon endring. Deretter ble en normalisert total poengsum identitet beregnes på grunnlag av Q-verdier fra de to signaturer. Den betydelige likhetsnivået ble bestemt ved simulering analyse [21] som forklart i Methods S1.

Vi utførte iterativ opphøye analyser der alle-mot-alle signatur likheten søk ble utført. Nærmere bestemt er hvert av de 633 «enkle signaturer» fra HuCaSigDB tjente som et frø (også kalt spørring eller forankret signatur) for å spørre alle «enkle signaturer» i HuCaSigDB gjentatte ganger og for å bringe andre homologe signaturer sammen ved deres felles elementer (dvs. indre likheter). Denne iterativ prosess «gruppert» eller «klynger» signaturer basert på deres likheter (figur 1 midtre panelet). Signatur parene som var tilstrekkelig like (p 0,05) ble bundet sammen for å danne bunter. Etter iterative sammenligninger, hvert frø signatur enten forble som en enkelt (dvs. et frø signatur som selv matchet, men stemte ikke med noen andre signaturer) eller dannet en klynge med andre signaturer.

Denne iterative opphøye prosessen starter med 633 frø signaturer resulterte i 121 signatur klynger og 512 enkeltfødte (figur 1 midtre panelet). Vi fokuserte på åtte konkrete klynger fordi de åtte frø signaturer og alle andre grupperte signaturer i hver av de åtte ble klart relatert til kreft metastasering. De resterende 113 klynger hadde ingen konsistente og tydelige kreft metastase fenotyper. For de åtte metastaserelaterte klynger, inneholdt hver ulike overlapp signatur medlemmer tilknyttet fenotyper som er kjente risikofaktorer for kreft metastaser som høyverdig svulster, ER-negativ status, basal-lignende celletype, og kreft tilbakefall. Av disse valgte vi den største signaturen klyngen inneholdende 11 metastaserelaterte signaturer (Figur 1 og Tabell 1) [2], [3], [6], [8], [11], [25] – [29]. Fordi hver signatur i klyngen ble avledet fra en sammenligning mellom svært aggressive og mindre aggressive brystkreft, denne sammenligningen ga en «dårlig prognose» gen signatur (tabell 1).

Hver av de 11 signaturene består av flere hundre gener. For å identifisere et tilbakevendende og konkordant genuttrykk mønster i metastatisk signatur klynge, alle gener som utgjorde de 11 signaturene (n = 6,526) ble montert i en syntetisk signatur utpekt som BRmet. Genene innenfor BRmet ble rangert basert på tilbakevendende frekvens og retning av differensial uttrykk (meta-retning) blant alle 11 underskrifter. En 100% tilbakevendende frekvens ble brukt til å velge de 50 beste gener for meta-signatur (BRmet50) (figur 1 nedre panel). Dermed BRmet50 profiler er konkordant blant alle 11 grupperte enkle signaturer (tabell 1). BRmet50 genene representerer betydelig forskjellig uttrykt gener ikke bare innenfor sine egne datasett, men også på tvers av 11 andre relaterte datasett (figur 1).

Stempler for BRmet50 gener er gitt i tabell S3. Bare fem gener i BRmet50 overlappet med BRsig70, og to ble funnet i felles med BRsig76. Antallet overlappende gener mellom BRmet50 og de seks andre kreft signaturer (Oncotype DX, TAMR13, Genius, GGI, PAM50, og PIK3CAGS278) er relativt lav (1% -27%), noe som tyder på at BRmet50 er et tydelig signatur. Fordi BRmet50 ble utledet fra en klynge av signaturer sammenligne svært aggressive og mindre aggressive brystkreft, spådde vi at BRmet50 ville bli assosiert med dårlig prognose ved brystkreft som kreft tilbakefall, metastaser, og død. Den generelle prognose trekk ved BRmet50 kan være annerledes enn de av BRsig70 /76 (BRmet70 og BRmet76) fordi de ble utviklet spesielt for å forutsi fjernmetastaser i tidlig stadium brystkreftpasienter med lymfeknute-negative status [2], [3]. Dermed skjønte vi at verken BRsig70 eller BRsig76 var fullt ut sammenlign BRmet50. Nei, de fungerte som prognostiske kontroll signaturer i denne studien.

Meta-validering av BRmet50 i Breast Cancer

Siden BRmet50 ble utledet fra en signatur klynge sammenligne flere og mindre aggressive kreftformer, vi retrospektivt undersøkt muligheten for BRmet50 å forutsi prognose på 21 datasett, inkludert 11 uavhengige validerings datasett som ikke brukes i signaturen klynging prosessen (tabell 2).

for å undersøke stabiliteten av iterative opphøye metode og for å unngå over-montering av de ni trenings datasett, brukte vi en «leave-one-out» kryssvalidering strategi for å utlede ni BRmet50 kontroll signaturer for de tilsvarende ni trenings datasett. I hver leave-one-out rettssaken, de medfølgende signaturer forble gruppert. Videre alle BRmet50 kontroll signaturer fra «la-one-out «prosedyre delt kjernen sett av 50 gener. Vi testet disse kontroll meta-signaturer i tilsvarende opplæring datasett (Tabell S2) og funnet ut at deres prognostiske forestillinger var så godt som BRmet50 (tabell 2). Data tyder på at iterativ opphøye basert klynging prosessen er en stabil og pålitelig metode som ikke er berørt av noen spesiell signatur medlem i BRmet klyngen.

De 11 uavhengige validerings datasett ble brukt for å evaluere BRmet50 prognose ytelse. Log-rank tester ble utført for å evaluere forskjellene i overlevelsesanalyse. P-verdier fra log-rank tester som sammenligner BRmet50, BRsig70, BRsig76, og de seks andre publiserte kreft signaturer (Oncotype DX, TAMR13, Genius, GGI, PAM50 og PIK3CAGS278) er oppsummert (tabell 2 og tabell 3). Hver signatur ble evaluert for sin evne til å klassifisere pasienter med brystcancer til «gode» og «dårlige» prognostiske grupper. Expression verdier for hver signatur ble hentet fra hvert tilsvarende datasettet, ble deretter unsupervised hierarkisk clustering utført ved hjelp av Spearman rank korrelasjon, og gruppeoppgaver ble bestemt i hvert datasett basert på den første delinger av de clustering dendrogrammer [30]. BRmet50 skilte mellom de gode og dårlige prognostiske grupper med hell i alle datasett (tabell 2), mens BRsig70 og BRsig76 ikke kunne diskriminere prognose grupper på fire og seks datasett hhv. Svikt i BRsig70 og BRsig76 å stratifisere prognostiske grupper i de datasett vedvarte etter at vi omklassifisert prøver ved hjelp av de opprinnelige algoritmer (f.eks, enten Pearson korrelasjonsmetode [3] eller tilbakefall poengsum metode basert på vektet Cox regresjon koeffisientverdiene [2] ). Dermed disse resultatene var uavhengige av statistiske metoder. Lignende resultater ble også oppnådd blant de seks andre veletablerte kreft signaturer fordi ingen av dem kunne diskriminere prognosegrupper i alle 11 test datasett (Tabell 3). Som et annet resultatmål, beregnet vi c-indeksen for kreft signaturer i 11 validerings datasett (tabell 3), som er en generalisering av arealet under mottaker drift karakteristikk (ROC) kurve [31]. Den prognostisk verdi (c-indeks) for BRmet50 og andre kreft underskrifter ble sammenlignet. For en gitt test datasett, er BRmet50 c-indeksen lik de fra de andre kreft underskrifter, noe som tyder på at BRmet50 og andre kreft signaturer gi sammenlign prognostisk informasjon.

Ytelse Målinger i BR1042

Kaplan-Meier analyse ble brukt for å illustrere forskjellige tilbakefall overlevelse i BR1042 blant de tre typene signaturer inkludert BRmet50, en BRmet50 kontroll signatur, og to tidligere identifiserte signaturer (BRsig70 og BRsig76) (figur 2). Resultatene viser en signifikant forskjell i tilbakefall overlevelse mellom de gode og dårlig prognose grupper som spådd for datasettet BR1042 av BRmet50 samt BRmet50 kontroll signatur (BRmet [-1042]) fra leave-one-out prosess (

p

0,05). Blant pasienter som BRmet50 spådd en god prognose, 10-års rate av tilbakefall overlevelse var 79% mot bare 47% blant de med dårlig prognose (figur 2, øvre venstre panel). Risikoen for tilbakefall forutsagt av BRmet50 var signifikant høyere hos pasienter i dårlig prognose gruppe enn at blant de i god prognose gruppen. Men for det samme datasettet, verken BRsig70 eller BRsig76 preget en betydelig forskjell i metastase overlevelse mellom de gode og dårlige prognostiske undergrupper.

Data fra 108 svulster fra datasettet BR1042 ble delt i to grupper etter BRsig70 og BRsig76 (bunnpaneler), kontroll signatur (BRmet [-1042]) fra leave-one-out-metoden, eller BRmet50 (øvre paneler) genuttrykk profiler. I hver overlevelse tomt, ble to typer av tilbakefall overlevelse sammenlignet: en dårlig prognose gruppe (svart stiplet linje) og en god prognose gruppe (rød heltrukket linje). Den tilbakefall-fri tid i dager vises på x-aksen, og y-aksen viser sannsynligheten for tilbakefall overlevelse. Den p

verdier indikerer statistisk signifikans for å overleve tidsforskjeller mellom de to gruppene

Ytelsen BRmet50 (c-indeksen. 0,6573, p

verdi

:

0,002) var bedre enn de av BRsig70 og BRsig76 (c-index: 0,5839 eller 0,5172, henholdsvis p-verdi 0,14) når undersøke BR1042 datasett. Våre resultater tyder på at den prediktive kraft BRmet50 er robust og anvendelig over et bredt spekter av uavhengige datasett.

For å vurdere om BRmet50 tilknytning prognose utfallet var bestemt, genererte vi 1000 underskrifter med identisk størrelse (50 gener) ved hjelp tilfeldig valgt gener fra det humane genom. Alle tilfeldige skriftene ble testet på samme panel av 21 test datasett. Etter 1000 tilfeldige variasjoner av genet signaturer, ble p-verdien fordeling (-log p-verdi) fra hvert testdatasettet generert, og p-verdier fra BRmet50 og de seks andre publiserte kreftskriftene ble også plottet på X-aksen distribusjons tomter (Tall S2 og S3)

Selv om noen tilfeldige signaturer er signifikant (

p

0,05). assosiert med brystkreft utfall i ulike datasett, foreninger er sterkere for de syv brystkreft signaturer i mer enn halvparten av test datasett. Disse kontrollresultatene gyldig statistisk støtte for sin prognose relevans. Videre har vi lagt merke til at de fleste p-verdier fra BRmet50 var på høyre side av tilfeldig p

verdi distribusjoner (figurene S2 og S3). Vi har sammenlignet pasientenes prognose sammenslutning av BRmet50 til de av 1.000 tilfeldige signaturer med identisk størrelse (Figur S2 og S3), og vi bekreftet at BRmet50 viste en sterkere tilknytning enn de aller fleste ( 95%) tilfeldige signaturer. Dermed er sannsynligheten for å få de samme p-verdiene som BRmet50 ved en tilfeldighet i de samme test datasett i tabell 2 betydelig lav (

p

0,05).

Logisk Power of BRmet50 Er uavhengig av vanlig klinisk og patologisk kovariater

Fordi datasett BR1141 [6] omfatter 269 pasienter med brystkreft og en full panel av vanlige kliniske og patologiske kovariater, vi testet om sammenslutning av BRmet50 med dårlig prognose utfallet var uavhengig av etablerte kliniske og patologiske kriterier bruker robust BR1141 datasettet undersøkt av Cox proporsjonal-farer modeller (tabell 4 og tabell S4). Sammenhengen mellom BRmet50 og risikoen for dårlig klinisk resultat var vesentlig uavhengig av tumorstørrelsen, lymph node-status, eller tamoxifen behandling (

p

0,05). Videre kan BRmet50 skille svulster med middels differensiering eller ER-positive i gode og dårlige prognostiske underkategorier (hasardratio for en dårlig prognose: 2,5;

p

≤0.001), men ikke for de som var ER-negativ. Verken BRsig70 eller BRsig76 var i stand til stratifisering svulster med enten god eller dårlig differensiering i noen undergruppe av BR1141 unntatt tamoxifen behandling undergruppe (tabell 4). Fordi BR1141 var blant de opplærings datasett, vi også testet en leave-one-out «BRmet50 kontroll signatur, og fant identiske signifikante sammenhenger (tabell S4). Sammenhengen mellom BRmet50 og tilbakefall utfallet i BR1141 undergruppe av pasienter uten tamoksifen behandling er nærmere beskrevet i Methods S1.

Fem av de 21 datasettene som brukes for å evaluere BRmet50 ytelse (BR1042, BR1095, BR1128, BR1141, GSE7390) representert 1,183 svulster og hadde data på et felles sett av clinicopathologic egenskaper inkludert tumor størrelse, klasse, lymfeknute status, og Nottingham prognostisk indeks (NPI) [32], [33]. Univariate og multivariate analyser av disse fem validerings settene ble utført for å ytterligere evaluere resultatene av BRmet50 sammenlignet med andre prognostiske faktorer, nemlig BRsig70, BRsig76, alder, tumorstørrelse, klasse, lymfeknute status, og NPI. De ujusterte (tabell S5) og justert (tabell 5 og tabell S6) hazard ratio av disse faktorene og signaturer ble bestemt.

Univariat Cox proporsjonal farer analyse viste at BRsig70, BRsig76, eller noen enkelte felles prognostisk faktor (tumor størrelse, klasse, lymfeknute status, eller NPI) kunne ikke klare å gjette kreftprognoser i alle fem datasett. Men BRmet50 var unikt i stand til å betydelig skille tumorprøver i to prognostiske grupper i alle fem valideringssett. Den prognostiske verdi av BRmet50 var større enn hver av de etablerte risikofaktorer (Tabell S5). For eksempel optimale ujusterte hazard ratio (HR) (høy risiko vs lav risiko) i BR1128 var 2,8 (95% CI: 01.05 til 04.09; p 0,001) (BRmet50 kontroll), 1,9 (95% CI: 01.01 til 03.03; p = 0,01) (BRmet70), 2,0 (95% KI: 1.1 til 3.5; p = 0,02) (BRmet76) og 2,2 (95% CI: 01.06 til 02.09; p 0,01) (NPI), henholdsvis. Dataene antydet at BRmet50 var mer effektiv på å forutsi tilbakefall overlevelse i BR1042, BR1141, og GSE7390 og sykdomsfri overlevelse i BR1095 og BR1128 enn etablerte prognostiske faktorer.

multivariat Cox proporsjonal farer analyse ble brukt for å avgjøre om BRmet50, BRsig70, eller BRsig76 lagt uavhengig prognostisk informasjon til andre standard clinicopathological funksjoner. I denne multivariate Cox proporsjonal farer analyse (tabell 5), signifikant sammenheng (

p

0,05) ble observert i alle fem test datasett mellom BRmet50 og pasient tilbakefall-fri eller sykdom-fri tid etter justering for standard kliniske kovariatene. Dermed BRmet50 bidratt ny og viktig prognostisk informasjon utover det som tilbys av etablerte kliniske prediktorer. For det meste, BRsig70 og BRsig76 viste ingen signifikante assosiasjoner i disse analysene.

Logisk Power of BRmet50 i andre krefttyper

Fordi BRmet50 klarer spådde brystkreft prognose og fordi noen molekylære onkogene hendelser er konservert blant flere krefttyper [34], hypotese vi at BRmet50 kan representere et konservert transkripsjonen profil for dårlig prognose i flere krefttyper.

for å undersøke den prognostiske spesifisitet BRmet50, vi undersøkt om BRmet50 kunne forutsi prognose i andre epiteliale kreftformer så som kolon-, lunge-, eller prostatakreft. Tre datasett, en for hver krefttype: tykktarmskreft (n = 73) [35], lungekreft (n = 441) [36], og prostata kreftpasienter (n = 596) (Tabell 6) [37] ble underkastet univariate og multivariate analyser. På grunnlag av genekspresjon signaturer (BRsig70, BRsig76, eller BRmet50), ble 1,110 pasientprøver separert i to grupper (tabell 6). Alle tre underskrifter klarte å forutsi kreft tilbakefall i tykktarmskreft [35] (p 0,05). Men BRmet50 men verken BRsig70 eller BRsig76 klarer spådde sykdom spesifikk overlevelse i prostata kreft og tilbakefall overlevelse i lungekreft (

p

0,01), noe som tyder på at transkripsjons profiler for dårlig prognose kan være mer konservert i bryst-, lunge- og prostatakreft. I lungekreft datasettet, de gode prognosegrupper spådd av BRmet50 hadde høyest tilbakefall overlevelse ( 40% og

p

0,01) blant de 3 signaturer. Vi har også bestemt om sammenhengen mellom de tre signaturer og kliniske resultater hos pasienter med prostata, lunge og tykktarmskreft var uavhengig av etablerte kliniske og patologiske kriterier (tabell 6). Resultatene tyder på at BRmet50 kan tjene som en prognostisk biomarkør for både brystkreft og ikke-brystkreft og kan representere en konservert transkripsjonen profil mellom flere krefttyper.

Diskusjoner

Data generert av high-throughput transkripsjons studier av kreft har raskt opparbeidet og det er økende interesse i å oversette denne informasjonen til klinisk verdi. Selv om enkeltstudie analyse kan være informative, er det ofte påvirkes av iboende begrensninger. Disse begrensningene kan overvinnes ved å kombinere beslektede uavhengige undersøkelser i en meta-analyse. Vår studie viste at heterogene signaturer fra enkelte kreftstudier kan systematisk organisert i en meta-signatur (BRmet50) basert på sine iboende data likheter ved en ny meta-analyse strategi (iterativ opphøye). Denne meta-analyse tilnærming kan øke statistisk styrke, minimere falske funn, redusere batch effekter, og forbedre generalizability av funnene.

Legg att eit svar