PLoS ONE: Exploring genekspresjonssignaturer for å forutsi Sykdomsfri overlevelse etter Reseksjon av tykktarmskreft Liver Metastases

Abstract

Bakgrunn og mål

Denne studien ble utformet for å identifisere og validere gen signaturer som kan forutsi sykdomsfri overlevelse (DFS) hos pasienter som gjennomgår en radikal reseksjon for sine kolorektale levermetastaser (CRLM).

Metoder

Tumor genuttrykk profiler ble samlet inn fra 119 pasienter som gjennomgår kirurgi for deres CRLM i Paul Brousse Hospital (Frankrike) og University Medical Center Utrecht (Nederland). Pasientene ble delt inn i høy og lav risikogruppene. En tilfeldig valgt treningssett ble brukt til å finne prediktive gen signaturer. Evnen til disse gene signaturer for å forutsi DFS ble testet i et uavhengig valideringssett omfattende resten av pasientene. Videre ble 5 kjente kliniske score risiko testet i vår komplette pasient kohort.

Resultat

Ingen genet signatur ble funnet som betydelig spådd DFS i valideringssettet. I kontrast, tre av fem kliniske score risiko var i stand til å forutsi DFS hos vår pasient kohort.

Konklusjoner

Ingen genet signatur ble funnet som kunne forutsi DFS hos pasienter som gjennomgår CRLM reseksjon. Tre av fem kliniske score risiko var i stand til å forutsi DFS i vår pasient kohort. Disse resultatene understreker behovet for å validere risiko score i selvstendige pasientgrupper og foreslå forbedret design for fremtidige studier

Citation. Snoeren N, van Hooff SR, Adam R, van Hillegersberg R, Voest EE, Guettier C, et al. (2012) Exploring genekspresjonssignaturer for å forutsi Sykdomsfri overlevelse etter reseksjon av tykktarmskreft levermetastaser. PLoS ONE 7 (11): e49442. doi: 10,1371 /journal.pone.0049442

Redaktør: Ajay Goel, Baylor University Medical Center, USA

mottatt: May 1, 2012; Godkjent: 07.10.2012; Publisert: 21.11.2012

Copyright: © 2012 Snoeren et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av den nederlandske Kreftforeningen tilskuddet 2007-3923. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

tykktarms~~POS=TRUNC kreft~~POS=HEADCOMP er den tredje vanligste kreftformen hos menn og den andre hos kvinner over hele verden, står for ca 608,000 dødsfall på verdensbasis [1]. Leveren er det mest vanlig og ofte bare området av metastatisk sykdom. Utviklingen av levermetastaser i ca 50% av pasientene som er den bestemmende faktor for overlevelse hos pasienter med kolorektal kreft. Kirurgisk reseksjon er den beste behandlingsalternativ for pasienter med kolorektal levermetastaser som tilbyr en median overlevelse på over 40 måneder etter reseksjon sammenlignet med en median overlevelse på 18 måneder når de ble behandlet med kjemoterapi og 6 til 12 måneder hvis pasienten forblir ubehandlet [2]. Dessverre, vil 60% -80% av pasientene utvikler lokale eller fjerne tilbakefall etter R0 reseksjon av kolorektal levermetastaser [2] – [5]. Pasienter med tilbakefall er sannsynlig å dra nytte av adjuvant kjemoterapi. Imidlertid, 20-40% av de pasientene som ikke utvikler gjentakelse, og vil sannsynligvis bedre stå ubehandlet etter lever reseksjon. Siden kjemoterapi er forbundet med alvorlig sykdom og død, bør terapien-assosiert risiko derfor være begrunnet i en betydelig forbedring i overlevelse av disse pasientene.

Mange forskningsgrupper har forsøkt å definere faktorer forutsi sykdomsfri overlevelse og total overlevelse (OS) etter reseksjon av levermetastaser [5], [6]. Nylig, fem publiserte kliniske risiko score, kombinere ulike kliniske faktorer, ble validert i en uavhengig pasient kohort som viser at to kliniske score risiko var i stand til å forutse total overlevelse i et uavhengig sett med pasienter [7]. Prediksjon av (sykdomsfri) overlevelse kan forbedres ved bruk av genuttrykk som kan fange tumor egenskaper ikke reflekteres av clinicopathological variabler.

Genome bredt genuttrykk profilering har blitt brukt til å forutsi sykdom utfall eller respons på behandling i mange forskjellige tumortyper, [8], [9] Det er også blitt vist at ekspresjonen profilering kan brukes til å identifisere kolorektale svulster med forskjellig aggressivitet og metastatisk potensiale [10] – [13]. Ingen studier har imidlertid blitt publisert der genekspresjon ble brukt til å forutsi sykdomsfri overlevelse etter reseksjon av kolorektal levermetastaser. Identifisering av et gen signatur i stand til å identifisere tilbakefall utsatt kolorektale levermetastaser ved reseksjon vil åpne veien for valg av pasienter som er sannsynlig å dra nytte av aggressiv behandling etter reseksjon, mens kilde andre unødvendig behandling.

Resultater

pasienter og tumorprøver

hundre førtiåtte pasienter møtte inn- og eksklusjonskriterier uttrykk. Profiler ble vellykket innhentet for 119 pasienter. De baseline karakteristikker av de 119 inkluderte pasienter, vist i tabell 1, var ikke signifikant forskjellig mellom høy versus lav risikogruppe, med unntak av administrasjon av kjemoterapi. pasienter med høy risiko fått neoadjuvant kjemoterapi oftere og adjuvant kjemoterapi sjeldnere enn lav-risiko pasienter. Pasientprøver hadde en gjennomsnittlig tumorcelle prosentandel på 45% (95% CI 40,75 til 49,60), nekrose 19% (95% CI 16,19 til 22,47) og fibrose 20% (95% CI 16,44 til 22,71). Mener oppfølging var 26,7 måneder. En sammenligning av baseline karakteristikker av 119 inkludert og 29 ekskluderte pasientene er vist i tabell S1.

Pasientene er delt inn i en høy og en lav risiko prediksjon gruppe basert på risiko prediksjon av de forskjellige gen signaturer. Gene signaturer ble oppdaget definere høy risiko som DFS ≤1 år og lav risiko som DFS 1 år hvis ikke annet er nevnt. Hazard ratio av genet signatur forslaget vises med 95% konfidensintervall i parentes. Den p-verdi på log-rank test vises også, med p-verdi justert for multippel testing mellom parentes. A: overlevelseskurver for pasienter i treningssettet. Gene signaturen ble oppdaget ved hjelp av samme treningssettet. B: overlevelseskurver for pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av full treningssettet. C: Overlevelseskurver for pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av full opplæring sett definerer høy risiko som DFS ≤6 måneder og lav risiko som DFS 2 år. D: Overlevelseskurver for UMC Utrecht pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av UMC Utrecht undergruppe av treningssettet. E: Overlevelseskurver for Paul Brousse pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av Paul Brousse undergruppe av treningssettet. F:. Som E, men med bare Paul Brousse pasienter som fikk neoadjuvant kjemoterapi (trening og validering sett)

Opprinnelig satt opp av studien: overvåket modell dele pasienter med DFS ≤1 år versus pasienter med DFS 1 år. Genet signaturen ble oppdaget ved hjelp av treningssettet og deretter testet på uavhengig validering sett. B: I likhet med A, ved hjelp av en veiledet modell dele pasienter med DFS ≤6 måneder versus pasienter med DFS 2 år. C: I likhet med A, inkludert bare pasienter som ble behandlet i Paul Brousse. D: I likhet med A, inkludert bare pasienter som ble behandlet i UMC Utrecht. E:. I likhet med A, inkludert bare pasienter som ble behandlet i Paul Brousse behandles med neoadjuvant kjemoterapi

Gene Expression Signatur

Bruke opplæring sett 75 pasienter fra begge sentre, et gen signatur ble oppdaget som består av 20 gener (tabell S2). Dette var den mest forutsigbare gensignaturen målt i treningssettet, i stand til å forutsi sykdomsfri overlevelse med høy statistisk signifikans (figur 1A). Når den brukes for å forutsi risikoen for pasientene i uavhengig validering sett av 44 pasienter, men dette genet signatur var ikke i stand til signifikant å forutsi DFS (figur 1B). Dette peker på overfitting på treningssettet pasienter, et faktum understrekes av arealet under kurven (AUC) av 0,508 (95% KI 0,482 til 0,534) oppnådd under signaturen oppdagelsen (se Methods). Kraften i log-rank test som brukes er vist i figur S1. En analyse for å finne funksjonelle berikelse for de 20 genene i signaturen ikke klarte å finne noen vesentlig berikelse. Etter å ha mislyktes i å finne en prediktiv gen signatur, vi undersøkt om en strengere definisjon av høy og lav risikogruppene vil resultere i en bedre gen signatur ved å dele treningen satt inn i en høyrisikogruppe for pasienter med DFS mindre enn 6 måneder og et lav risiko gruppe med en DFS på minst 2 år (figur 2B). Selv om validerings resultatene av dette genet signatur syntes å vise en positiv utvikling det også mislyktes i å nå betydning (figur 1C).

Pasientene er delt inn i en høy og en lav risiko prediksjon gruppe basert på risiko prediksjon av forskjellige gen signaturer. Gene signaturer ble oppdaget definere høy risiko som DFS ≤1 år og lav risiko som DFS 1 år hvis ikke annet er nevnt. I all trening setter forholdet mellom pasienter behandlet med neoadjuvant kjemoterapi med ubehandlede pasienter i høy og lav risiko gruppen ble holdt så lik som mulig for å utelukke noen behandling bias. Hazard ratio av genet signatur forslaget vises med 95% konfidensintervall i parentes. Den p-verdi på log-rank test vises også, med p-verdi justert for multippel testing mellom parentes. A: overlevelseskurver for pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av full opplæring sett kontrollert for neoadjuvant behandling bias. B: overlevelseskurver for pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av full opplæring sett definerer høy risiko som DFS ≤6 måneder og lav risiko som DFS 2 år og kontrollerende for neoadjuvant behandling bias. C: Overlevelseskurver for UMC Utrecht pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av UMC Utrecht undergruppe av treningssettet kontrollert for neoadjuvant behandling bias. D: Overlevelseskurver for Paul Brousse pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av Paul Brousse undergruppe av treningssettet kontrollert for neoadjuvant behandling bias.

Pasientene er delt inn i en høy og en lav risiko prediksjon gruppe basert på risiko prediksjon av forskjellig genet signaturer. Gene signaturer ble oppdaget definere høy risiko som DFS ≤1 år og lav risiko som DFS 1 år hvis ikke annet er nevnt. Både trening og valideringssett ble delt inn neoadjuvant behandlede og ubehandlede pasienter. Resultatene er bare vist hvor treningssettene inneholdt nok høy og lav risiko pasienter å gjøre signatur oppdagelsen mulig. Hazard ratio av genet signatur forslaget vises med 95% konfidensintervall i parentes. Den p-verdi på log-rank test vises også, med p-verdi justert for multippel testing mellom parentes. A: overlevelseskurver for pasienter i valideringssettet. Gene signaturer ble oppdaget ved hjelp av full opplæring sett stratifisert etter neoadjuvant behandling. B: Overlevelseskurver for ubehandlede UMC Utrecht pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av ubehandlede pasienter UMC Utrecht i treningssettet. C: Overlevelseskurver for neoadjuvant behandlet Paul Brousse pasienter i valideringssettet. Gene signaturen ble oppdaget ved hjelp av neoadjuvant behandlet Paul Brousse pasienter av treningssettet.

Noen av clinicopathological faktorer signifikant forskjellig mellom pasienter fra Paul Brousse Hospital og University Medical Center i Utrecht ( Tabell S3). For å utforske muligheten for at den forrige unnlatelse av å finne en prediktiv gen signatur kan ha blitt forårsaket av disse forskjellene, ble genet signatur oppdagelsen gjentas for UMC Utrecht prøver og Paul Brousse prøvene separat. Genet signatur avledet fra UMC Utrecht data alene ikke holder noen prediktiv kraft når validert (figur 1D). Validering av Paul Brousse genet signatur, derimot, viste en positiv trend (figur 1E). Resultatet av en multivariabel regresjon Cox, antyder imidlertid at genet signaturen er ikke en uavhengig prediktiv faktor (tabell 2). Stage av primærtumor og administrasjon av neoadjuvant kjemoterapi virket tilstrekkelig til å forutsi DFS innenfor valideringssettet. Det er mulig at neoadjuvant kjemoterapi, som blir administrert før prøvesamling, hadde en effekt på genekspresjon mønster og var derfor en forstyrrende faktor i den eksperimentelle oppsettet. Dette bekreftes av fraværet av prediktiv kraft når signaturen oppdagelsen ble utført utelukkende på Paul Brousse pasienter som mottar neoadjuvant kjemoterapi (figur 1F). I tillegg kan en analyse av genene som differensielt uttrykte mellom pasienter behandlet med neoadjuvant kjemoterapi og ubehandlede pasienter viste 875 gener som var signifikant opp- eller nedregulert (tabell S4) som tyder på at neoadjuvant kjemoterapi induserer en betydelig endring i den målte genekspresjon. For å undersøke om fraværet av en prediktiv signaturen ble forårsaket av neoadjuvant behandling skjevhet i høyrisikogruppen signaturen oppdagelsen ble gjentatt med opplæring sett var dette skjevhet ble fjernet (figur 3), samt analysere den neoadjuvant behandlede og ubehandlede pasienter separat ( figur 4). Resultatene antyder sterkt at fraværet av en prediktiv signatur er uavhengig av virkningene av neoadjuvant behandling, å legge det forbeholdet at i noen av disse sammenligningene prøvestørrelsen er lav. Tabell S5 viser prediktiv ytelsen til alle gense signaturer som er beskrevet ovenfor når det brukes til å forutsi DFS omdefinert som en dikotom variabel.

Overlevelseskurver basert på alle 119 pasienter som bruker kjente kliniske prediktorer. Hazard ratio av den kliniske risiko prediktor er vist med 95% konfidensintervall i parentes. Den p-verdi på log-rank test vises også, med p-verdi justert for multippel testing mellom parentes. A: Iwatsuki (høy risiko ≥3, lav risiko 3). B: Basingstoke (høy risiko ≥10, lav risiko 10). C: Fong (høy risiko ≥3, lav risiko 3). D: Mayo (høy risiko ≥2 lav risiko 2). E: Nordlinger (høy risiko ≥4, lav risiko 4)

Validering av kliniske risiko Scores

De univariate overlevelse analyseresultater for alle clinicopathological faktorer er avbildet i tabell 3. . i en multivariat Cox regresjonsmodell, som inneholder de faktorene som vises p-verdier under 0,1 i univariable analyse, høyere stadium av primærtumor (p = 0,006, HR = 1,444, 95% KI = 1,110 til 1,877), stor reseksjon ( p = 0,005, HR = 2,190, 95% KI = 1,268 til 3,784), antall levermetastaser (p = 0,031, HR = 1,142, 95% KI = 1,012 til 1,289) og administrasjon av adjuvant kjemoterapi (p 0,001, HR = 0,382, 95% KI = 0,237 til 0,617) ble funnet å være uavhengige risikofaktorer for dårlig DFS.

Alle elementer av de kliniske risiko score ble dokumentert med unntak av status for hepatoduodenal lymfeknuter, noe som gjorde det umulig for risiko score på Zakaria til å være høyere enn 2. Fordi vi ikke inkluderte pasienter med ekstrahepatiske sykdom i denne studien, Basingstoke risikoscore var ikke ferdig. Tre av fem kliniske risiko score spådd DFS nøyaktig i våre pasienter inkludert i Basingstoke, Fong og Nordlinger risiko score (Tabell 3). Av disse poengsummen av Fong gjorde det best. Kaplan Meier-kurver for høy og lav risiko spådd pasienter, basert på de ulike kliniske score, er avbildet i figur 5.

Diskusjoner

Denne studien ble utformet for å identifisere og validere en genuttrykk basert klassifikator som forutsier DFS. Dessverre kunne vi ikke finne et gen signatur som kunne gi en betydelig forutsi DFS i en uavhengig validering sett. Et gen signatur utviklet ved hjelp av bare Paul Brousse pasientprøver gjorde viser en positiv trend på validering. Men i en multivariat Cox regresjonsmodell, signaturen ikke viser seg å være en faktor for DFS. I stedet for reflekterende tumorbiologi, genet signatur ut til å bli påvirket av en skjevhet i tidligere administrering av kjemoterapi, en mulighet som må tas i betraktning når man gjennomfører fremtidige studier. Dette synet ble styrket både ved fravær av prediktiv kraft i et gen signatur utformet på en undergruppe med bare Paul Brousse pasienter som fikk neoadjuvant kjemoterapi, samt en analyse av differensial genuttrykk mellom pasienter behandlet med neoadjuvant kjemoterapi og ubehandlede pasienter som viste 875 gener differensielt uttrykte. For å utelukke at fraværet av en prediktiv gen signatur ble forårsaket av neoadjuvant behandling skjevhet i høyrisikopasientgruppen ble signaturen oppdagelsen gjentatt ved bruk treningssett var neoadjuvant skjevhet ble fjernet, samt analysering av neoadjuvant behandlede og ubehandlede pasienter separat . I likhet med tidligere resultater fra denne studien de resulterende gen signaturer var ikke prediktiv av DFS i valideringssettet indikerer at overrepresentasjon av neoadjuvant behandling i høyrisikopasientgruppen ikke forklare mangelen på positive resultater.

Vi har også testet fem kjente kliniske risiko score og funnet ut at Basingstoke, Fong og Nordlinger betydelig spådd DFS i vår pasientgruppe. Det faktum at tre av fem score var prediktiv er bemerkelsesverdig gitt det faktum at disse kliniske risiko score (CRS) ble utviklet i en tid der bruk kjemoterapi i primær CRC var sjelden [14] – [18]. De samme fem kliniske risiko score ble nylig godkjent av Reissfelder og kolleger. De fant at Fong og Iwatsuki score var i stand til å forutsi sykdomsspesifikk overlevelse i sine pasienter, men ikke Nordlinger og Basingstoke indeksen [7]. Det er bemerkelsesverdig at bare Fong stillingen var prediktiv i begge studiene. Den ikke-signifikant korrelasjon av Iwatsuki stillingen i DFS kan skyldes det faktum at den høyeste poengsum ikke kunne beregnes, siden vi ikke registrere status for hepatoduodenal lymfeknuter. Spørsmålet gjenstår: hvorfor har vi ikke finne en signatur forutsi DFS etter reseksjon av kolorektale levermetastaser? Vanskeligheter med å forutsi (sykdomsfri) overlevelse med genuttrykk profilering har blitt rapportert nylig. Lauss et al evaluert resultatene av 8 publisert gen signaturer for å forutsi tilbakefall i blærekreft som ingen overlevde validering [19]. En gjennomgang vurdere gen signaturer som er utviklet for å forutsi overlevelse i lungekreft i 16 studier ble alle funnet utilstrekkelig for bruk i klinisk praksis på grunn av manglende eller utilstrekkelig validering. I disse studiene, enten signaturen ikke utkonkurrere kliniske faktorer eller forfatterne ikke ta påvirkning av noen av de kliniske faktorer [20].

Vi mener at utformingen av vår studie var av tilstrekkelig kvalitet til å kunne finne et gen signatur for å forutsi DFS. Imidlertid kan det ikke utelukkes at en brukbar gen signatur eksisterer, men ble ikke funnet grunn til å begrense faktorer i vår studie. Disse potensielle faktorer omfatter vår definisjon av risikopasienter høy og lav i signaturen oppdagelse, at antall pasienter inkludert i studien, spesielt i lys av heterogeniteten av pasientgruppen, inkludering av pasienter fra bare to medisinske sentre, eksistensen av en før behandlingseffekt og grenser for følsomheten av mikromatriser.

levermetastaser er i sin natur forutinntatt mot en mer aggressiv undergruppe av CRC. Det kan derfor være spekulert i at genutrykksmønster som karakteriserer hurtig tilbakevendende levermetastaser er for svake til å være avdekket ved hjelp av prøvestørrelsen som anvendes i denne studien. Videre tilbakefall etter reseksjon av levermetastaser ikke kan være avhengig av egenskapene til den levermetastaser i seg selv, men på tilstedeværelsen av mikrometastaser ved tidspunktet for leveren reseksjon.

Selv om vi ikke kan utelukke at det eksisterer en forutsigende gen signatur, ingen ekstra fordelen av genekspresjonssignaturer for prediksjon av sykdomsfri overlevelse ved metastatisk kolorektal sykdom etableres basert på resultatene av denne studien. Endelig Fong klinisk risiko score, allerede validert av Reissfelder et al [7], er den kraftigste risiko score for å forutsi DFS av pasienter med resected CRLM av de fem testede risiko score i vår studie. Denne kliniske risikoscore bør brukes for lagdeling i prospektive kliniske studier som undersøker mulig nytte av adjuvant behandling hos pasienter som gjennomgår kirurgi for CRLM.

Materialer og metoder

Pasientprøver

frosne tumorprøver fra 148 pasienter ble hentet fra Paul Brousse Hospital i Villejuif, Frankrike og UMC Utrecht i Nederland mellom november 2000 og august 2010. studien protokollen ble godkjent av det medisinske Etisk Komité (MEC) ved University Medical Center Utrecht som er anerkjent av artikkel 16 av WMO (nederlandsk lov om medisinsk forskning med mennesker). Skriftlig informert samtykke ble innhentet fra alle pasienter. Prøver ble tatt av pasienter i alderen 18 år og eldre som gjennomgikk kurativ reseksjon for histologisk bekreftet levermetastaser fra CRC. Pasienter med en historie med ikke-kolorektal kreftformer, ekstrahepatisk sykdom eller makroskopisk restsykdom (R2) etter operasjonen ble ekskludert. Pasienter som fikk lokal ablative terapi eller chemoembolization alene eller i kombinasjon med reseksjon ble ekskludert. Bare prøven ble inkludert som ble hurtigfrosset i flytende nitrogen i løpet av 30 minutter etter reseksjon og ble lagret i -80 ° C. Mengden av stroma, tumor, godartede leverceller og nekrose ble bestemt ved de to studie patologer (C.G og P.J.vD). Pasienter som prøvene inneholdt godartet leveren vev eller utilstrekkelig tumorceller ble ekskludert fra studien. Intraoperativ ultralyd av leveren ble utført i alle pasienter for å vurdere størrelsen og plasseringen av levermetastaser. Størrelsen på datasettet ble bestemt av de tilgjengelige pasient tumorprøver i de to deltakende institusjonene som oppfylt alle inn- og eksklusjonskriterier. Pasient, tumor- og kirurgiske egenskaper ble hentet fra våre prospektivt innsamlede databaser. Definisjonen av synkrone levermetastaser (diagnose innen to måneder etter første diagnose) var basert på det som er fastsatt av US National Cancer Institute.

Oppfølgings

Alle pasientene fikk standard følger opp med spiral CT av magen og brystet hver 3. måned for å overvåke tilbakefall. Sykdomsfri overlevelse ble definert som tiden fra reseksjon til tidspunktet for det første tegn på tilbakefall på CT-skanning. Alle pasientene ble sensurert på tidspunktet for dødsfallet eller siste oppfølging. Overlevelse ble bestemt ved hjelp av Kaplan-Meier overlevelsesfunksjonen.

Gene Expression Profilering

RNA isolering.

Total RNA ble isolert fra individ vevsprøver ved hjelp Trizol reagens (Invitrogen) følge produsentens protokoll. RNA ble renset ved anvendelse av RNeasy Mini-kit (Qiagen) og ble underkastet DNase-behandling ved bruk av Qiagen DNA-settet. Den avling og kvalitet av total RNA ble kontrollert ved spektrofotometri og av Agilent Bioanalyzer (Agilent). Tretten prøver ble utelukket på grunnlag av RNA utbytte og cRNA utbytte (RNA integritet nummer [RIN] målt: 6). Åtte prøver ble ekskludert på grunn av forsterker feil, og 8 flere prøver ikke oppfyller merking kriterier, noe som resulterer i data fra 119 prøver.

cRNA syntese og fluorescerende merking.

Alle forsterker og merking prosedyrer ble utført i 96-brønner plater (4titude, Bioke) på en tilpasset Sciclone ALH 3000 arbeidsstasjon (Sylinder Lifesciences), med en PCR PTC-200 (Bio-Rad Laboratories), SpectraMax 190 spektrofotometer (Molecular Devices), og en magnetisk kule-lokator (Beckman). Crna produkter ble renset og konsentrert med RNAClean (Agencourt, Beckman) i henhold til produsentens protokoll. mRNA ble amplifisert ved in vitro transkripsjon ved hjelp av en forankret primer og T7 RNA-polymerase på 1 pg av total RNA. Først en dobbeltkjedet cDNA templat ble generert inkludert T7-promoter. Deretter ble denne malen anvendt for in vitro transkripsjon med T7-megascript kit (Ambion) for å generere cRNA. Under in vitro transkripsjon, ble 5- (3-aminoallyl) -UTP (Ambion) innlemmet i den enkelkjedete cRNA. Prøver med en yield mindre enn 2000 ng eller med små Crna fragmenter (median mindre enn 500 nt) ble ikke brukt. Cy3 eller Cy5 fluoroforer (GE Healthcare) ble koblet til cRNA. Vi har anvendt totalt RNA og cRNA kvalitetskontroll av kriteriene i henhold til den Tumor Analyse gode fremgangsmåter Working Group [21]. Yielden og etikett inkorporering av CY-merket cRNA ble kontrollert ved hjelp av spektrofotometri. Kun prøvene med mellom 1,5% og 3% Cy-inkorporering ble inkludert. Før hybridisering, 300-1000 ng av Cy-merket cRNA fra en biopsi ble blandet med en lik mengde av revers farge Cy-merkede materiale fra referanseprøven.

Microarray hybridisering.

For hvert prøven ble to uttrykk profiler i dye-swap eksperimenter generert. Prøvene ble sammenlignet mot en kommersiell referanse (Universal Menneskelig Reference RNA katalog # 740000, Stratagene). The Human Array-Ready Oligo satt (versjon 2.0) ble kjøpt fra Qiagen og sett på Codelink lysbilder (GE Healthcare) i en støv filtrert og luftfuktighet kontrolleres clean room. De microarrays inneholdt 70-mer oligo-nukleotider som representerer 21.329 menneskelige gener og uttrykt sekvens koder (samle såkalte), samt 3871 ekstra plasser for kontrollformål. Gene merknader ble oppdatert av BLAST analyse av alle har sekvenser bruker ENSEMBL bygge 55. Arrays ble hybridisert på en Tecan HS4800PRO hybridisering stasjon, ved hjelp av protokollen beskrevet tidligere [22]. Hybridiserte lysbilder ble skannet på en Agilent scanner (G2565BA) på 100% laser makt og 60-90% PMT. Etter automatisk data utvinning ved hjelp Imagene 8.0.1 (BioDiscovery), ble Skriv utTips Loess normalisering utført på gjennomsnittsstikk intensiteter [23]. Farg skjevhet ble korrigert basert på en innenfor innstilt estimat [24].

Data tilgjengelighet.

I samsvar med foreslåtte MIAME (Minimum informasjon om en microarray eksperiment) standarder, grunnskole og bearbeidet data som samt protokoller ble avsatt i Array Express (https://www.ebi.ac.uk/microarray-as/aer) under deponeringsnummer E-TABM-1112.

Identifisering av en gjentakelse signatur

kohorten ble tilfeldig delt i et treningssett (n = 75) og en valideringssettet (n = 44). Sistnevnte var ikke involvert i genet valg for å unngå et utvalg bias. Med henblikk på å oppdage gensignaturen ble pasientene delt i en høy risiko og lav risiko gruppe. Høyrisikopasienter ble definert som de med tilbakefall innen ett år (figur 2). Denne grensen var basert på observasjonen om at en DFS 1 år er prediktiv for negativ total overlevelse som beskrevet av Fong et al [14]. Et skille basert på DFS ≤6 måneder (høy risiko) og DFS 2 år (lav risiko) ble også brukt (figur 2B). Ved hjelp av treningssettet, ble genene rangert basert på tre ulike beregninger (signal-til-støy-forholdet, t-test statistikk og Cox proporsjonal hazard ratio). Denne rangeringen ble gjort ved hjelp av en multippel sampling tilnærming velge 2/3 av prøvene i hver iterasjon. De 75 beste rangerte gener ble brukt til å forutsi risikoen klasse av prøvene i de resterende 1/3 av prøvene med nærmest gjennomsnittet klassifisering [9] og leave-one-out kryssvalidering (LOOCV). Ved hjelp av disse forutsigelsene et samlet areal under kurven for 1000 iterasjoner ble beregnet å gi en indikasjon på den samlede prediktiv kraft av de 75 genet signaturer, hvor en verdi betydelig over 0,5 poeng til sann prediktiv kraft. Rangeringen av de genene ble midlet over alle 1000 iterasjoner [25]. Fra den resulterende rangert liste, gensignaturen med den sterkeste prognostiske effekt (målt som samlede nøyaktigheten av prediksjon) ble bestemt ved hjelp av nærmeste gjennomsnittlig klassifisering og LOOCV starter fra beste rangert genet og deretter legge den neste høyest rangerte genet i hver iterasjon (forover utvalg ) [9]. En uavhengig måling av den prediktive kraft ble oppnådd ved anvendelse av den resulterende genet signatur for å forutsi risikoen klasse av prøvene i valideringssettet (nærmest middelverdien, LOOCV). Kaplan-Meier analyser ble brukt for å estimere DFS og overlevelseskurver for de to forutsagte risikoklassene ble sammenlignet med Mantel-Cox log-rank test. En maktanalyse for log-rank test ble gjort ved hjelp av PS programmet [26]. Funksjonelt gen sett berikelse analyse ble utført ved hjelp av Babelomics 4.2 web-basert analyse suite inkludert alle tilgjengelige databaser for anriking analyse [27].

Analyse av differensial Gene Expression

Gene uttrykk hos pasienter behandlet med neoadjuvant kjemoterapi ble sammenlignet med ekspresjon hos ubehandlede pasienter ved bruk av ANOVA [28]. I en fast effekt analyse, ble prøven, array og fargeeffekter modellert. P-verdier ble bestemt av en permutasjon F2-test der restene ble stokket 5000 ganger globalt.

Kliniske risiko score

En univariate Cox regresjonsmodell ble brukt til å estimere fare prosenter av fem kliniske risiko score som ble beregnet for hver pasient [14] -. [18] En multivariat analyse ble også utført legge inn de faktorene med p-verdier under 0,1 i univariate analysen

Statistiske Testing og programvare

Alle statistiske tester var tosidig og statistisk signifikans ble antatt for p-verdier mindre enn 0,05. Der det er aktuelt, ble p-verdier justert for deres falske funnrate bruker Benjamini-Hochberg metoden [29]. Statistiske analyser ble gjort i R 2.7.0 med ekstra Bioconductor pakker og SPSS for Windows versjon 15.0 (SPSS, Chicago, Illinois, USA).

Hjelpemiddel Informasjon

Figur S1.

Power of the log-rank test. Den statistiske kraften i log-rank test som en funksjon av hasardratio av genet signatur prediksjon i valideringssettet

doi:. 10,1371 /journal.pone.0049442.s001 plakater (TIF)

Table S1.

pasient- og kreft kjennetegn ved inn- og ekskluderte pasienter

en

doi:. 10,1371 /journal.pone.0049442.s002 plakater (DOC)

Tabell S2.

Univariat Cox regresjonsanalyse for signatur gener

en

doi:. 10,1371 /journal.pone.0049442.s003 plakater (DOC)

tabell S3.

Legg att eit svar