PLoS ONE: Konsekvenser for sykdomsutvikling, Genomisk Plassering og biologiske funksjon Kopier nummer Endringer i ikke-småcellet Cancer

Abstract

Lungekreft, hvorav mer enn 80% er ikke-småcellet, er den ledende årsak til kreft-relaterte dødsfall i USA. Kopier nummer endringer (CNAS) i lungekreft har vist seg å være

posisjonelt

gruppert i visse genomiske regioner. Imidlertid er det fortsatt uklart om gener med kopitall endringene er

funksjonelt

gruppert. Ved hjelp av en tett enkeltnukleotidpolymorfi matrise, utførte vi genom-wide kopiantall analyser av en stor samling av ikke-småcellet lungekreft (n = 301). Vi foreslo en formell statistisk test for CNAs mellom ulike grupper (f.eks, ikke-involverte lunge vs. svulster, kontra sent stadium svulster tidlig). Vi har også tilpasset genet satt berikelse analyse (GSEA) algoritme for å undersøke overrepresentasjon av gener med CNAs i forhåndsdefinerte biologiske trasé og gensettene (dvs.

funksjonell

clustering). Vi fant ut at CNAS hendelser øke betydelig fra kimcellelinje, tidlig til sent stadium svulst. I tillegg til genomisk posisjon, CNAs har en tendens til å oppstå bort fra genet steder, særlig i kimlinje, ikke-involvert vev og tidlig stadium tumorer. En slik tendens reduseres fra kimcellelinje til tidlig stadium, og deretter til sent stadium svulster, noe som tyder på en oppmykning av utvalget i løpet av tumorprogresjon. Videre ble gener med CNAs i ikke-småcellet lungesvulster beriket i visse gensettene og biologiske mekanismer som spiller avgjørende roller i onkogenese og kreft progresjon, demonstrere funksjonelle aspektet av CNAs i sammenheng med biologiske veier som ble oversett tidligere. Vi konkluderer med at CNAs øker med sykdomsprogresjon og CNAs er både

positionally

og

funksjonelt

gruppert. De potensielle funksjonelle evner ervervet via CNAs kan være tilstrekkelig for normale celler til å forvandle seg til ondartede celler

Citation. Huang Y-T, Lin X, Chirieac LR, McGovern R, Wain JC, Heist RS, et al. (2011) betydning for sykdomsutvikling, Genomisk Plassering og biologiske funksjon Kopier nummer Endringer i ikke-småcellet lungekreft. PLoS ONE 6 (8): e22961. doi: 10,1371 /journal.pone.0022961

Redaktør: Pan-Chyr Yang, National Taiwan University Hospital, Taiwan

mottatt: 28 mars 2011; Godkjent: 02.07.2011; Publisert: 02.08.2011

Copyright: © 2011 Huang et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien er støttet av amerikanske National Institutes of Health (https://www.nih.gov/) gir no. CA092824 (D.C.C.), CA074386 (D.C.C.), CA090578 (D.C.C.); og Norske Kreftforening (https://www.kreftforeningen.no/english)(A.H.). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Lungekreft, hvorav mer enn 80% er ikke-småcellet type (NSCLC), er den nest vanligste kreftformen og den ledende årsak til kreft-relaterte dødsfall i USA [1]. Det har vist i tidligere studier som NSCLC svulst har mer genomisk endringer i bestemt region av kromosomene, inkludert kopiantallet gevinster av partielle eller hele kromosom armene på 1Q, 3Q, 5p og 8q og kopi tap på 3p, 6Q, 8p, 9 p, 13q og VED BETJENING 17Q [2], [3]. Det vil si, ikke kopi nummer endringer i lungekreft ikke oppstår tilfeldig i genomet, men er

posisjonelt

gruppert. Men hvor den ikke-tilfeldig kommer fra, og dessuten om gener med kopinummerendringer er også

funksjonelt

gruppert fortsatt uklart. Målet med denne studien er å karakterisere genom-wide kopi nummer profiler i ikke-småcellet lungekreft både

positionally

og

funksjonelt

.

Vi har samlet 301 NSCLC tumorprøver sammen med 63 parvise blodprøver og sammenkoblede tilstøtende 50 prøver normalt vev. Blant de tumorprøver, en undergruppe av dem er sent stadium (n = 25). Med heterogeniteten av disse prøvene, er vi i stand til å etablere en genomisk modell av sykdomsutvikling fra kimlinje-genomet (blod) eller pre-kreft-genomet (tilstøtende ikke-involvert vev), for å tidlig stadium tumor-genomet og deretter til sent stadium tumor genom. Denne modellen gjør at vi også å studere trender i genom-wide kopi nummer endringer (CNAs) mønster og markerings effekter. I tillegg til å fokusere på den CNAs profilen i tumorprøver som tidligere studier, her nærmere undersøkte vi differansen av CNAs i ikke-involvert vev, tidlig og sent stadium, så vel som mellom adenokarsinom og squamous cell carcinoma. For å kunne utføre en formell statistisk test av genom-wide CNAs mønster mellom forskjellige grupper, foreslo vi en permutasjon basert globalt test, hvor multiple sammenligninger, blir korrelasjonen av kopiantall og plassering av probe-loci fullt justeres.

Gene sett anrikning analyse (GSEA) ble opprinnelig utviklet for analyser av uttrykk matriser og ble brukt til å identifisere den overrepresentasjon av gener som tilhører et spesielt biologisk kategori som er forbundet med biologiske fenotyper (f.eks stadium, histologi) [4]. Molecular Signatur Database (MSigDB) er en samling av kuratert gensettene for bruk med GSEA. Her viser vi at med modifisering av permutasjon ordningen, kan GSEA tilpasses utforske overrepresentasjon av gener med CNAs på forhåndsdefinerte MSigDB gensettene (dvs. «

funksjonell

clustering»).

i «kromosomale teorien av cancer», er tumorigenesis initiert av aneuploidies [5], [6]. For tumorigenesis, har seks nødvendige ervervede evner blitt foreslått: selvforsyning i vekstsignaler, ufølsomhet for anti-vekstsignaler, unndra apoptose, ubegrensede replicative potensial, vedvarende angiogenese og vev invasjon og metastase [7]. Siden vi hypoteser om at det ikke er funksjonell gruppering av gener med CNAs, forsøkte vi å undersøke om CNAs er tilstrekkelig mekanistisk strategi for å skaffe seg de ovennevnte evner; det vil si, om funksjonell gruppering av gener med CNAs gir støtte bevis for kromosomteorien kreft.

Materialer og metoder

Etikk erklæringen

Skriftlig informert samtykke ble innhentet fra alle pasienter. Studien ble godkjent av institusjonelle gjennomgang styrene i MGH, Harvard School of Public Health, og det norske Datatilsynet, og The Local Regional komité for medisinsk forskningsetikk.

Studier befolkning og prøver

En serie av 301 snap-frosset tumorprøver fra NSCLC pasienter ble samlet under en operasjon eller biopsi fra Massachusetts General Hospital (MGH), Boston, MA og National Institute of Occupational Health, Oslo, Norge. Vi inkluderte også ytterligere 50 eksemplarer av paret ikke-neoplastisk lungeparenkym fra norske pasienter og 63 sammenkoblede blodprøver fra MGH pasienter, som alle ble brukt som referansegruppen av kopiantall estimering.

DNA kvalitet, histopatologiske og Genechip

DNA-prøver ble hentet fra svulsten og ikke-neoplastisk lungeparenkym etter manuell mikrodisseksjon av 5-um histopatologiske seksjoner. For DNA fra MGH pasienter, en patolog (L.R.C.) som hadde ingen kunnskap om klinisk og genetisk informasjon anmeldt alle seksjoner for hver pasient. Hver prøve ble evaluert med hensyn på mengde og kvalitet av tumorceller og histologisk klassifiseres ved bruk av WHO kriterier. De norske prøvene ble tatt resected samlet og forberedt på samme måte. Prøver med lavere enn 70% kreft cellularity, utilstrekkelig DNA konsentrasjon ( 50 ng /mL), eller en flekker mønster i gel elektroforese ble ikke inkludert for genotyping. En totalt 414 DNA-prøver (301 fra svulster, 63 fra sammenkoblede blodprøver og 50 fra sammenkoblede røyk involverte lunge prøver) ble hybridisert til Affymetrix 250K Nsp GeneChip®, som inneholder 262,264 sonder (256,554 sonder på somatiske kromosomer og 5,710 sonder på sex kromosom).

data~~POS=TRUNC forbehandling

Kopier tallene ble oppnådd med dChip programvare [8]. Sonde intensiteter ble beregnet ved modellbasert uttrykk etter invariant sett normalisering. For hver SNP i hver prøve, ble det rå kopiantallet beregnet som signalet x 2 ÷ (gjennomsnittlig signal fra referanseprøver ved denne SNP) ved hjelp av blodprøver og ikke-neoplastiske vev som referent. Antydet kopiantall ble beregnet fra rå kopiantall av median jevne med vinduet av 11 SNPs for hvert locus of 262,264 SNPs. Bare 256 554 sonder på somatiske kromosomer ble analysert. SNP prober ble kartlagt til RefSeq gener med 2 kb forlengelse både oppstrøms og nedstrøms bruker UCSC Genome Browser. Blant de 256,554 sonder på somatiske kromosomer, ble 104,256 prober kartlagt til 11.700 gener.

Statistisk analyse

Kopier nummer gevinster og tap ble analysert separat. Kopier nummer gevinster ble definert som inferred kopiantall (CN) ≥2.7 og kopiere nummer tap ble definert som utledes kopiantall ≤1.3. Cut-offs ble valgt til å gjenkjenne kopiantall ≥3 og ≤1 ved å tolerere 30% normalt vev forurensning. Legg merke til at 70% kreft cellularity var terskelen for vår patologisk sjekk av kvalitet. Forekomsten av fagene med CNAs ble plottet over genomet. For hvert locus, ble antallet pasienter som har CNAs antas å følge en binomisk fordeling med størrelsen på utvalget som det totale antall fag og null sannsynlighet beregnet empirisk fra data: total sonder med CN≥2.7 (eller CN≤1.3) ÷ (256 554 × utvalgsstørrelsen). Betydning i genomkopitall endringer ble bestemt ved å beregne de eksakte p-verdiene for hver av de 256 554 loci, og q-verdier ble beregnet til å kontrollere for multiple sammenligninger på tvers av genomet ved hjelp av falske funnraten [9], [10]. For hvert gen kartlagt av flere sonder, sonden med den høyeste andelen av prøver med CNAs, eller tilsvarende, var den minste p verdi valgt til å representere den CNAs funksjonen av genet.

Her har vi foreslått en permutasjon-basert global test for genom-wide CNAS mønstre mellom to grupper var forskjellige, søkte vi to-utvalg tester for binomiske data ved å beregne den standardiserte forskjellen på to proporsjoner for hvert locus som: hvor

p

ji

er estimert andel (stabilisert ved å legge 0,5 i telleren) av CN gevinst (eller tap) for gruppe

j

locus

i

og

n

j

er utvalgsstørrelsen i gruppen

j

. Vi oppsummerte

d

i

2 over

i

over 256,554 loci å beregne den observerte totale standardisert squared forskjell (

D

observert

) på tvers av genomet. Ved å permutere de to grupper, og å utføre den ovennevnte fremgangsmåte for 10.000 ganger, erholdt vi et ikke-parametrisk null fordeling (

D

null

). Da p-verdiene ble oppnådd ved å sammenligne

D

observert Hotell og

D

null

. Fordelen med denne foreslåtte testen er at den tilveiebringer en global gyldig test for total genom-wide forskjell ved regnskap for multiple sammenligninger og korrelasjon av CNAs mellom forskjellige loci.

Ved hjelp av den globale test som er beskrevet ovenfor, har vi testet genom-wide CNAS mønsteret mellom blod og svulster, ikke-involverte lunge og svulster, tidlig stadium og sent stadium svulster tidlig stadium adenokarsinom og plateepitelkarsinom svulster (figur 1). For ytterligere å bekrefte resultatene, utførte vi følgende matchet analyser. Siden blod og ikke-involvert lungeprøver var forbundet til undergruppe av tumorprøver, kan vi sammenligne forskjellen av genom-wide CNAs begrenset til de med tilgjengelige prøver på blod og svulster eller på ikke-involverte og svulster. For hver sent stadium svulst, vi valgte en tilsvarende tidlig stadium tumorprøve med nærmeste røyking pack-årene. Fordelingen av kjønn, histologi og røyking pack-årene viste ingen signifikant forskjell i matchet tidlig og sent stadium svulster. De matchet Analysene viste tilsvarende resultater som de i figur 1. (Figur S2)

Den x-aksen representerer genomiske steder, som ble bestilt av den somatiske kromosomer. Y-aksen representerer den prevalens (%) av NSCLC pasienter med kopitall ≥2.7 (rød eller rosa) og ≤1.3 (blå eller blå lys) i ikke-involverte lungevev og total tumor (A), tidlig stadium tumor og sent stadium tumor (B), tidlig stadium tumor av adenokarsinom (C) og tidlig stadium tumor av karsinomer (SCC) (D). De tilsvarende plott av -log

10 (q-verdier) ble vist i fig. S1. P verdiene for å sammenligne genom CNAS mønstre mellom ikke-involverte vevsprøver og totale svulster er 0,0001 for gevinster og 0,40 for tap ved permutasjon basert global test med detaljer beskrevet i metodene. De p-verdiene som sammenligner tidlig og sent stadium svulster er 0,0001 for gevinster og 0,046 for tap; de p-verdiene som sammenligner tidlig stadium adenokarsinom (C) og tidlig plateepitelkarsinom (D) er 0,016 for gevinster og 0.027 for tap.

Begge de totale sonder (TP) og sondene finne innenfor gener (GP) hvor CNAs ble oppdaget ble beregnet for hver enkelt. Sammenligning av TP og GP på tvers av ulike undergrupper lar studere mønsteret for valg av genomiske regioner der CNAs oppstår, under forutsetning av at sondene på brikken ble valgt tilfeldig uten å ta hensyn koblingsulikevekt. Forholdet mellom GP vs. TP (betegnet som G /T-forholdet) ble beregnet for å estimere valg av CNAs med hensyn til genet sted. Under nullhypotesen at CNAs oppstår tilfeldig i forhold til hvor gener finne, ville vi forvente nullforhold på 104 256/256 554 = 40,64%, hvor 104 256 er antall sonder som ligger innenfor gener på brikken. Ved å sammenligne G /T-forhold til null ratio 40,64%, var vi i stand til å teste om CNAs skjedde fortrinnsvis fra gener. Sammenligning av G /T i ulike undergrupper (f.eks kimcellelinje vs. tumor) gjort oss i stand til å undersøke omfanget av denne preferansevalg blant ulike grupper. Sammenligningene av TP, GP eller G /T forhold mellom to grupper som ble utført med uparet tosidig student t-test forutsatt ulike variasjoner.

Gene sett analysene ble utført ved hjelp av den modifiserte Gene Set Enrichment Analysis (GSEA) algoritme . GSEA ble opprinnelig foreslått for genekspresjon mellom grupper [4]. Siden vi ikke forsøke å knytte CNAs med andre kovariater, men rett og slett undersøke berikelse av CNAs i en enkelt gruppe, endret vi algoritmen om generasjonen av null fordeling av berikelse poengsum. Vi er interessert i om CNAs i et gen sett er betydelig høyere enn andre gensettene. I stedet for permutasjon gruppen etiketten, permuted vi gense etiketter for 20.000 ganger for å lage null distribusjon. Oppdagelsen (n = 151) og valideringssett (n = 150) tilfeldig plukket fra 301 svulstene var like på mange demografiske og kliniske kjennetegn. (Tabell S1) Primær analyse ble gjort ved hjelp av funn data og validering ble utført ved hjelp av validering datasett. Bare gensettene som var signifikant (p 0,05) i begge settene ble rapportert. De gensettene analysert i denne studien er hentet fra Molecular Signaturer Database (MSigDB) av Harvard /MIT Broad Institute, inkludert genfamiliene, kuratert gensettene og gen ontologi gensettene. Bare 1619 gensettene med minst 15 genet medlemmer i våre data ble analysert for å oppnå robusthet.

Resultater

CNAs og sykdomsutvikling

En serie av 301 tumorprøver ble innsamlet fra NSCLC pasienter, er egenskapene som vist i tabell S1. Genomet av blod eller ikke-involverte lungevev hatt betydelig færre CNAS hendelser enn gjorde svulsten genom, spesielt i kopitall gevinster (tap: p = 0,038 i blod vs. svulst, p = 0,40 i ikke-involverte vev vs. svulst; gevinster: p 0,0001 i begge) (figur 1A). De falske funnrate (Q-verdier) på den 256554 loci for blod, ikke-involvert vev, tumorer (i total, ved klinisk stadium eller ved histologi) er vist i figur S1. Det var betydelige CNAs på kromosomer 3, 5 og 8, illustrert i figurer S3, S4 og S5. Fordi Affymetrix® 250K NSP Genechip prober ble valgt tilfeldig over genomet, er det rimelig å anta at antall sondene som gjenkjenner kopitall endringer er proporsjonal med genomisk span CNAS hendelser. Gjennomsnittlig antall sonder som oppdager kopitall gevinster var 718 i blod og ikke-involverte vev, som var mye lavere enn 19 469 i tumor (p 2,20 × 10

-16) (figur 2A). Mønsteret ble også funnet i kopitall tap (950 vs 2586, p = 0,0029) (figur 2B). Videre er det flere eksemplar nummer gevinster enn kopitall tap i svulster (p 2,20 × 10

-16), noe som antyder at kopiantallet tapene er mer skadelig [11]

A, B. , grevene av den totale prober (TP) hvor CNAS hendelser (A: kopitall gevinster, B: kopitall tap) oppstår ble plottet for blod og ikke-involverte vev, total svulst, tidlig svulst, sent stadium svulst, tidlig stadium adenokarsinom (ACA) og tidlig plateepitelkarsinom (SCC). C, D, grevene av sondene innen genene (GP) hvor CNAS hendelser (C: kopitall gevinster, D: kopi nummer tap) ble påvist i de samme seks undergrupper. E, F, Mean og dens 95% konfidensintervall for G /T-forhold i seks undergrupper for kopi nummer gevinster (E) og tap (F); og de stiplede linjer representerer null G /T-forhold på brikken (104 256/256 554 = 40,64%). Ikke-tumor: blod (n = 63) og ikke-involvert vev (n = 50); All svulst: total 301 NSCLC tumorer; Tidlig svulst: stadium I og II NSCLC tumorer (n = 246); Late tumor: stadium III og IV NSCLC tumorer (n = 25); Tidlig ACA: stadium adenokarsinom svulster tidlig (n = 208); Tidlig SCC: tidlig stadium plateepitelkarsinom tumorer (n = 93)

Utbredelsen av CNAS hendelser blant NSCLC var assosiert med klinisk stadium, spesielt i forsterkning.. Andelen av pasienter med kopi nummer endringer i sent stadium svulst var mer enn dobbelt av det i tidlig stadium. (Figur 1B) mellom de to gruppene, utførte vi de globale tester for den parvise differanse for den andel av CNAs for hvert locus på tvers av genomet, og viste svært signifikant forskjell i gevinster ( 0,0001) og en marginalt signifikant forskjell i tap ( p = 0,046) etter at regnskap for multiple sammenligninger. Tilsvarende gjennomsnittlig antall sonder som oppdager kopitall gevinster var 14 029 i tidlig fase og 45792 i sent stadium (p = 4,94 × 10

-14) (figur 2A). For kopi nummer tap, var de 2419 og 4395, henholdsvis (p = 0,076) (figur 2B). Unntatt de med adjuvant kjemoterapi eller radioterapi fortsatt bevart den betydelige utviklingen og de tilsvarende tallene (p-verdi) var 8501 og 41 608 (p = 5,43 × 10

-5) i gevinster og 2099 og 5947 (p = 0,017) . Adenokarsinom og plateepitelkarsinom subtyper viser en betydelig forskjell i testing paret andel (figur 1C og 1D) (p = 0,016 i gevinster og p = 0,027 i tap), men ingen forskjell i total CNAS hendelser (Figur 2A og 2B) (p = 0,44 i gevinst og p = 0,29 i tap), noe som indikerer at genom-wide CNAS mønstre av de to celletyper kan være forskjellig selv om det totale antallet hendelser er like.

CNAs utvalg av genet plassering og sykdom utvikling

Ved å beregne G /T-forholdet (se Materialer og Metoder), undersøkte vi valg av CNAs med hensyn til genet steder under utvikling av kreft. I blod eller ikke-involverte vev, G /T-forhold var lavere enn null (40,64%) i gevinst (31,71%, p = 0,00098) og tap (30,38%, p = 0,0014) (Figur 2E og 2F), som indikerer at CNAs hendelser er mer sannsynlig til å skje utenfor gener i germline som følge av naturlig utvalg. I svulst genom, fortsatt eksisterer utvalget effekt selv om det har vært avslappet til en viss grad. Det vil si at G /T-forhold i svulster var betydelig høyere enn i germline (p = 3,28 × 10

-5 i gevinst, p = 0,015 i tap), men de var likevel betydelig lavere enn null ratio (39.16 %, p = 0,0068 i gevinst, 37,17%, p = 0,0052 i tap). Imidlertid ble slik et utvalg effekten ikke observert i sent stadium svulster, dvs. CNAS arrangementer har en lignende sjanse til å skje innenfor og utenfor gener.

CNAs i onkogener og tumorsuppressorgener

104256 ( 40.64%) av 256,554 sonder av somatiske kromosomer på brikken ble kartlagt til 11.700 gener med 2 kb forlengelse både oppstrøms og nedstrøms for å inkludere promoter og flankerende regioner. Det var 32 kjente onkogener i hvilken 10% av pasientene hadde eksemplar nummer gevinster (tabell 1) og 16 tumorsuppressorgener der 1% av pasientene hadde eksemplar nummer tap (tabell 2). Vi har også identifisert 45 gener (inkludert onkogener og ikke-onkogener) med 35% (p≤1.50 × 10

-42) som har kopi nummer presiseringer (Tabell S2) og 9 gener (

CSMD1

,

SGCZ

,

PDZRN3

,

nisch

,

CACNA2D3

,

UBE2E2

,

MCPH1

,

PHF7 Hotell og

DOCK5

) med 10% (p≤1.53 × 10

-21) som har kopi nummer strykninger

bilder

Gene sett. beriket med CNAs gener

Siden gener med CNAs var under valget, hypoteser vi at disse genene skal være involvert i lignende biologiske funksjoner, som senere favoriserer trenings av celler under tumorigenesis og /eller kreftcelle spredning. Derfor har vi undersøkt nærmere om gener med CNAs ble beriket i 1619 forhåndsdefinerte gensettene. For å unngå falske positive funn ved testing 1619 gensettene, ble analysene gjort med et funn-og-valideringsprosessen. I oppdagelsen sett ble de gener med kopitall presiseringer betydelig anriket på 152 gensettene (p 0,05); 119 av dem ble validert i valideringssettet ved signifikansnivå på 0,05. For kopitall slettinger, ble 109 gensettene funnet i oppdagelsen sett (p 0,05) og 52 ble godkjent. Vi har også undersøkt de 119 og 52 validerte gensettene i tidlig fase og sent stadium svulster og bare de betydelig anriket i begge undergrupper er rapportert (89 i gevinst og 27 tap, Tabeller S3 og S4) Vi presenterer 26 gensettene med særlig relevans for tumorbiologi som har berikelse av kopinummer gevinster eller tap i våre prøver i tabell 3 og 4 og de tilsvarende genet sett berikelse tomter i figur S6 og S7. Ytterligere undersøke genet satt anrikning i blodet og ikke-involvert lungevev, har vi funnet mange av de 89 og 27 validerte gensettene også anriket i genomet av ikke-involverte lungevevet, inkludert gevinst i G-protein signaliseringsreaksjonsvei,

EDG1

vei, integrin-mediert celle migrasjon sti og tap i forskrift av autofagi og mitotiske cellesyklus. (tabell S3 og S4)

Diskusjoner

genom-wide CNAs mønster fra våre analyser er lik de publisert i tidligere litteratur [2], [3], [12]. Mange av onkogener med kopitall amplifikasjoner som presenteres her, er også i overensstemmelse med tidligere studier [13], [14], [15], [16]. Den store styrken til denne studien er det stor utvalgsstørrelse, tilgjengelighet av paret blod og prøver ikke-involverte vev og detaljert demografisk /klinisk informasjon, oppdagelse-valideringsprosessen og de nye statistiske analyser. Den foreslåtte globale test for genom-wide CNAs gi oss muligheter til å teste CNAs forskjell ved samtidig å ta de genomiske steder, korrelasjon av kopiantall og flere sammenligninger i betraktning. Den tilpassede GSEA for CNAs, på den annen side, kan tjene som et nyttig verktøy for å analysere genomkopiantall i den funksjonelle og biologisk sammenheng, knytter de sofistikerte CNAS data til kunnskap om genet kategorier, biologiske stier og tidligere studier. Det er fortsatt begrensninger i vår studie. For det første kan blod og prøvene ikke-involvert vev oppnås fra bare delsett av de 301 pasientene. For det andre kan vi ikke samle CNAs data fra normale individer eller pasienter uten lungekreft, som kan gi oss en bedre innsikt i hvordan genom-wide CNAs profil i NSCLC avviker fra det normale fag eller ikke-kreftpasienter. For det tredje, selv om genet setter analyser kan tjene til å formulere biologiske hypoteser, videre undersøkelser for å studere rollene til gensettene /stier med CNAs i tumorigenesis er nødvendig.

DNA-materiale analysert i denne studien kommer alle fra NSCLC pasienter, så genomet av blod og ikke-involvert vev ikke kan bli sett på som en vanlig genom. Vi bruker DNA fra blod, ikke-involverte lungevev, tidlig stadium tumor og sent stadium svulst å representere sekvensielle stadier av kreftutvikling og progresjon. Vi oppdaget at eksemplar nummer endringer øker med kreftutvikling, men at utvalget med hensyn til genet plassering reduseres. Det vil si, det er en monoton økning i kopitall endringer fra blod og ikke-involvert lungevev, for å tidlig stadium, og deretter til sent stadium tumorer. (Figurene 2A og 2B) på den annen side, kopiantall endringer har en tendens til å oppstå

borte fra fra gen sted i blod eller ikke-involvert vev, men denne utviklingen avtar i tumorer, spesielt i sent stadium. (Figurene 2E og 2F) Økningen av CNAs skyldes opphopning av somatiske kopitall endrer seg på grunn av genomiske ustabilitet, hvilket mobiltelefon hypoksisk stress hos kreft kan spille en nøkkelrolle via forstyrrelse av DNA-replikasjon og replikasjon av ikke-sammenhengende DNA-segmenter [17 ], [18].

på samme måte forventer vi å se akkumulering av antall gensettene rammet av CNAs fra blod, ikke-involverte vev og deretter til svulsten, snarere enn brå forekomst i tumor. Ut av våre rapportert 89 gensettene av kopitall gevinster, antall betydelige gensettene er 7 i blod, 46 i ikke-involverte vev, 89 i svulster. (Tabell S3) Ut av de rapporterte 27 gensettene av kopitall tap, tallene er to i blod, 8 i ikke-involverte vev, 27 i svulster. (Tabell S4)

Valg av CNAs med hensyn til genet plassering underveis i evolusjonen er også rapportert hos

Drosophila product: [11]. Her vises et tilsvarende utvalg virkning på tumoren genomet selv om det er avslappet til en viss grad. Vi hypotese at utvalget i tumor oppstår tidlig i kreftutvikling på toppen av konsekvensen av evolusjonære utvalg som gjenspeiles i germline. Disse resultatene illustrerer at den rensende valg forekommer i kimlinje som et resultat av arten evolusjon kan også forekomme i tumor som en velge effekt under onkogenese og tumorprogresjon. Vi hypotese også at de biologiske pathways med CNAs vi observerer i tabell S3 og S4 er konsekvensen av et slikt utvalg. Det vil si, de store endringene kan treffe mange forskjellige gen og biologiske pathways tilfeldig, men bare de cellene overtar veksten fordel via CNAs (f.eks forsterket onkogen signalveien eller slettes tumorsuppressorgenet veien) vil overleve og bli dominerende. Oppdagelsen av at CNAs tendens til å oppstå fra genet også gjenspeiler ikke-tilfeldigheten CNAs forekomst.

Onkogener kan etterligne normal vekst signaliserer slik at kreftcellen reduserer avhengigheten av eksogene vekststimulering. Dermed blir amplifikasjon av onkogener er et viktig skritt i tumorgenese. I lungekreft,

KRAS

,

MYC

,

EGFR

, og

erbB

familien kjente onkogener [19], [20], [21], [22], og alle av dem ble funnet å være av stor betydning i kopitall gevinster. Videre gener med kopi nummer presiseringer var også overrepresentert i onkogener som en kategori definert av folketellingen av menneskelige kreftgener [23]. Dette funnet antyder at onkogenese kan også skyldes ulike sett av onkogener i tillegg til de ovennevnte kjente dem.

Gener med CNAs i NSCLC er også funnet å være sterkt assosiert med gener som er involvert i andre kreftformer, blant annet leveren , bryst, nyre og bukspyttkjertel kreft. Vi fant at gener med kopitall gevinster i NSCLC er mer sannsynlig å være de høyt uttrykte gener for hepatitt C-relaterte hepatocellulært karsinom [24] (p = 0,00005) og nyrecellekarsinom [25], [26] (p = 0,020) . Gener med kopitall presiseringer er også betydelig anriket i genene til dårlig prognose underskrift av brystkreft [27] (p 0,00005), som kan forklare dårligere prognose for lungekreft enn brystkreft. Videre viste analysen genene med kopitall gevinster i lungen ble anriket i de gener på kromosom 7 og 8, vist seg å ha kopitall-drevet ekspresjon i pankreas adenokarsinom [28] (p = 0,0033 og mindre enn 0,00005, henholdsvis) , og de med kopitall tap ble beriket i genene med CNAs på kromosom 9, også assosiert med genuttrykk i bukspyttkjertelen tumor (p 0,00005). Dette tyder på at genet dosering, som det var, av gener med CNAs i NSCLC kan også være positivt relatert til ekspresjon nivå. Resultatene tyder også på at kreftceller dukker opp fra forskjellige vev opprinnelse dele lignende maskiner for onkogenese og tumorinvasjon

Vår gen sett analyse antyder at celler kan erverve de felles kapasiteter på tumor [7] gjennom CNAS:. Gevinster i onkogener (selvforsyning i vekstsignaler, unndra apoptose), gevinster i

kalpain

pathway (ufølsomhet for anti-vekstsignaler, vev invasjon og metastasering, vedvarende angiogenese), gevinster i

EDG1

pathway ( unndra apoptose og selvforsyning i vekstsignaler), gevinster i

erbB

signalering (selvforsyning i vekstsignaler), gevinster i

WNT

signalering (selvforsyning i vekstsignaler), tap i reguleringen av autofagi (unndra apoptose), gevinster i telomerase revers transkriptase (

TERT

) (ubegrensede replicative potensial), og tap i tight junction og cellesammenvoksninger (vev invasjon og metastasering). Slike resultater gir støtte bevis av «kromosom kreft teori» [5], [6]: kreft er en sykdom forårsaket av fremkalle aneuploidi eller store endringer av kromosom. Det er fordi den i stor skala duplisering eller delesjon er mer sannsynlig å endre kopiantallet av et betydelig antall av gener i en rekke biologiske reaksjonsveier. Men ikke våre resultater ikke uenig med forestillingen om at duplisering /sletting av et gen spille en avgjørende rolle i kreftutvikling. Forekomsten av fremkalle aneuploidi eller store endringer krever et miljø med genomet ustabilitet, noe som sannsynligvis vil bli lettere ved duplisering /sletting eller mutasjon av gener kritiske i DNA-reparasjon, rekombinasjon og duplisering.

Legg att eit svar