PLoS ONE: Identifikasjon av Tumor Dempere og Onkogener fra Genomisk og epigenetiske funksjoner i Eggstokkreft

Abstract

Identifisering av genetiske og epigenetiske forandringer fra primærtumorceller har blitt en vanlig metode for å identifisere gener kritiske til utvikling og progresjon av kreft. Vi søker å identifisere de genetiske og epigenetiske avvik som har størst innvirkning på gen-funksjon innen svulsten. Først foretar vi en bioinformatiske analyse av kopiantall variasjon (CNV) og DNA metylering dekker genetiske landskapet av eggstokkreft kreftceller. Vi separat undersøkt CNV og DNA metylering for 42 primær serøs eggstokkreft prøver ved hjelp MOMA-ROMA analyser og 379 tumorprøver analyseres av The Cancer Genome Atlas. Vi har identifisert 346 gener med betydelige slettinger eller presiseringer blant tumorprøver. Utnytte forbundet genuttrykk data vi forutsi 156 gener med endret kopiantall og korrelerte endringer i uttrykk. Blant disse genene CCNE1, POP4, UQCRB, PHF20L1 og C19orf2 ble identifisert innen begge datasettene. Vi var spesielt interessert i kopiantall variasjon som vår base genomisk eiendom i prediksjon av tumor suppressors og onkogener i den endrede ovarial tumor. Vi identifiserer derfor endringer i DNA metylering og uttrykk for alle forsterket og slettede gener. Vi definerer statistisk tumor suppressor og onkogene egenskaper for disse modaliteter og utføre en korrelasjonsanalyse med uttrykk. Vi spådde 611 potensielle onkogener og tumor dempere kandidater ved å integrere disse datatypene. Gener med en sterk korrelasjon for metylering avhengige uttrykk endringer utstilt på varierende kopi nummer avvik inkluderer CDCA8, ATAD2, CDKN2A, RAB25, AURKA, BOP1 og EIF2C3. Vi tilbyr kopiantall variasjon og DNA metylering analyse i over 11 500 enkeltgener som dekker den genetiske landskapet av eggstokkreft svulster. Vi viser omfanget av genomisk og epigenetiske forandringer for kjente tumor suppressors og onkogener og også bruke disse definerte funksjoner for å identifisere potensielle eggstokkreft genet kandidater

Citation. Wrzeszczynski KO, Varadan V, Byrnes J, Lum E, Kamalakaran S, Levine DA, et al. (2011) Identifisering av Tumor Dempere og Onkogener fra Genomisk og epigenetiske funksjoner i eggstokkreft. PLoS ONE 6 (12): e28503. doi: 10,1371 /journal.pone.0028503

Redaktør: Xin Yuan Guan, The University of Hong Kong, Kina

mottatt: 25 juli 2011; Godkjent: 09.11.2011; Publisert: 08.12.2011

Copyright: © 2011 Wrzeszczynski et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av Department of Defense W81XWH-05-1-0068, The Starr Foundation (https://www.starrcancer.org) og Philips Research Nord-Amerika. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser. En del av denne forskningen er finansiert av Philips Research Nord-Amerika. Vinay Varadan, Sitharthan Kamalakaran og Nevenka Dimitrova er ansatte i Philips Research Nord-Amerika. Det finnes ingen patenter, produkter under utvikling eller markedsført produkter å erklære. Dette endrer ikke forfatternes tilslutning til alle PLoS ONE politikk på deling av data og materialer, som beskrevet på nettet i veiledningen for forfatterne.

Innledning

I USA, vil det være over 22.000 nye tilfeller av eggstokkreft i 2011. av disse vil ca 14 000 bukke under for sykdommen. For bedre å kunne behandle disse kvinnene og forbedre overlevelse, er vårt mål å bestemme molekylære endringer som har skjedd i pasientenes svulster, og for å kunne tolke betydningen disse endringene har på vekst og utvikling av svulsten. Denne avvikende vekst er et resultat av kromosomavvik og epigenetiske variasjoner [1], [2]. I tillegg generelt lave priser av somatisk nucleotide mutasjon i eggstokkreft sammenlignet med andre solide tumorer foreslår en økt betydning av kopiantall og epigenetiske avvik. Denne type regulering har vist seg å påvirke mange kreftdempere og onkogener knyttet til eggstokkreft [3].

Kopier nummer variasjoner (CNV) er en vanlig foreteelse i alle former for kreft [4], [5] , [6], [7], [8], [9]. En typisk prøve kreft oppviser et gjennomsnitt på 17% amplifikasjoner og 16% delesjoner innenfor et helt genom. Somatiske kopitall forandringer har vist seg å ha betydelig innvirkning baner som involverer kinase funksjon, cellesyklusregulering, myc og NF-kB-nettverk og apoptose [4]. Påvisning av disse forandringer og identifikasjon av spesifikke gener som er ansvarlige for kreft spredning kan bidra til molekylært subtype kreft og føre mot mer individuell kreft-type spesifikke terapier [7], [10], [11], [12], [13], [14], [15], [16], [17], [18], [19], [20].

epigenetisk egenskaper av kreft genomet korrelerer med utvikling og funksjon av kreftcellen [1], [21], [22], [23], [24]. Nærmere bestemt, kan DNA-metylering ved gen-promotorområdene regulere genekspresjon av forskjellige onkogener og tumor suppressorer [25], [26], [27]. Det er blitt foreslått at det totale DNA cytosin 5C-metylering mellom normale og kreftceller ser ut til å bli redistribuert til spesifikke CpG loci i kreftcellen [28], [29]. Tap av funksjon eller transcriptional lyddemping via hypermethylation har blitt identifisert for tumorsuppressorgener, mens hypometylering har blitt tilskrevet onkogenese og tap av imprinting for visse kreftrelaterte alleler [1], [30].

Tumor suppressor og onkogene genomiske og epigenetiske funksjoner er svært variabel innen eggstokkreft [3]. Kjente tumor suppressorer og onkogener ikke like bidra til utvikling av kreft. Vi håper å identifisere de genetiske og epigenetiske avvik som har størst innvirkning på gen-funksjon innen svulsten. Mange av dagens bioinformatikkdataene protokollene anvende bare én modal analyse for å bestemme genfunksjon av en bestemt tumortype. Et genom bred tilnærming som kombinerer flere kilder til genetiske avvik data er nødvendig for prediksjon av muligens konsekvente og epigenetiske integrerte trasé som fungerer i tumorigenesis. Vi utførte en bred bioinformatikk analyse av kopiantall variasjon, uttrykk og epigenetisk informasjon for å identifisere potensielle kreftdempere og onkogener knyttet til serøs eggstokkreft. Analysere 42 uavhengige serøs eggstokkreft prøver og dra nytte av Kreft Genome Atlas (TCGA; https://tcga.cancer.gov) [31] data for å sammenligne og forbedre vår protokoll, identifiserer vi unormal DNA kopiantall med korrelerte endringer i metylering og uttrykk for serøs eggstokkreft gener. Kombinasjonen av epigenetisk og ekspresjon av data analyse kan muligens gi informasjon som er spesifikk for den molekylære basis av kreft og kreft subtyper og belyse genene som kjører forskjellige tumorer [28], [32], [33], [34], [35]. Dermed slutt slik at klinikere å innlemme disse typer omfattende multimodal dataanalyser i svulsten biospesifikke basert diagnostikk og sti rettet terapi [36].

Metoder

Pasientprøver (MSKCC data)

Tumor DNA fra 42 pasienter med nylig diagnostisert, ubehandlet, avansert stadium, serøs ovariekarsinomer sett på Memorial Sloan Kettering Cancer Center mellom perioden mai 1992 til februar 2003 ble inkludert i denne studien. Prøvene ble samlet inn i henhold til forskning protokoller godkjent av Memorial Sloan-Kettering Cancer Center IRB. Studien på pasientprøver og analyse av alle eksempeldata holdt retningslinjene for Memorial Sloan-Kettering Cancer Center IRB og ble godkjent av Memorial Sloan-Kettering Cancer Center IRB. Pasienter individuelt gitt skriftlig informert samtykke til å bruke sine eksemplarer for forskningsformål. I tillegg brukte vi 7 eggstokkvev normale prøver hentet fra The Cooperative menneskelig vev Network, et oppbevaringssted for vev og tumormateriale drevet av National Institutes of Health. Vi viser til denne pasienten og normal prøve angitt som MSKCC datasettet.

Kopier nummer Detection via Representational oligonukleotid Microarray Analysis (ROMA)

ROMA protokollen som tidligere skissert [11], [15 ], [37] ble utført på en høy tetthet oligonukleotid matrise som inneholder ~85,000 egenskaper produsert av NimbleGen Systems Inc. korthet kompleksitet-redusert representasjoner [38] som består av små (200-1200 bp) fragmenter, generert ved spaltning av DNA-prøver med restriksjonsendonukleasen Bglll, ble amplifisert ved PCR adapter-mediert av genomisk DNA [11]. DNA-prøver (2 mikrogram) ble merket enten med Cy5-dCTP eller Cy3-dCTP hjelp Amersham-Pharmacia MegaPrime merking kit og konkurranse hybridisert til hverandre på samme lysbilde [11]. Hybridizations besto av 35 ul av hybridisering oppløsning (37% formamid, 4 x SSC, 0,1% SDS, og merket DNA). Microarry søknad og hybridisering ble utført som tidligere rapportert [11]. Skannet på en Axon GenePix 4000B skanner ved hjelp av en pikselstørrelse på 5 pm og alle data ble importert til S-Plus 2000 analyse programvare (innsiktsfulle, Seattle, WA). De normaliserte logg prosenter fra hvert forsøk ble i gjennomsnitt per segmentering. Vi deretter brukt CBS (Circular Binary Segmentering) algoritme til disse dataene. CBS segmentering Fremgangsmåten er den sirkulære binære segmenteringsalgoritme som beskrevet i Olshen, AB. et. al. [39]. Som i forutgående analyse, er CNV segmenter defineres som områder av statistisk kombinert probe (markør) intensiteter som er beregnet av CBS algoritmen [39], [40]. All generell analyse og statistikk ble beregnet ved hjelp av S-plus, R pakker og individuelle Perl /Python-skript. All ROMA data er MIAME kompatibel og kan bli funnet i GEO database (https://www.ncbi.nlm.nih.gov/geo/) for rekken sjonsnummer GSE28013.

Metylering Detection via Representational oligonukleotid microarray analyse (MOMA)

MOMA protokollen ble utført som tidligere beskrevet [41], [42]. Den MOMA metylering deteksjon matrisen er utført og godkjent for cellelinjer og brystkreft tumorprøver. Kommenterte genomiske CpG island steder ble hentet fra UCSC genom nettleser. På tidspunktet for forsøket genomet inneholdt 26,219 CpG øyer i området fra 200 til 2000 bp. Disse CpG island steder var dekket av MspI begrensning fragmentering. Arrays ble produsert av NimbleGen Systems Inc. bruker 390.000 sonder format. Den CpG øy annotering fra det humane genom bygge 33 (hg17) ble anvendt for å konstruere en 50-mer flislegging matrise. Den primære restriksjonsendonuklease brukes er MspI. Etter fordøyelse linkere ble ligert og materialet blir renset ved fenol kloroform, utfelt, sentrifugert og resuspendert. Materialet er delt i to, med en halv fordøyd av endonuklease McrBc henhold til spesifikasjon av New England Biolabs og den andre halvparten blir mock fordøyd. Prosedyrer for hybridisering og vasking ble rapportert tidligere [41]. Prosedyren ble utført i duplikat med et fargestoff-bytte for det andre eksperimentet. Etikettene ble byttet mellom McrBc behandlet og håne prøver. For hver probe, geometrisk gjennomsnitt av forholdene (GeoMeanRatio) av McrBc behandlede og kontrollprøver ble deretter beregnet for hvert forsøk og dens tilhørende fargestoff bytte. Microarray bildene ble skannet på GenePix 4000B skanner og data hentet hjelp Nimblescan programvare (NimbleGen Systems Inc). De GeoMeanRatios av alle prøvene i et datasett ble deretter normalisert ved hjelp av en quantile normalisering metoden [43]. All generell analyse og statistikk ble beregnet ved hjelp av S-plus, R pakker og individuelle Perl /Python-skript. All MOMA data er MIAME kompatibel og finnes i GEO database (https://www.ncbi.nlm.nih.gov/geo/) for rekken sjonsnummer GSE27940.

Gene Expression Analysis for menneskelig Ovarian tumorprøver

Gene Expression data ble utført ved hjelp av Affymetrix human Genome U133A utvalg: GEO-plattformen identifikator GPL96. RNA ble isolert ved anvendelse av TRIzol-protokollen. RNA blir omdannet til cDNA, og dobbelt-trådet cDNA blir benyttet som templat i en in-vitro-transkripsjonsreaksjon inneholdende biotinylert CTP og UTP i tillegg til de fire umodifiserte ribonukleosidtrifosfater. Standarden Affymetrix protokollen anvendes. Endelige signal intensitet er behandlet ved hjelp av RMA normalisering metoden i AFFY pakke med R Bioconductor 2.5. All rekke data er MIAME kompatibel og tilsvar CEL filer kan bli funnet i GEO database (https://www.ncbi.nlm.nih.gov/geo/) for rekken sjonsnummer GSE27943.

Cross- modal analyse av Kreft Genome Atlas data (TCGA data)

Kopier nummer endringsdata for primær ovarietumorer ble lastet ned fra TCGA (https://tcga.cancer.gov/) og CBS [39] datafiler fra Agilent SurePrint G3 Menneskelig en M CGH (Comparative Genomisk Hybridisering) Mikromatrise med etiketten mskcc.org_OV.CGH-1 × 1M_G4447A ble analysert. CBS behandlet data fra TCGA ble deretter merket med UCSC Genome Browser hg18 montering informasjonen til å tildele kopi antall variasjons seg.mean verdier per genet per prøve. For å studere CNV per genet begrenset vi våre data til en komplett CBS segment per genet per prøve. Derfor, hvis et gen locus er delvis dekket av to eller flere CBS segmenter per prøve vi ikke ta den med i vår analyse. Bare hvis en komplett gen locus var innenfor en prøve CBS segmentet var det inkludert i vår analyse. Videre er utelukket vi enhver CBS segment med en informativ (num.info) verdi på mindre enn 4. I tillegg, for å fange opp betydelig CNV vi bare analyserte prøver i 90% av dataene unntatt 5% av dataene nærmest en SEG. bety fra 0 fra de positive og negative verdi fordeling. TCGA metylering data er innhentet fra JHU-usc.edu_OV.HumanMethylation27.2.lvl-3 datafiler for hvert tilsvarende svulst og normal prøve. Dette er fra Illumina infinium Human27-metylering analysen. En endelig midlere betaverdi for gener med 2 eller flere prober ble beregnet pr gen per prøve. Endelig TCGA uttrykket data som brukes for denne analysen var fra broad.mit.edu HT_HG-U133A genuttrykk fil for hvert tilsvarende svulst og normal prøve kjøre på Affymetrix Genechip HT Human Genome U133A array. Vi undersøkte 379 prøver fra TCGA som var til stede på tidspunktet for vår analyse. Før den endelige innlevering av vår manuskript Kreft Genome Atlas har offentlig sin foreløpige rapport om ovarialcancer [31] gjort. Vår bruk av TCGA datasettet er å forbedre og sammenligne vår tumor suppressor og onkogen oppdagelse protokoll som vi brukt på MOMA-ROMA (MSKCC) datasett. Vi erkjenner noen lignende funn vi har gjort ved hjelp av vår protokoll på TCGA datasett med det som finnes i den siste TCGA publikasjonen.

bioinformatiske analyse av MSKCC Kopier nummer (ROMA), DNA Metylering (MOMA) og Expression data

Alle analyser ble utført ved hjelp av Perl, Python, Matlab, og R pakker. Vår strategi var å undersøke de epigenetiske og genomiske funksjoner for mulige kreftdempere og onkogener i primær eggstokksvulster. Med basefunksjonen er kopiantall variasjon undersøke vi metylering og uttrykk data for hvert gen under forsterkede eller slettede kopitallforhold. Derfor er et onkogen klassifisert som et amplifisert gen med lav metylering og forhøyet ekspresjon (figur 1). Denne samme amplifisert onkogen kan epigenetiske reguleres gjennom hypermethylation i eggstokkreft som resulterer i en redusert ekspresjon, selv om kopiantall blir forsterket. Omvendt kan en tumor suppressor har senket kopiantall variasjon og bli hypermethylated resulterer i redusert uttrykk eller regulert gjennom hypometylering åpner for dens uttrykk i henhold senket CNV forhold (figur 1). ROMA fragmenter ble tilskrevet genene ved hjelp av UCSC Genome Browser hg17 montering. Vi identifiserte gjennom prøven sammenligning mellom TCGA plattformen og ROMA plattform (som 7 prøver var i vanlig) en ROMA plattformspesifikk terskel 0,0 seg.mean som fanger maksimal prosentandel av slettede gener samtidig opprettholde et minimum falsk positiv prosent av forsterket eller nøytrale kopi gener. Slutt genet metylering oppdraget ble utført ved å anvende den maksimale verdi for hver sonde MOMA-fragment, og den maksimale verdi MOMA-fragmentet ble tilskrevet den nærmeste genet. Den Wilcoxon signed-rank test ble brukt til å beregne berikelse p-verdier for CNV og uttrykk data og Benjamini-Hochberg (BH) metoden ble brukt til Multi justering og False Discovery Rate (FDR) kontroll. Euklidske avstander ble beregnet mellom normale og tumorprøver for metylering og uttrykk datapunkter for alle gener i både MSKCC og TCGA datasett. I tilfellet med den MSKCC datasettet når tilstrekkelig normal prøve ekspresjonen data ikke var tilgjengelig, en 50 x bootstrap prøvetaking ble utført ved bruk av TCGA normale prøver uttrykk data per genet. Enkelt varians og Ling multivariate t-tester ble utført på disse avstandene til å beregne alle p-verdiene når du utfører metylering og uttrykk analyse på varierende kopitallverdier, med statistiske flere test FDR justeringer som ovenfor. For å identifisere sannsynlig funksjonelle og sti endringer fanges opp av vår funksjon basert genet analyse vi testet om medlemskap i spådd MSKCC gener i hver funksjon klasse innenfor en total av 173 KEGG biologiske pathways var proporsjonal med deres størrelse. Dette betyr identifisere trasé som genet medlemskap i hver funksjon klasse avviker vesentlig fra null, som er definert av en hypergeometrisk fordeling. Den endelige listen over viktige veier ble valgt etter å kontrollere den falske funnraten ved Benjamini-Hochberg multippel testing korreksjon. Dataanalyse skript og videre analyser informasjon kan bli funnet i Analysis S1.

Kopier nummer variasjon er base genomisk funksjon for vår identifikasjon av tumor suppressor og onkogene gen eiendommer i eggstokkreft. Et onkogen kan overuttrykt i henhold amplifisert kopiantall og lav metylering, mens hypermethylation kan brukes for regulering av ekspresjon i en genet amplifisert tilstand. Tilsvarende redusert tumor suppressor ekspresjon kan være et resultat av delvis kopitall tap med hypermethylation. Tumor dempere kan også muligens bli regulert via hypometylering i et eksemplar nummer slettet oppgitt. Vår analyse er modellert for slike eiendommer og først undersøker CNV per genet og deretter attributter epigenetisk endring for hvert eksemplar nummer aberrasjon med genuttrykk.

Resultater

Ovarian tumor Kopier nummer Avvik og DNA metylering

Vi først individuelt analysert både kopiantallet variasjon og DNA metylering for hvert gen av kromosom stilling i 42 serøs primære ovarietumorer levert av Gynecology Research Laboratory ved Memorial Sloan-Kettering Cancer Center (MSKCC datasett) bruker Representational oligonukleotid Microarray Analysis (ROMA) [37], [44] og Metylering deteksjon oligonukleotid Microarray Analysis (MOMA) [41], [42]. De forsterkede og slettede stoppunkt loci omfatter totalt 561 regioner blant alle prøvene (figur 2). ROMA identifiserer 205 sletting og 356 forsterkningsstoppunkter. Brytningspunkter ble definert som områder mellom hvert segment (statistisk kombinert probe intensiteter) beregnes ved hjelp av CBS (sirkulær binær segmentering [39], [40]) -metoden. Blant de 42 tumorprøver, finner vi et gjennomsnitt på 76 CBS beregnede segmenter per kromosom. Segmentering tall pr kromosom korresponderte med kromosom størrelse med unntak av kromosomer 8, 11, 12, 17, 19, og 20 hvor segmentering densiteten var større enn normalisert for kromosom størrelse og mindre for kromosomene 6, 9, 10, 14, 15, 16, og 18. Den største variasjon av kopiantallet variasjon (som målt ved CBS segmenteringsmiddelverdier) blant alle prøvene oppstår i kromosom 19, 2, 10 og 4, henholdsvis (fig S1). De hyppigste slettinger ( 10% tumorprøver) ble observert i loci; chr4: Q25-q35.2, chr7: p22.3-p15.3, chr8: p23.3-p21.1, chr13q12.11-Q34, chr14q32.2-q32.33, chr15q13.3-q21.1, chr16q11.2-q24.3, chr17p13.3-q25.3, chr19: q13.2-q13.43 og chr22: q11.21-q13.33 (Tabell 1 gir prosentandelen av alle prøvene slettet innen loci). De hyppigst forsterkes ( 10% tumorprøver) loci innenfor alle kromosomene blant alle 42 tumorprøver er; chr1: p34.4-p34.1, chr1: q21.1-q21.2, chr3: q13.2-Q23, chr8: q11.22-q24.3, chr19: Q12-q13.12 og chr20: Q13. 12-q13.2 (tabell 1). Tre stoppunkt symmetri loci (presiseringer og slettinger på lignende genomisk posisjoner i flere prøver) ble funnet; chr17: q11.2-q21.32, chr19: q13.12-q13.2 og chr21: q21.3-22.13. Sammenligning av resultatene de ROMA (tabell 1) med kopi talldata for normale individer som finnes i HapMap [45] viser ingen overlapping med de få forsterket områdene som ble funnet i HapMap normal datasettet. Overlappende områder av sletting mellom våre CNV resultater og HapMap er 8p23 og 22q11.23 hvor begge regionene viser hyppige heterozygot tap. Vi analyserte DNA metylering ved CpG øyer som bruker de samme 42 primær eggstokksvulster og 7 prøver normalt vev (figur 3). Vi utarbeidet metylering verdier for 11 978 genet promoter regioner som dekker 22 kromosomer. Ved direkte sammenlignet med normalt vev totalt 68 gener ble funnet å være rangert som hypermethylated og 19 rangert som hypomethylated innenfor 10% av hele den normale til tumor-forhold fordeling (tabell S1). Genene stiller metylering verdier over normale prøver inkluderer onkogen PHOX2B, den neuroblastom forbundet genet ALX3, den vanligste metylert PCDHα genet klynge, POU4F2, REXO1L1, BAPX1, og kalium-kanal KCNJ8. Nærmere bestemt REXO1L1, (RNA eksonuklease) viser høye nivåer av metylering på både tumor- og normale prøver, men det er en 56% økning av metylering i tumorprøver. Gener med lavest svulsten til normale metylering forholdstall inkluderer kromosom 4 variant av onkogene fremme genet ubiquitin hydrolase DUB3 (19% reduksjon) og CAPS (onkogen innblandet i livmorkreft, 25% reduksjon). Andre hypomethylated gener sammenlignet med normale prøver inkludert; RNPC3, USP37, LDHD, GJB4 (gap junction protein), LCN8 (innblandet i metastase) og CGB1 (chorionic gonadotropin, beta polypeptid 1) (tabell S1).

Stoppunkt stillinger kopi nummer variabilitet (slettinger avbildet i blå, presiseringer avbildet i rødt) i 22 kromosomer er vist som bestemmes fra ROMA generert segmentering data. Den innledende endring sletting eller forsterkning genomisk stilling er avbildet fra alle 42 ovarian tumor kreftprøver

Svulsten. Normal ratio prosent for MOMA metylering per genet fra 42 eggstokkreft kreftprøver og 7 vev normale prøver er skissert per kromosom. For hver prøve den midlere metylering verdi beregnet fra maksimalverdien MOMA per sonde som inneholder genet promoter-regionen. MOMA metylering data dekket 11,978 genet promoter regioner. Prominent hypermethylation (rød) og hypometylering (grønn) gener er merket og gitt i tabell S2.

Korrelasjoner av genuttrykk med Kopier nummer Variasjon eller DNA Metylering

Vi separat undersøkte avhengighet av genekspresjon (via Affymetrix human Genome U133A array, se Methods) på kopiantall forsterkning, kopiere nummer sletting og formidler metylering i eggstokkreft svulster. Vi først sammenlignet fordelingen av genuttrykk for diskrete høye og lave CNV gener som finnes i vår MSKCC datasett og TCGA datasett. De to datasettene viste tilsvar tendenser i uttrykket for fordeling gener med høy og lav kopiantall-variant (figur 4, figur S2). Som kopitallet øker variasjonen fra delesjon til forsterkning gjennomsnittlig genekspresjon også øker (figur 4). Vi viser derfor en sammenheng mellom økning i total gen-ekspresjon med amplifikasjon av genet kopiantall i primær ovarietumorer. I tillegg målte vi den kumulative fordelingen av genekspresjon for slettede og forsterkede gener. Den kumulative fordelingen er den totale andelen av gener funnet under et dynamisk uttrykk terskel. Hvis gener med en lav CNV (strøket) er mer under uttrykkes enn gener med en høyere CNV (forsterket og over uttrykte) de kumulative fordelingskurve resulterer i en brattere stigning til lavere ekspresjonsnivåer verdier for slettede gener (som indikerer en større prosentandel av gener funnet med lavere uttrykk verdier). En maksimale samlede uttrykk forskjell mellom 7-17% er observert for gener med lavt kopitall i forhold til gener med høyt kopiantall (figur S3). Deretter utførte vi uttrykket til CNV korrelasjon per genet for alle tumorprøver i både MSKCC datasett og TCGA datasett. Vi oppdaget 124 gener med positiv CNV til uttrykk Pearson korrelasjonskoeffisient grenser ≥0.8 i TCGA datasett (p-verdier 1,0 × 10

-10, tabell S2B). Den seg.mean forsterkning og sletting utvalg for MSKCC datasettet er ikke så stor som observeres i TCGA datasettet (Tall S1 og S2) og dermed færre gener er tatt med betydelig CNV til uttrykk sammenhenger. Men er vi i stand til å identifisere 32 gener med Pearson korrelasjon values≥0.6 (p-verdier 4,0 × 10

-5, Table S2A) med 18 av de 32 genene også identifisert i TCGA datasettet (Tabell S2A).

Som genkopitallet variasjon øker fra sletting til forsterkning middelverdien genuttrykk øker også i begge de MSKCC (blå linje) og TCGA (grønn linje) datasett.

Greater genet uttrykk forskjeller mellom normale og tumorprøver er ikke observert før vi stole bare på de prøver som inneholder gener med ekstreme presiseringer og slettinger (figur 4). Derfor vår tilnærming til å identifisere gener med endret kopiantall variasjon korrelert til uttrykk var å undersøke uttrykket verdiene av gener i høy og lav kopi nummer seg.mean verdier og sammenligne uttrykket av disse genene enn på vanlige vevsprøver. I et arrangement hvor det ikke er kopiantall avvik i normale prøver den samme type korrelasjon ville bli observert. Vi undersøkte bare tumorprøver ettersom størrelsen og omfanget av eksemplar nummer endringer er mer betydelig oppdaget gjennom vår protokoll. Til å begynne med vi beregnet gjennomsnittsverdien uttrykket for hvert gen, hvor 20% av tumorprøvene viste en CNV verdi på over 0,50 seg.mean eller under -0,50 seg.mean og også filtrert ut genene for hvilke den normale ekspresjon ikke var innenfor standard avvik (standard TCGA CNV terskler ble brukt som tilsvarer minst en forsterket eller slettet kopiere og med evne til å fange så mange endrede CNV prøver per genet som mulig). Denne strenge kriterier for 20% av TCGA tumorprøver tatt 21 gener (tabell S3). Disse 21 gener som CCNE1 og GSTT1 representerer de endrede CNV gener i tumorprøver med differensial uttrykk i forhold til vev normale prøver i TCGA datasettet. Men denne fremgangsmåten er i stor grad avhengig av de normale genet gjennomsnitts ekspresjonsnivåer. For TCGA, på tidspunktet for vår analyse uttrykk informasjonen var bare tilgjengelig for 8 prøver utpekt som normalt. Derfor er et gen som MYC (mest ofte over uttrykt i tumorceller) som har en gjennomsnittsprøve uttrykk verdi på 8,93 i de åtte TCGA normale prøver (figur S4) og en midlere tumorprøve ekspresjon verdi på 7,75 (fra 339 tumorprøver) er ikke observert ved denne metoden. Ved å utføre tumorprøve konkrete analyser vi kan ikke helt eliminere disse variasjonene, men håper å begrense omfanget.

For ikke å stole på den lille normalt vev prøvetaking for uttrykk verdier, utførte vi en Wilcoxon rank test bare på uttrykket verdier fra minst 20% av tumorprøvene i løpet av meget lave og høye genkopitallet seg.mean terskler. I tumor data TCGA satt dette laget et sett med 54 gener innen en falsk funnrate på 5% ved seg.mean verdier på 1,25 og -0,50 for høy og lav kopiantall variasjon, henholdsvis (Tabell 2, Tabell S4). Det antall gener som er tatt er avhengig av høyt kopiantall segmentering middelverdi anvendes som en filtreringsterskel (under opprettholdelse av et sett lavt kopi terskel på -0,50, for derved i det minste å fange et tap av heterozygositet per-genet [8]; Figur S5). Totalt 1114 genene er fanget (FDR 0,05) ved en lavere CNV terskel på 0,8 seg.mean (figur S5). Med Wilcoxon rank test finner vi gener som MYC, CCNE1, KRAS, NDRG1, MLL4 og MTSS1 som datasett bestemt normalt vev uttrykk kan ikke være vesentlig forskjellig fra alle tumorprøver, men er variabel mellom lav og høy kopi antall kreftprøver. Konservative terskel begrensningene av 20% tumorprøve inkludering resulterte i identifisering av gener fra ekstrem CNV loci for eksempel i kromosomene 1, 8 og 19. Av interesse, ble transkripsjonsfaktor CEPBG funnet å ha god CNV til uttrykk korrelasjon og også ekspresjon og metylering korrelasjon i MSKCC datasettet. Tilsvarende utfører Wilcoxon rank test på MSKCC tumorprøver på et høyt kopiantall terskel ≥0.5 og et lavt kopiantall ROMA plattformspesifikk terskel 0,0 (se Methods) vi fanget 62 gener på en falsk funnrate ≤0.05 (tabell 2 tabell S4). Gener som er identifisert i den MSKCC datasettet var fra samme genomiske loci som de som finnes i den TCGA datasettet. Fem gener ble spådd fra begge datasettene: CCNE1, POP4, UQCRB, PHF20L1 og C19orf2 (tabell 2). Vi har integrert uttrykket data med CNV å bestemme gener som er mer sannsynlig å være kandidater som fungerende kreftgener med potensial tumor suppressor og onkogene CNV-uttrykk funksjoner. Dette gjør antall gener i videre studier mer tilnærmelig for funksjonell validering av gener påvirkes av genetiske avvik.

Vi analyserte også den klassiske avhengighet av DNA metylering i genet promoter regioner med at av genuttrykk. Metylering data viser dårligere korrelasjon til uttrykk enn kopiantall variasjoner (figur S6). Vi er fast bestemt Pearson korrelasjoner mellom DNA metylering og genuttrykk i både MSKCC og TCGA eggstokkene primære tumor datasett. Pearson korrelasjonsverdier 0,5 (p-verdier 2,0 x 10

-4, lav metylering og høy ekspresjon i høyt metylering og lav ekspresjon) er observert i 86 gener mellom de to datasettene. Fremtredende, viser genet som koder for ubiquitin B (UBB) en høy korrelasjon mellom metylering og ekspresjon i begge datasettene og RAB25 en kjent eggstokkreft mistenkt er også funnet i TCGA datasettet [31], [46] (tabellene S2A og S2B)

Legg att eit svar