PLoS ONE: Exome-Wide Association Study of livmorkreft i et multietnisk Population

Abstract

Endometriekreft (EF) bidrar vesentlig til totale belastningen av kreft sykelighet og dødelighet i USA. Familiehistorie er en kjent risikofaktor for EF, og dermed genetiske faktorer kan spille en rolle i EF patogenesen. Tre tidligere genom-wide assosiasjonsstudier (GWAS) har funnet bare ett locus forbundet med EF, som tyder på at vanlige variantene med store virkninger som ikke kan bidra sterkt til EC risiko. Alternativt hypoteser vi at sjeldne varianter kan bidra til EC risiko. Vi gjennomførte en exome omfattende forening studie (EXWAS) av EF bruke infinium HumanExome BeadChip for å identifisere sjeldne varianter assosiert med EC risiko. Vi lykkes genotypede 177,139 varianter i en multietnisk befolkning på 1,055 saker og 1,778 kontroller fra fire studier som var en del av Epidemiology av livmorkreft Consortium (E2C2). Ingen varianter nådd global betydning i studien, noe som tyder på at mer makt er nødvendig å påvise beskjedne assosiasjoner mellom sjeldne genetiske varianter og risiko for EC

Citation. Chen MM, Crous-Bou M, Setiawan VW, Prescott J, Olson SH, Wentzensen N et al. (2014) Exome-Wide Association Study of livmorkreft i en multietnisk befolkning. PLoS ONE 9 (5): e97045. doi: 10,1371 /journal.pone.0097045

Redaktør: Paolo Peterlongo, IFOM, Fondazione Istituto FIRC di Oncologia Molecolare, Italia

mottatt: 24 februar 2014; Godkjent: 15 april 2014; Publisert: 8. mai 2014

Copyright: © 2014 Chen et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Sykepleierne «Health Study (NHS) etterforskere støttes av NCI, NIH Grants Antall 1R01 CA134958, 2R01 CA082838, P01 CA087969, og R01 CA49449. MMC er støttet av opplæring bevilgning 5T32CA009001-38 fra NCI. MCB er også støttet av en Sara Borrell postdoktorstipend fra det spanske helsedepartementet, Carlos III Health Institute. Den multietnisk Cohort Study (MEC) er støttet av NCI, NHI Grants Antall CA54281, CA128008, og 2R01 CA082838. Fred Hutchinson Cancer Research Center (FHCRC) er støttet av NCI, NIH Grant Antall 2R01 CA082838, NIH RO1 CA105212, RO1 CA 87538, RO1 CA75977, RO3 CA80636, NO1 HD23166, R35 CA39779, KO5 CA92002 og midler fra Fred Hutchinson Cancer Research Senter. EDGE Study (Østrogen, kosthold, gener, og livmorkreft) er støttet av NCI, NIH Grants Antall 2R01 CA082838, R01CA83918 (Olson PI) og P30-CA008748 (Cancer Center Support Grant). The Alberta Health Services Study (AHS) ble støttet av driftstilskudd hentet fra National Cancer Institute of Canada med midler fra den kanadiske Cancer Society og den kanadiske Institute for Health Research. AHS er også støttet av NCI, NIH Grant Antall 2R01 CA082838. Dr Christine Friedenreich støttes av karriere utmerkelser fra Alberta fornyer-Health Solutions og Alberta Cancer Foundation gjennom helgen til ende Kvinners Kreft Brystkreft Chair. Dr Linda Cook ble støttet gjennom Canada Forskning Stoler program. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Endometriekreft (EC), en kreft i livmor epitelbelegg som vanligvis oppstår nær eller etter overgangsalderen, er den vanligste kreft i kvinnelige kjønnsorganer og den 10. største årsaken til kreftdød blant kvinner i den industrialis verden [1] – [3]. EC er sterkt assosiert med østrogen alene postmenopausal hormonbehandling [4], [5] og overflødig kroppsvekt [6] på grunn av økt aromatization av C-19 steroider av overflødig fettvev [7]. Disse risikofaktorer støtte «uhindret østrogen» hypotesen hvori EF kan utvikle seg på grunn av den ukontrollerte mitogene effektene av østrogen i fravær av tilstrekkelig progesteron [8]. Noen studier har vist at slektshistorie øker risikoen 02:58 ganger hos yngre kvinner som har en første-graders kvinnelig slektning med EF [9], [10], mens det blant eldre kvinner foreningen er mindre sterk. I tillegg er det en økt risiko for EC hos kvinner med Lynch syndrom [11], en arvelig autosomal dominant tilstand som overfører en høy risiko for tykktarmskreft i tillegg. Disse observasjonene tyder på at germline genetikk kan bidra til EC mottakelighet.

Genome-wide assosiasjonsstudier (GWAS) har nå identifisert mer enn hundre mottakelighet loci for en rekke krefttyper [12]. Tre GWAS studier av EF er gjennomført oppdatert med bare ett identifisere en roman genom-wide betydelig locus, rs4430796, (p = 7,1 × 10

-10) i forbindelse med EF [13] på

HNF1B

genet region på kromosom 17q12. To uavhengige studier senere kopiert tilknytning rs4450796 [14], [15]. Men to andre GWAS studier av EF [14], [16] var ikke i stand til å identifisere ytterligere genom-wide betydelig loci, som tyder på at vanlige variantene med store effekter ikke kan sterkt bidra til familiære risikoen for EF.

De fleste risikolene oppdaget gjennom GWAS har beskjedne effektstørrelser som ikke står for mye arvbarheten av vanlige sykdommer [17]. Dessuten har GWAS studier fokusert på vanlige varianter ( 5%) i den generelle befolkningen. Lavfrekvente varianter utgjør en stor andel av genetisk variasjon i mennesker og kan forklare en vesentlig del av arvelig i kreft etiologi. Siste exome-sekvense studier har funnet sjeldne varianter i kandidat mottakelighet gener for familiær tykktarmskreft [18], brystkreft [19], og prostata kreft [20], noe som tyder på at analysen av sjeldne varianter kan også gi innsikt i etiologien av EF. Men exome-sekvense studier krever prøver størrelser som ikke er mottagelig for store epidemiologiske studier på grunn av de høye kostnadene for tiden som trengs for å oppnå tilstrekkelig statistisk styrke.

Det har vært et push for å utvikle statistisk kraftig, men likevel relativt billig, metoder for å oppdage foreninger for sjeldne varianter med større effektstørrelser. Illumina har nylig utviklet infinium HumanExome BeadChip (exome array) fra ikke-synonyme variantene finnes minst 3 ganger på mer enn 2 datasett fra hel-exome sekvensering av mer enn 12.000 individer. Denne matrisen gir en plattform som vi kan begynne å kartlegge landskapet av sjeldne variasjon i et stort antall prøver.

Vi genotypede sjeldne varianter i en multietnisk befolkning på 3.067 kvinner (1169 EC saker og 1,898 kontroller) fra epidemiologi av livmorkreft Consortium (E2C2) [21] for å teste hypotesen om at sjeldne varianter i koding regioner kan være forbundet med EC risiko.

Metoder

Etikk komité fra hver deltakende studie (Alberta Health Services, Østrogen, kosthold, gener og livmorkreft Study, multietnisk Cohort Study) oppnådd skriftlig informert samtykke fra alle deltagerne. All skriftlig samtykke ble godkjent fra Institutional Review Board (IRB) fra hver institusjon (Alberta Health Services, Canada, Memorial Sloan Kettering, USA, University of Hawaii Cancer Center, USA; Keck School of Medicine-University of Southern California, USA).

Alberta Health Services, Memorial Sloan Kettering, University of Hawaii Cancer Center og University of Southern California institusjonell gjennomgang boards spesielt godkjent denne studien (Exome-Wide Association Study of livmorkreft), samt skriftlig samtykke mottatt av deltakere.

Deltakelse studier også innhentet IRB-sertifisering, tillater deling av data i henhold til NIH Policy for deling av data innhentet i NIH støttet eller Ledet Genome- Wide Association studier (GWAS).

Study Befolknings

Exome rekke genotyping ble utført på 3.067 prøver fra 3 retrospektive kasus-kontrollstudier: Alberta Health Services Study (AHS) [22], den Østrogen, kosthold, gener og livmorkreft studie (EDGE) [ ,,,0],23], og Fred Hutchinson Cancer Research Center (FHCRC) studie og en case-control studie nestet innenfor den potensielle multietniske Cohort Study (MEC) [24]. Studier som deltar i denne analysen er beskrevet i tabell 1, og i vår tidligere GWAS [14]. Av de kvinnene inkludert i studien, 1169 var EU-saker, og 1898 var kontroller. Tilfellene var begrenset til de som er diagnostisert med den vanligste undertype av EC (type I) mens kontroller var kreft fri og hadde en intakt livmor. Kontrollene ble matchet til tilfeller av alder og studiested.

Genotyping og kvalitetskontroll

DNA ble ekstrahert ved hvert studiested fra buffy coat eller kinn-celleprøver etter produsentens protokoll og genotypet ved University of Southern California bruker infinium Menneskelig Exome BeadChip (Illumina Inc., San Diego, CA) som en del av Stage II replikering av E2C2 GWAS. Den BeadChip inkluderte 9.232 tilpassede markører, 2211 av disse er spesielt relevante for EC, i tillegg til de 247,870 markører koding primært for protein-altering varianter allerede inkludert i BeadChip standard design.

Genotype kall ble utført med Illumina GenCall på alle prøver (n = 3.067) ved hjelp av MEC klyngen fil (16.000 multietniske prøver) for de ikke-tilpassede markører og autoclustering for egendefinerte markører. Varianter ble ekskludert fra analysene om samtalepriser var 90% (n = 115), varianten var monomorf (n = 77 521), den loci hadde ingen observert erne og mangler alle genotyper (n = 1962), varianten var et innskudd eller delesjon-allelet (n = 117), eller variant avvek fra Hardy-Weinberg likevekt ved p-verdi 0,0001 i noen etnisk gruppe (n = 248). Den endelige sykdom egenskap analyse datasettet inneholdt 177,139 vellykket genotypet varianter.

I alt 3031 av 3067 prøver ble vellykket genotypet med samtalepriser ≥ 90%. Av disse har vi fjernet 40 dobbeltprøver (genotype samstemmighet 99,9%) som brukes for analyse kvalitetskontroll og 15 prøver for andre kvalitetskontroll grunner. Vi gjennomførte hovedkomponentanalyse (PCA) for å identifisere selvrapporterte etnisitet uteliggere og antyde herkomst med EIGENSOFT v 4.2 [25] med 47,097 tilpassede og ikke-tilpassede SNPs med genotyping priser 90% og MAF 1%. Den HapMap fase II (build 37) CEU, YRI, og JPT-KHB prøver ble brukt som referansegrupper. Ved hjelp av de første 5 hovedkomponenter, bestemt vi 7 personer som var etnisitet uteliggere og utelukket dem fra analysene. Etter ytterligere fjerning av 136 utliggere (mer enn 3,5 standardavvik fra gjennomsnittet) av prøven heterozygositet av etnisitet, 2,833 kvinner (1,055 EF saker og 1,778 kontroller) forble for sykdom egenskap analyse.

Statistical Analysis

Enkel variant forening analyse.

Enkelt variant analysene ble utført samlet og fordelt etter selvrapportert etnisk gruppe. For hver SNP, beregnet vi odds ratio (OR) og 95% konfidensintervall (KI) ved bruk av ubetinget logistisk regresjon, forutsatt en additiv genetisk modell (0, 1, 2 eksemplarer av den mindreårige allelet) og justering for kroppsmasseindeks (BMI i kg /m

2), alder, studium område, plate, og de første 4 hovedkomponenter for å gjøre rede for populasjonen lagdeling. All enkelt variant analyser ble utført ved hjelp av plink v 1.07 [26].

Gene basert analyse.

Som en ekstra metode for å oppdage sjeldne varianter assosiert med EC, gentesting ble utført ved hjelp SKAT-O [27] over all etnisiteter. SKAT-O kombinerer gen-byrden tester og SKAT, en SNPset nivå test for foreningen å bruke kjernemaskin metoder, i spesielle tilfeller for en optimalisert tilnærming som maksimerer makt. Disse analysene ble også justert for BMI, alder, studiested, plate og de første 4 hovedkomponenter. I alt ble 16,245 gener med minst en variant testet

Statistisk signifikans

Vi er fast bestemt enkelt variant foreningen å nå global betydning hvis den ujusterte p-verdien var. . 2,82 × 10

-7, tilsvarende en Bonferroni korreksjon for 177,139 tester. Gene-baserte foreninger ble betraktet som signifikant for ujusterte p-verdier. 3,08 × 10

-6, tilsvarende en Bonferroni korreksjon for 16,245 tester

I henhold til NIH /NCI politikk alle data vil bli sendt til databasen av genotyper og fenotyper (dbGaP, https://www.ncbi.nlm.nih.gov/gap).

Resultater

Association analyser inkluderte 177,139 hell genotypet varianter med MAF 0 fra totalt 257,102 varianter inkludert i matrisen. Befolknings kjennetegn ved de fire deltaker studier (AHS, EDGE, FHCRC, og MEC) er beskrevet i Tabell 1. Gjennomsnittlig alder ved diagnose for tilfeller varierte fra 58,5 år i AHS til 65,5 år i MEC og mener BMI på diagnose for tilfeller varierte fra 28,8 kg /m

2 i MEC til 32,3 kg /m

2 i AHS og EDGE. Av de 3.067 prøvene genotypet, 2833 ble inkludert i analysen. Det var ingen forskjell i alder, BMI, og etnisitet mellom ekskluderte saker og de som inngår i analysen (resultater ikke vist). Av disse 2,833 personer var det 254 selvrapportert afrikansk-amerikanere, 347 selvrapportert asiater, 1686 selvrapportert kaukasiere, 79 selvrapportert Hawaiians, 360 selvrapporterte Latinas, og 107 som ikke rapporterer en bestemt etnisitet (tabell 2).

Variant Distribusjon blant rapportert etnisiteter

i denne studiepopulasjonen, ble 77,521 varianter (30,4%) funnet å være monomorfe tvers av alle innrapporterte etnisiteter og 177,139 varianter (69,6%) var polymorf i det minste en etnisk populasjon med 74,0% av polymorfe alleler som har MAF ≤ 1% (figur 1). Av de variantene som var polymorfe i minst én etnisk befolkning, 42,0% i afrikanske amerikanere, 71,7% blant asiater, 34,9% i kaukasiere, 69,7% i Hawaii, 49,5% i Latinas, og 60,0% i de av ukjent etnisitet var monomorfe ( Figur 2). De MAF distribusjoner var nokså lik blant asiater, Hawaiians, og de som ikke rapporterer en bestemt etnisitet mens afroamerikanere, hvite og Latinas delte flere likheter i MAF med hverandre enn med asiater, Hawaiians, og de av ukjent etnisitet. Om 20,2% (n = 35 912) av varianter ble delt av alle 5 rapportert etnisiteter mens kaukasiere og Latinas hadde flest varianter i vanlig på 41,1% (n = 72 878) (figur 3). Kaukasiere hadde de mest unike polymorfe varianter (18,7%), etterfulgt av afrikansk-amerikanere (14,0%), Latinas (3,2%), asiater (2,7%), de som ikke rapporterer etnisitet (1,0%), og Hawaii (0,4% ).

antall varianter er plottet av den mindreårige allel frekvens fra alle etniske grupper. Disse variantene omfatter de som er monomorfe i alle etnisiteter.

Antall varianter er plottet av den mindreårige allel frekvensen for hver etnisitet. Alle disse variantene er polymorfe i minst ett rapportert etnisitet.

Tall av felles varianter er vist i kryss. Det totale antall polymorfe varianter av etnisitet er oppført i øvre venstre hjørne.

Enkelt Variant Association for livmorkreft

Ingen varianter nådd global betydning i enkelt variant sammenslutning av EF for alle etnisiteter kombinert (Figur 4a, tabell 3) når man korrigerer for multiple sammenligninger ved hjelp av Bonferroni justering (p 2,82 × 10

-7). De sterkeste foreninger var for varianter med 0,05 MAF (tabell 3) ligger innenfor 50 kb av lange ikke-proteinkodende intergeniske RNA,

LINC00520 plakater (rs1953358, OR = 1,36, p = 4,76 × 10

-7) og i intron-regionen i

PROS1 plakater (rs8178648, OR = 1,71, p = 1,53 x 10

-6), som koder for protein S, en kofaktor til protein C i anti -coagulation veien. I kaukasiske, som utgjør størstedelen av den samlede analysen, forble bare rs8178648 suggestively forbundet med OR = 1,98 og p = 3,35 × 10

-6 (figur 4b, tabell 3). Det var ingen globalt betydelige eller tankevekkende varianter i afrikanske amerikanere, asiater, Hawaii, Latinas, og de som ikke rapporterer etnisitet (tabell S1).

Resultater fra enkelt variant analyser (-log

10p) er plottet mot kromosom posisjon (NCBI bygge 37) for foreningen i løpet av alle etniske grupper (A) og for foreninger innenfor kaukasiere (B). Suggestive varianter er merket ovenfor. Resultatene ble justert for alder ved diagnose, BMI, studiested, plate, og de første fire hovedkomponenter.

Gene basert analyse av livmorkreft

Ingen av gen-baserte tester av foreningen var globalt signifikant (p 3,08 × 10

-6) etter justering for multiple sammenligninger (tabell S2). Av de 16,245 gener testet, den viktigste EC foreningen var med

KRT81 product: (p = 2,21 × 10

-5), et medlem av keratin genet familien ligger på 12q13.

PROS1

, hvor rs8178648 ligger, var ikke signifikant assosiert med EC (p = 0,6789) ved testing i løpet av alle etnisiteter verken ved testing bare i Causasians (resultater ikke vist).

Diskusjoner

Vi presenterer en innledende lete i om sjeldne varianter assosiert med EC risiko i en multietnisk befolkning fra E2C2. Ingen varianter nådd global betydning (p 2,82 × 10

-7) i én variant foreningen analyser av EF i alle etnisiteter kombineres eller når stratifisert ved rapportert etnisitet. I tillegg, ingen gen-basert test av foreningen nådd global betydning (p 3,08 × 10

-6)

Blant alle etnisiteter, rs8178648 på kromosom 3 opprettholdt en tankevekkende sammenheng med EF (OR = 1,707. , 95% KI: 1,363 til 2,123, p = 1,53 × 10

-6). Varianten ligger innenfor intronet regionen

PROS1

, et gen som koder for protein S, en kofaktor i den antikoagulerende reaksjonsveien som fører til autosomalt dominant arvelig Trombofili når mutert [28].

PROS1

uttrykk har blitt rapportert å være forhøyet i aggressiv prostatakreft vev [29] og skjoldbrusk kreft vev [30], noe som tyder på det kan ha en rolle i kreft etiologi eller progresjon.

PROS1

har blitt funnet å være direkte oppregulert ved progestiner [31] og nedregulert ved 17β-estradiol, et østrogen som regulerer genekspresjon via østrogenreseptoren [32], slik at det er utsatt for skjevheter i kjønnshormonet metabolske sti, som er innblandet i EF etiologi. Men

PROS1

var ikke signifikant assosiert med EC (p = 0,6789) ved bruk SKAT-O og ingen andre GWAS har funnet betydelige eller tankevekkende varianter i dette genet.

En svakhet ved denne studien er vår begrensede utvalgsstørrelsen, som ikke ble tilstrekkelig styrke til å oppdage sjeldne varianter med beskjedne effekter forbundet med EF. I tillegg er exome rekke innhold hovedsakelig basert på europeisk opphav, mens vår studie inkluderte et betydelig antall prøver med andre ancestries. Ufullstendig exome rekke dekning av alle funksjonelle varianter og indels som kan påvirke EU risiko kan også ha begrenset omfanget av vår studie. Men vår analyse en av bare to studier [33] bruker exome array å undersøke assosiasjoner mellom sjeldne varianter og komplekse sykdommer i store multietniske befolkningsgrupper. Vår studie er også den første til å utnytte exome array med EF og fungerer som en forlengelse av vår forrige undersøkelse av vanlige variantene på EC risiko.

En tidligere GWAS [13] identifisert en roman locus nær

HNF1B

, rs4430796, omvendt assosiert med EC risiko. Vi replikert funnene i vår GWAS [14], men ingen andre vanlige varianter assosiert med EF er bestemt. Exome arrays som fokuserer på sjeldne varianter som er antatt å ha større effekt enn ved vanlige variantene, har blitt brukt for å kunne identifisere nye loci påvirke insulinbehandling og sekresjon i type 2 diabetikere [34]. Til dags dato, analyser av kreftformer som bruker exome arrays har ikke klart å finne sterke bevis for at sjeldne varianter er sterkt assosiert med kreft, avslører bare en variant signifikant assosiert med brystkreft og ingen med prostatakreft [33]. Tilsvarende har vi ikke identifisert noen loci signifikant assosiert med EF. På grunn av vår begrensede utvalgsstørrelsen, ble vår studie anslått til å være tilstrekkelig styrke til å oppdage ORS 2,53 for lavfrekvente varianter (MAF = 0,02). En OR på 2,00 (MAF = 0,01) vil også trenge rundt 4250 tilfeller og 7,250 kontroller for å være tilstrekkelig drevet. Selv for varianter med høyere MAFs ligner på det som ble observert for rs8178648, en studie påvise en per-allel OR på 1,70 ville kreve minst 1.107 saker og 1,871 kontroller for å bli betraktet som tilstrekkelig drevet (β = 0,80). Derfor større studier må gjennomføres for å avdekke nye assosiasjoner med sjeldne varianter.

I konklusjonen, vår studie fant ingen bevis for at sjeldne varianter med store effektstørrelser er forbundet med EC risiko. Selv om vi var i stand til å identifisere noen tankevekkende assosiasjoner, som med rs8178648, ville mye større studier være nødvendig for å identifisere en mer beskjeden påvirkning av sjeldne varianter på risikoen for EF.

Hjelpemiddel Informasjon

Tabell S1.

1-5. Enkel variant forening resultater. Topp 100 mest betydningsfulle enkelt variant assosiasjoner med livmorkreft av etniske grupper

doi:. 10,1371 /journal.pone.0097045.s001 plakater (XLSX)

Tabell S2.

SKAT-O-genet baserte foreningen resultater. SKAT-O-genet basert assosiasjoner med livmorkreft for alle etnisiteter kombinert

doi:. 10,1371 /journal.pone.0097045.s002 plakater (XLSX)

Legg att eit svar