PLoS ONE: Felles sample-basert GWAS: En kostnadseffektivt alternativ for Identifisere tykktarms og prostatakreft Risk Varianter i det polske Befolkning

Abstract

Bakgrunn

Prostatakreft (PCA) og tykktarmskreft (CRC) er den vanligste diagnosen kreft og kreftrelaterte dødsårsaker i Polen. Hittil har mange enkeltnukleotidpolymorfi (SNPs) forbundet med følsomhet for begge krefttyper har blitt identifisert, men deres effekt på sykdomsrisiko kan variere mellom populasjoner.

Metoder

For å identifisere nye SNPs assosiert med PCa og CRC i den polske befolkningen, ble et genom-wide forening studie (GWAS) utføres ved hjelp av DNA-prøve bassengene på Affymetrix Genome-wide menneske SNP 6,0 arrays. Totalt 135 PCA pasienter og 270 friske menn (PCA sub-studie) og 525 pasienter med adenom (AD), 630 pasienter med CRC og 690 kontroller (AD /CRC sub-studie) ble inkludert i analysen. Allel frekvensfordelinger ble sammenlignet med t-tester og χ

2-tester. Bare de signifikant assosiert SNPs med en proxy SNP (

p

0,001; avstand på 100 kb; r

2 0,7) ble valgt. GWAS markør utvalg ble utført ved bruk av plink. Studien ble kopiert ved hjelp av utvidet kohorter av pasienter og kontroller. Foreningen med tidligere rapportert PCa og CRC resistens varianter ble også undersøkt. Enkelte pasienter ble genotypet ved hjelp av TaqMan SNP genotyping analyser.

Resultater

GWAS valgt seks og 24 nye kandidat SNPs assosiert med PCa og CRC mottakelighet, henholdsvis. I replikering studien ble 17 av disse foreningene bekreftet som viktige i additiv modell av arv. Syv av dem forble signifikant etter korreksjon for multippel hypotesetesting. I tillegg har 17 tidligere rapportert risiko varianter er identifisert, hvorav fem forble signifikant etter korrigering.

Konklusjon

Felles-DNA GWAS aktivert identifisering av nye mottakelighet loci for CRC i den polske befolkningen. Tidligere rapportert CRC og PCA predisposisjon varianter ble også identifisert, validere den globale karakter av sine foreninger. Videre uavhengige replikering studier er nødvendig for å bekrefte betydningen av den nylig avdekket kandidat mottakelighet loci

Citation. Gaj P, Maryan N, Hennig EE, Ledwoń JK, Paziewska A, Majewska A, et al. (2012) Felles sample-basert GWAS: En kostnadseffektivt alternativ for Identifisere tykktarms og prostatakreft Risk Varianter i den polske befolkningen. PLoS ONE 7 (4): e35307. doi: 10,1371 /journal.pone.0035307

Redaktør: Kin Mang Lau, det kinesiske universitetet i Hong Kong, Hong Kong

mottatt: 19 desember 2011; Godkjent: 13 mars 2012; Publisert: 19 april 2012

Copyright: © 2012 Gaj et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av en PBZ-MNiSW-05 /i /2007/01 stipend fra det polske departementet for vitenskap og høyere utdanning (https://www.nauka.gov.pl/home/). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Kreft er svært heterogene, polygene lidelser som oppstår i en flertrinnsprosess som involverer valg av påfølgende cellulære kloner og er et resultat av genetisk så vel som spesifikke miljøfaktorer. I det førstnevnte tilfellet kan både høy penetrans mutasjoner og lav-penetrans polymorfismer bestemme pasientens forsvars og adaptive mekanismer mot eksponering for kreftfremkallende faktorer, å bestemme mottakeligheten til denne sykdommen. Imidlertid er virkningen av vanlige lav-penetrans risiko determinanter liten når isolert, noe som øker følsomhet bare gjennom den kumulative effekten assosiert med forekomsten av multiple risiko varianter [1].

Sammenhengen mellom allelet frekvens og følsomhet overfor sykdommen kan studeres ved å fokusere på individuelt utvalgte varianter eller i stedet, på posisjonen av mer enn en million DNA-varianter, ved hjelp av enkeltnukleotidpolymorfi (SNP) mikromatriser. Microarray plattformer som brukes av genom-wide assosiasjonsstudier (GWAS) representerer en relativt moden teknologi som gjør det mulig å skanne hele genomet til å oppdage potensielle assosiasjoner med sykdommen uten forkunnskaper i sin stilling eller biologisk funksjon. I teorien, som en konsekvens av koblingsulikevekt (LD) mellom SNP’er ved et gitt locus, en høy andel av alle mangfold kan bli fanget av genotyping en relativt mindre undergruppe av markører (den såkalte merking SNP’er) [2] – [5 ].

til dags dato, over 1000 mottakelighet loci, vanligvis av liten eller moderat effekt og presisjon fra lav til moderat høy, har blitt identifisert av GWAS [6]. Men hver av disse studiene, inkludert over 50 GWAS utført med kreftpasienter, kun identifisert noen risiko varianter når analyseres separat. Dessuten har mange studier ikke blitt kopiert [7], [8]. Vanskelighetene i identifisering av genetiske risikofaktorer forbundet med heterogene og polygene sykdommer, som sporadisk kreft, kan forklares med de begrensninger av metodikken. Kommersielt tilgjengelige SNP array-plattformer har blitt optimalisert for å studere sykdommer eller egenskaper basert på antagelsen om at vanlige sykdommer ville bli assosiert med vanlige variantene [9]. Siden loci med en høy effektstørrelse er blitt effektivt fjernet fra den humane populasjonen ved naturlig seleksjon, identifisering av en felles polymorf mottakelighet locus sterkt assosiert med en sykdom, med odds-ratio (OR) over 2 [10], er usannsynlig. Selv om identifikasjon av SNP med lav mindre allelet (MA) frekvens har forbedret ved bruk av siste generasjon chips, og høyere probe tettheter aktivert studiet av varianter med en lav grad av heterozygositet, påvisning av sjeldne varianter forblir svært krevende når det gjelder av statistisk styrke [7], [8], [11] -. [14]

Prostatakreft (PCA) og tykktarmskreft (CRC) er de vanligste typer kreft i den polske befolkningen, og ledende årsak til kreft-relaterte sykelighet og dødelighet [15]. De fleste CRC er sporadisk, og bare en liten del forekommer i løpet av sterkt penetrerende arvelige syndromer, slik som Lynch syndrom, familiær adenomatøs polypose og andre polypose syndromer formidlet av sjeldne kimlinje-mutasjoner i DNA misparringssystemet og i adenomatøs polyposis coli (

APC

) genet [16]. PCa predisposisjon mediert gjennom sjelden mutasjoner i noen kandidatgener, for eksempel

BRCA2

, også forklare mindre enn 10% av den relative familiær risiko [17]. Derfor er det mulig at en vesentlig del av arvelig kreftrisikoen kan forklares ved en kombinasjon av vanlige lav-penetrans varianter av små effekter. For eksempel, genetisk variasjon i 14 og 21 uavhengig mottakelighet loci, validert i urelaterte populasjoner, kan forklare ca. 8% og 13,5% av arvelig risiko for utvikling av CRC og PCa, henholdsvis [16], [18]. Resultatene viser imidlertid at de fleste arvet variasjon forbundet med risiko for å utvikle enten krefttypen gjenstår å fastslå.

En omfattende analyse av variantene overdragelse genetisk mottakelighet for CRC og PCa basert på GWAS har ikke blitt utført i den polske befolkningen ennå. En viktig årsak til denne mangel på studier er den høye kostnaden av SNP mikromatriser, særlig med tanke på at ny loci identifisert ved GWAS har vært forbundet med progressivt mindre effektstørrelser, krever en økning i den statistiske kraft (nemlig prøvestørrelse) av GWAS. En alternativ tilnærming ved hjelp av sammenslåtte DNA-prøver er blitt utviklet [19]. Selv om ikke-standard bruk av SNP arrays gjør det nødvendig å ta ekstra forholdsregler i betraktning [19], [20], denne tilnærmingen vesentlig reduserer forskningskostnader. Det er viktig å vurdere, men at en høyere teknisk variasjon forbundet med DNA pooling tilnærming kan maskere de svakeste assosiasjoner. Dermed forskere har for handelen mellom nøyaktigheten av genetisk risiko prediksjon og kostnadene for sin forskning.

I denne studien beskriver vi en samlet DNA sample-basert GWAS som et kostnadseffektivt alternativ til å identifisere genetiske varianter av moderat effekt assosiert med CRC og PCa i den polske befolkningen. Samlede DNA-prøver ble behandlet ved hjelp av mikromatriseteknologi, og GWAS ble ansatt som en genetisk variasjon filtrering tilnærming. Den tekniske godkjenningen av GWAS resultater og replikering studier på enkelte DNA-prøver ble utført ved bruk av mye billigere PCR-basert genotyping teknologi.

Materialer og metoder

Etikk erklæringen

All inkluderte pasientene og kontrollpersoner var polske kaukasiere rekruttert fra to urbane befolkningen, Warszawa og Szczecin. Studien ble godkjent av den lokale etikkutvalg (Medical Center for etterutdanning og Cancer Center, Warszawa, Polen), og alle deltakerne gitt skriftlig informert samtykke. Studieprotokollen er i samsvar med de etiske retningslinjene i 1975 Helsinkideklarasjonen

Studerte fag

GWAS kohorter omfattet:. (1. AD /CRC sub-studie) 525 pasienter (270 kvinner og 255 menn) diagnostisert med tykktarms adenomer (AD), 630 pasienter (240 kvinner og 390 menn) diagnostisert med CRC og 705 friske personer (420 kvinner og 285 menn), og (2. PCa sub-studie) 285 mannlige pasienter diagnostisert med PCa og 285 friske menn

Større kohorter av saker og kontroller ble inkludert i en replikering studien, inkludert:. (1. AD /CRC sub-studie) 945 (509 kvinner og 436 menn) pasienter med AD, 889 (352 kvinner og 537 menn) pasienter med CRC og 2188 (1542 kvinner og 646 menn) friske individer, og (2. PCa sub-studie) 447 pasienter med PCa og 800 friske menn kontroller. Median alder ved diagnose for AD, CRC og PCa var 60 år (range: 36-85), 64 år (range: 29-89) og 67 år (range: 42-83 år), henholdsvis. Utvalgsstørrelser og aldersfordeling for hver gruppe er vist i tabell 1.

Allelotyping GWAS

Genomisk DNA ble ekstrahert fra fullblod behandlet med EDTA bruker QIAamp DNA Mini Kit (Qiagen , Tyskland), etter produsentens protokoll. Før pooling, ble DNA-prøven konsentrasjoner målt basert på deres fluorescerende intensitet ved hjelp Quant-iT ™ PicoGreen dsDNA Kit (Invitrogen, Storbritannia). For å bestemme DNA-kvalitet med presisjon, ble 260 nm /280 nm absorbans-forhold for hver prøve også målt ved anvendelse av et Nanodrop spektrofotometer 1000 (Thermo Fisher Scientific Inc., USA), og prøver ble kjørt på en 1% agarosegel for å bestemme DNA-integritet visuelt.

DNA-prøver som ble sendt kvalitetskontrolltester ble kombinert blande ekvimolare konsentrasjoner i henhold til pasientens diagnose for å få 15-DNA-prøve bassenger. Sammenslåtte DNA-prøver ble deretter brakt til en endelig konsentrasjon på 50 ng /mL i Tris-EDTA-buffer (pH = 8), med konsentrasjoner av Tris og EDTA som ikke overstiger 10 mM og 0,1 mM, respektivt. I AD /CRC sub-studie, totalt 35, 42 og 47 DNA-bassengene var forberedt på AD, CRC og kontroller, henholdsvis, mens i PCA sub-studie, totalt 19 og 19 DNA bassenger for både PCa og kontroller, respektivt. For å redusere påvirkningen av eksperimentell variasjon, ble DNA-bassenger delt inn i trippel tekniske rapporter og analysert uavhengig av hverandre, ved hjelp av separate microarrays, på Affymetrix Genome-Wide Menneskelig SNP Array 6.0. Microarray genotyping eksperimenter og utvinning av sonde satt signalintensitet ble utført ved hjelp av ATLAS Biolabs GmbH (Berlin, Tyskland).

Individuell genotyping

For teknisk validering av GWAS funn og for replikering studien, enkelte pasienter ble genotypet ved hjelp av TaqMan SNP genotyping Analyser (Life Technologies, USA), SensiMix ™ II Probe Kit (Bioline Ltd, Storbritannia), og en 7900HT real-Time PCR system (Life Technologies, USA).

Statistiske analyser – allelotyping GWAS

intensiteten av hvert SNP ble beregnet som den relative allelet signal (RAS) for hver microarray, slik at: RAS = A /(A + B), hvor A og B er sonden satt intensitetsverdiene av alleler A og B henholdsvis, i henhold til Affymetrix kodende [21], [22]. Intensiteten av A og B ble oppnådd fra Affymetrix Tamfuglfôr v2 algoritme. Mean RAS verdier ble neste beregnet for hver DNA bassenget for å redegjøre for de tre tekniske gjentas. Før gjennomføringen av foreningen testene, ble en prinsipal komponent analyse (PCA) for alle matriser utføres basert på RAS verdier. Pools identifisert som uteliggere ved å plotte de to første hovedkomponenter ble ekskludert fra videre analyser.

For å oppdage signifikante forskjeller i allelfrekvenser mellom PCa og kontrollgruppen en kombinasjon av to statistiske metoder ble brukt. For det første ble det mellom-gruppe forskjeller i RAS testet ved hjelp av Student t-tester for å ta hensyn til RAS variasjon mellom bassengene som representerer hver gruppe [23]. For det andre betyr RAS verdier av alle matriser i pasientgruppen og kontrollgruppen ble beregnet og signifikante forskjeller i frekvens allel, ble testet ved hjelp av en χ

2-test med en frihetsgrad [24]. Siden denne testen sammenligner gjennomsnitts allelfrekvenser mellom grupper uten å ta hensyn til høy teknisk kompleksitet allelotyping tilnærming, kan det føre til et høyere antall falske positive og falske negative resultater. Omvendt, kan de t-tester være for følsom til å påvise forskjeller mellom gruppene hvis teknisk variasjon mellom bassengene er lav. Dermed kan forskjeller i allelfrekvenser være for små til å bli validert av individuell genotyping. En kombinert statistisk tilnærming gir derfor en mer nøyaktig måte å teste for signifikante forskjeller i forhold til hver test alene.

Kandidat SNPs for individuell genotyping ble valgt ved å kombinere resultatene fra både t-test og χ

2-test, med klumper algoritmen i plink v1.06 programvare (https://pngu.mgh.harvard.edu/purcell/plink) [25]. De loci som det var en SNP (

p

0,001) og minst en korrelert proxy SNP (r

2 0,7) i en 100 kb region (

p

0,001, χ

2-test) ble vurdert som positive resultater. Proxy SNPs ble bestemt på grunnlag av LD data fra 4100 individuelt genotypet europear fag fra Vest-Pommern i SHIP årsklasse, med Affymetrix Menneskelig SNP Array 6.0 [26], [27]

Statistiske analyser -. Individuell genotyping

Teknisk validering av disse kandidat SNPs valgt av den sammenslåtte-DNA GWAS ble utført av individuell genotyping av de samme eksperimentelle kohorter. TaqMan genotyping data ble først utsatt for kvalitetskontroll prosedyrer, herunder terskler for maksimal individuell missingness for hver av SNPs 0,05, maksimal genotype missingness for hver av de enkeltpersoner og 0,05 og Hardy-Weinberg disequilibrium 0,001 for kontrollgruppen . GWAS kandidat foreninger ble validert ved hjelp av allel χ

2-test (plink v1.07 programvare). SNPs med

p

-verdier 0,01 var kvalifisert for videre analyser. Høye nivåer av samstemmighet i allelet frekvensforskjeller mellom sak og kontrollgrupper validert nøyaktigheten av GWAS screening prosessen, inkludert ekvimolar bassenget bygging og statistisk metode for valg av kandidat SNP foreninger.

Validert GWAS-avledet SNPs og litteratur valgt SNPs (tabell S1) ble videre analysert ved individuell genotyping i den utvidede AD, CRC og PCA kohorter (tabell 1). Den binomiske logistisk regresjonsmodell ble brukt, ved hjelp av R-programvare, for å undersøke assosiasjoner i forbindelse med additiv genet handling modell for alle fag inkludert i studien. En logistisk regresjonsanalyse ble også utført for PCA pasienter for å finne ut om noen av de analyserte SNPs ble assosiert med tidlig ( 65 år) PCa utbruddet. Benjamini-Hochberg korreksjon ble brukt for multiple sammenligninger.

heterogenitet blant studiepopulasjoner ble vurdert med

Jeg

2 og

p

-verdi av Cochran Q statistikken. For metaanalyser, sammenslåtte-eller verdier med 95% konfidensintervall (KI) ble beregnet ved hjelp av

meta

funksjon av Stata versjon 11. Deres betydning ble vurdert av Z test og

p

0,05 ble betraktet som signifikant.

Resultater

Felles-DNA allelotyping GWAS og individuell DNA validering av GWAS funnene

GWAS ble utført med samlet 15 DNA-prøver og Affymetrix Genome-Wide Menneskelig SNP Array 6.0. Følgende uteliggere, identifisert av PCA resultatene, ble ekskludert fra videre analyser: 1) en pool som representerer 15 kontroll mannlige pasientene i AD /CRC sub-studie og 2) 10 bassenger som representerer 150 PCA pasienter og en pool som representerer 15 kontroller, i PCA sub-studie. En grunn til at så mange av PCA pasient bassenger måtte bli avvist fra videre vurdering er ikke klart. Det kan bare bli spekulert i at noen pre-analytisk variasjon, for eksempel diskrete endringer i DNA kvalitet og /eller DNA microarray hybridisering kan påvirke de endelige resultatene av allelotyping eksperimenter.

Den sammenslåtte-DNA GWAS avslørte 44 kandidat SNPs assosiert med enten AD, CRC eller PCA hvorav to ble gjentatt i to urelaterte sammenligninger. Vurderer SNP befolknings frekvenser på 0,2-0,5, vår AD /CRC GWAS nådd en kraft som varierer fra 98,6% til 99,8% og fra 43% til 64% for å påvise effekt størrelsen OR = 2,0 og 1,5, henholdsvis ved α = 1E-03 , som anslås ifølge Dupont et al. [28] (figur S1).

Neste, GWAS valgte SNPs ble validert ved genotyping av individuelle DNA-prøver ved hjelp av TaqMan SNP genotyping analyser. Fem kandidat SNPs (rs2557030, rs2557227, rs2574608, rs2755895, rs7583683) ble ekskludert fra videre statistisk analyse på grunn av vesentlige avvik (

p

0,001) fra Hardy-Weinberg likevekt påvises i friske kontrollgruppen. Selv TaqMan genotyping-avledet MA frekvenser merkelig noe fra RAS verdier for MA oppnådd i microarray eksperiment, det var en avtale i retning av forskjeller (OR) i allelfrekvenser i saken og kontrollerer grupper som vist ved alleliske χ

2-test (med

p

0,01) for 30 av 39 kandidat SNPs: 24 assosiert med AD eller CRC (en SNP, rs6702619, ble identifisert i to separate sammenligninger) og seks SNPs assosiert med PCa (tabell 2).

Replication studie for GWAS-utvalgte SNPs

Tabell 1 viser demografiske detaljer om emner som deltok på replikering studien. Når en logistisk regresjon ble benyttet for å bestemme betydningen av sammenhengen mellom de 30 GWAS valgte SNPs, ved hjelp av case eller kontroll som avhengig variabel og hensiktsmessig kodet TAQMAN genotyper som uavhengige variabler, 17 SNPs var signifikant (

p

0,05) forbundet med AD eller CRC i additiv modell av arv (tabell 3). Sju av disse SNPs forble signifikant assosiert etter gjen testing justering. MA av tre varianter er assosiert med økt mottakelighet CRC, mens for fire varianter MA ble forbundet med en redusert risiko. Når allelfrekvenser mellom saker og kontrollpersoner ble vurdert med χ

2-test korrigert

p

-verdi, ble observert signifikante forskjeller for 13 SNPs (Tabell 3).

den statistiske bevis for heterogenitet mellom allelfrekvenser tvers validering og replikering studiegrupper ble vurdert av Q-test

p

-verdi. 30 GWAS valgte SNPs, 14 avslørte samlet lav heterogenitet (

p

0,1). Blant dem, signifikante sammenhenger i replikering studiekohorter tilsynelatende mer vanlig, uavhengig statistikken brukes til å bestemme betydningen av forening (tabell 3). Mangel på heterogenitet kan betraktes som et kriterium for troverdig replikering [29]

Seks av betydelig tilhørende SNPs ble plassert innenfor intronic genområder.

BTBD9 plakater (BTB /POZ domene som inneholder protein 9),

FAM108C1 plakater (abhydrolase domene som inneholder protein),

PRKCA plakater (protein kinase C α, PKCα),

ADAMTS19 plakater (en disintegrinproteinet og metalloproteinase med thrombospondin motiv, medlem 19),

BMP6 plakater (benmorfogenetisk protein 6) og

ARHGAP6 plakater (Rho GTPase aktiverende protein 6) (Tabell 3).

Replication litteraturstudie valgt SNP’er

Tretti fire og ni andre SNP’er, tidligere vist å være assosiert med CRC [16], [30] – [45] og PCa [46] – [62] risiko på ulike populasjoner (tabell S1), henholdsvis ble også valgt for replikering studier utført med de samme utvidede grupper av saker og kontroller (tabell 1). En SNP (rs6983267 på 8q24.21) var felles for begge kreftlokalisasjoner. En SNP (rs10411210) ble ekskludert fra videre analyser basert på resultatet av Hardy-Weinberg likevekt test (

p

0,001). Fire andre SNPs (rs36053993, rs2243250, rs2032582 og rs1057911) ble også ekskludert fra logistisk regresjon som de viste i det minste delvis LD med andre SNPs i samme region. De ble derfor tildelt med tagging SNPs, basert på en SNP laveste individuelle missingness forhold og minst signifikante Hardy-Weinberg testresultatet for kontrollgruppene.

Foreningen av 14 litteraturvalgt varianter med AD eller CRC og fire litteratur valgte varianter med PCa ble bekreftet (

p

0,05) i additiv modell av arv (tabell 4). Foreningen av de vanligste SNP rs6983267 ble bekreftet for både AD og PCA grupper av pasienter. Påfallende, ble SNP rs1800894 (

IL10

) forbundet i motsatt retning med AD og CRC mottakelighet (tabell 4). MA av de resterende 10 variantene var assosiert med økt risiko og seks varianter med en redusert risiko for PCA CRC og /eller AD. Av disse 17 varianter, fem (rs1800894, rs16892766, rs6983267, rs1859962 og rs4939827) forble signifikant etter korreksjon for multiple sammenligninger. Når allelfrekvenser mellom saker og kontrollpersoner ble vurdert med χ

2-test korrigert

p

-verdi, ble observert signifikante forskjeller i 11 sammenligninger for syv uavhengige SNPs (tabell 4).

for å validere den globale karakter av disse foreningene, mellom-datasett heterogenitet ble testet. I meta-analysen inkluderte vi tre SNPs assosiert med CRC og fire SNPs assosiert med PCa mottakelighet vår replikering studie som foreninger ble funnet med samme fenotype i minst fire andre studier. En tilfeldig effekt modellen ble brukt til å beregne de samlede-eller verdier. Som vist i tabell 5, ble mangel på påviselig heterogenitet (Q

p

-verdi på mindre enn 0,1) er angitt på tvers av datasettene representerer tre ut av syv SNP’er, og alle sammenslåtte-ORS var signifikante (

p

. 0,001)

for å sjekke om noen av de studerte varianter var assosiert med en tidlig alder av PCa utbruddet, vi utført en logistisk regresjonsanalyse med bare tilfeller med en binær indikator for alder (under eller over 65 år, kodet som 1 og 0, henholdsvis) ved PCa diagnose og de studerte SNPs som uavhengige variabler. Det var 171 pasienter diagnostisert ved fylte 65 år eller eldre og 247 pasienter eldre enn 65 år To SNPs var signifikant assosiert med alder PCa diagnose (tabell S2): rs1934636 og rs6983267. Den tidligere, en GWAS valgt SNP, var hyppigere i gruppen av eldre pasienter (OR = 0,6, 95% KI 0,39 til 0,93,

p

= 2.18E-02), tatt i betraktning den dominerende genet handling-modellen . Motsatt ble rs6983267 variant forbundet med en yngre pasientens alder i alders stratifisert analyse; OR = 1,40, 95% KI 1,01 til 1,95,

p

= 4.44E-02).

Diskusjoner

Felles DNA-basert GWAS verktøy

det er generelt akseptert at veldesignet GWAS bør gjennomføres med grupper på minst 1000 pasienter og 1000 kontroller, selv om passende nivåer av statistisk styrke til å teste for genetiske foreninger (i

p

5E-08) ofte knyttet til høyere effektstørrelser [14]. Disse GWAS betydning terskler skyldes kravet om å korrigere for multiple sammenligninger og er rettet mot å minimere antall falske positive funn [8]. Imidlertid over restriktive statistiske kriterier kan i sin tur produsere falske negative resultater [11] – [13]. Faktisk, de signifikante sammenhenger fra uavhengige replikasjonsstudier er ikke rangert på topp 1000 SNPs i den innledende GWAS [46]. Dermed kan bruk av strenge kriterier forhindre påvisning av subtile foreninger og står for manglende arvbarhet [14]. Det er også erkjent at det er viss grad av heterogenitet i GWAS resultatene, noe som kan oppstå på grunn av den forskjellige genetisk bakgrunn (befolkning lagdeling) av geografisk distinkte populasjoner [41], [63], [64], eller på grunn av skjevhet introdusert av befolkningen tilsetningsstoffer effekter [65], [66]. Selv om få CRC mottakelighet loci (som 8q24.21, 8q23.3 eller 18q21.1) har blitt kopiert i en rekke studier [41], er det symptomatisk at noen av de identifiserte assosiasjoner reflektere mellom-populasjoner forskjeller i tumor sub-site , alder på CRC /AD utbruddet, kjønn eller røykestatus i løpet av de gruppene som er undersøkt [41]. Dermed kan store kohortstudier ignorere noen sub-populasjonsspesifikke risiko varianter, så genome-wide genotyping bør også gjennomføres i mindre kohorter. Omvendt, studier med lavere utvalgsstørrelsene vanligvis avsløre en mindre del av arvbarheten av en kompleks sykdom ved å unnlate å oppdage foreninger som ikke når statistisk signifikans [7].

Siden de endelige GWAS resultatene avhenge av mange faktorer, hver er knyttet til et annet stadium av den eksperimentelle fremgangsmåte, deres analyse og tolkning er ofte utfordrende. Det er viktig å innse at GWAS resultatene gjenspeiler, i beste fall, forskjellene i det genetiske materialet i saker og kontroller som brukes for analyse. Selv om dette kan virke innlysende, understreker det en av de mest fundamentale forholdene som kreves for en vellykket GWAS. Derfor må presise diagnostiske kriterier benyttes for å oppnå homogene grupper, som et ikke-tilfeldig fordeling av personer med egenskaper som styres av sterke genetiske determinanter, som single-genmutasjoner, vil sterkt skjevhet den endelige GWAS utfallet.

Selv om vår sammenslåtte DNA-basert GWAS representerer studier med liten utvalgsstørrelse, identifisert de 30 SNPs betydelig overrepresentert i de undersøkte gruppene (tabell 2), som ble ytterligere validert av TaqMan genotyping av de enkelte DNA-prøver. Replikering studiene valgte 17 kandidat risiko varianter assosiert med CRC, vurderer additiv modell av arv (tabell 3). Disse forbindelser har ikke tidligere blitt rapportert. Syv av dem forble signifikant etter korreksjon for multippel hypotesetesting.

Selv om ikke alle GWAS valgt følsomhets SNPs vil ha en direkte funksjonell tilknytning til en kreft fenotype, en grundig analyse av GWAS Resultatene viste at disse SNPs ligger i intronic regioner eller i LD blokker med nærliggende gener har et potensial til å påvirke kreftutvikling (tabell 3). Bemerkelsesverdig, flere kandidat resistensgener (

PRKCA

,

BMP6

,

ADAMTS19

,

ARHGAP6

,

FUT9 /8

,

FAM108C1

,

CHL1

,

BTBD9 Hotell og

WDR52

) er involvert i aktin cytoskjelettet arrangement, celle adhesjon og cellemotilitet prosesser som er viktige for kreft invasjon og metastasering.

rs3803820 ligger i

PRKCA

genet (17q24.2) ble valgt i CRC sub-studie, som viser OR = 1,27 (

p

= 2.24E-02). Andre kandidat SNP rs13192135, som viste en sterk effekt størrelse på OR = 0,47 (

p

= 1.07E-02) i CRC mannlige gruppen, ligger 6p24.3 i intronic regionen i

BMP6

genet. Tilsvarende sterk sammenheng med både AD og CRC risiko, av den kjente rs4939827 variant av

SMAD7

genet ble indikert i denne studien (tabell 4). Dette er i samsvar med flere tidligere studier som viser sammenslutning av genetisk variasjon i BMP /Smad pathway relaterte gener med CRC risiko [32], [33], [67].

rs9848984 SNP på 3p26.3 , nedstrøms til nær homolog av L1 (

CHL1

) genet, er lokalisert i den LD blokk som omfatter 3′-enden av genet. CHL1 er involvert i kreft vekst og metastasering av ulike menneskelige kreft, inkludert tykktarm og brystkreft [68]. Den observasjon at både mRNA og proteinnivåene av ARHGAP6 ble forhøyet i CRC-vev og cellelinjer som tyder på at det kan tjene som en biomarkør for utvikling og progresjon av CRC [69]. Tilsvarende er en høy grad av metallprotease

ADAMTS19

ekspresjon ble observert i flere tumorvev og cellelinjer [70]. I sin tur, ble FAM108C1 aktivitet vist seg å forutsi utviklingen av fjernmetastaser [71].

rs2799652 SNP ble funnet i promoter regionen av alfa- (1,3) -fucosyltransferase (

FUT9

) genet, som er ansvarlig for biosyntesen av Lewis X-antigen, uttrykte et cancer-assosiert antigen fortrinnsvis i premaligne kolon polypper [72]. FUT8 i sin tur er ansvarlig for modulering av E-cadherin funksjon [73]. Tidligere studier har vist at

FUT8 Hotell og E-cadherin uttrykk nivåer var signifikant høyere i primær CRC prøver og at E-cadherin kjerne fucosylation forbedret celle-celle adhesjon i colon carcinoma [74]. Begge

FUT9 Hotell og nedstrøms til

FUT8

genvariasjoner ble vist å være assosiert med CRC risiko i denne studien (tabell 3). Interessant, vår replikering studien viste også sammenheng mellom intronic sekvensvariasjon (rs9929218) i E-cadherin genet (

CDH1

) og AD risiko, spesielt hos menn (tabell 4).

kopiert tidligere rapportert sammenhenger mellom fire PCa og 14 AD /CRC risiko varianter i våre polske baserte kohorter. Fire SNPs (rs1859962, rs7931342, rs1447295 og rs6983267) ble viden rapportert som PCA risiko varianter i Caucasian, afrikansk eller asiatisk bestander [46], [48] – [51], [55] – [58], og kan betraktes som globalt markører for PCa mottakelighet. I tilfelle av CRC, ble 11 resistens loci rapportert ofte i tidligere studier [41]. Syv av disse loci ble gjenskapt i denne studien: 8q23.3, 8q24.21, 11q23.1, 15q13.3, 16q22.1, 18q21.1, 20p12.3. I et svenskbasert kohortstudie, fem av de samme 11 loci viste en signifikant OR [42]. Mangelen på bekreftelse av loci 11q23.1, 16q22.1 og 20p12.3 i den svenske studien kan ha resultert fra deres tilknytning til kreftrisiko hovedsakelig hos menn, i motsetning til i kvinnen, og /eller fordi de er knyttet til AD snarere enn CRC risiko, som indikert av våre funn (tabell 4).

Interessant, stratifiserte analyser viste at rs4939827 (18q21.1) variant forening ble begrenset til kvinner bare (OR = 0,6, 95% KI 0,42 til 0,88

Legg att eit svar