PLoS ONE: Genome-Wide Søk etter Gene-Gene Interaksjon i Colorectal Cancer

Abstract

Genome-wide assosiasjonsstudier (GWAS) har nå identifisert en rekke enkelt-nukleotid polymorfismer (SNPs) forbundet med tykktarmskreft (CRC) risiko. Men disse følsomhets loci som er kjent i dag forklare bare en liten brøkdel av den genetiske risiko. Gene-genet interaksjon (GxG) regnes for å være en kilde til den manglende arvbarhet. For å løse dette, utførte vi et genom-wide søk etter parvis GxG forbundet med CRC risiko ved bruk av 8,380 tilfeller og 10,558 kontroller i discovery fasen og 2.527 tilfeller og 2,658 kontroller i replikering fasen. Vi utviklet en enkel, men effektiv metode for testing samhandling, som vi kaller den gjennomsnittlige risiko på grunn av interaksjon (ARDI). Med denne metoden, gjennomførte vi et genom-wide søk for å identifisere SNPs som viser tegn til GxG med tidligere identifisert CRC mottakelighet loci fra 14 selvstendige regioner. Vi har også gjennomført et genom-wide søk etter GxG med marginal tilknytning screening og undersøke samspillet mellom SNPs som passerer screening terskelen (p 10

-4). For den kjente locus rs10795668 (10p14), fant vi en samhandlende SNP rs367615 (5q21) med replikering p = 0,01 og kombinert p = 4,19 × 10

-8. Blant de beste marginale SNPs etter LD beskjæring (n = 163), identifiserte vi et samspill mellom rs1571218 (20p12.3) og rs10879357 (12q21.1) (nominell kombinert p = 2,51 × 10

-6, Bonferroni justert p = 0,03). Vår studie er den første omfattende søk etter GxG i CRC, og våre resultater kan gi ny innsikt i genetiske etiologien av CRC

Citation. Jiao S, Hsu L, Berndt S, Bézieau S, Brenner H, Buchanan D, et al. (2012) Genome-Wide Søk etter Gene-Gene Interaksjon i tykktarmskreft. PLoS ONE 7 (12): e52535. doi: 10,1371 /journal.pone.0052535

Redaktør: Zhaoxia Yu, University of California, Irvine, USA

mottatt: 25 september 2012; Godkjent: 15 november 2012; Publisert: 26.12.2012

Copyright: © 2012 Jiao et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. STJERNE var finansiert av en Hospital Clinical Research Program (PHRC) og støttes av Regionrådet for Pays de la Loire, den Groupe des Entreprises Françaises dans la Lutte contre le Cancer (GEFLUC), Foreningen Anne de Bretagne Génétique og Ligue regionale contre le Cancer (LRCC). ARCTIC er delvis støttet av National Cancer Institute, National Institutes of Health gjennom støtten som er tildelt Ontario registeret for studier av familiær tykktarmskreft (U01 CA074783); se CCFR nedenfor. ARCTIC er også støttet av en GL2 bevilgning fra Ontario Research Fund, den kanadiske Institutes of Health Research, og Kreft risikovurdering (omsorg) Program stipend fra det kanadiske Cancer Society Research Institute. TJH og BWZ er mottakere av Senior Investigator Awards fra Ontario Institute for Cancer Research, gjennom sjenerøs støtte fra Ontario departementet for økonomisk utvikling og innovasjon. COLO2 3 er støttet av National Cancer Institute (R01 CA60987). CCFR er støttet av National Cancer Institute, National Institutes of Health i henhold til RFA # CA-95-011 og gjennom samarbeidsavtaler med medlemmer av tykktarmskreft Family Registeret og P.I.s. Dette genome wide skanningen ble støttet av National Cancer Institute, National Institutes of Health av U01 CA122839. Innholdet i dette manuskriptet ikke nødvendigvis gjenspeiler synspunktene eller retningslinjer fra National Cancer Institute eller noen av de samarbeidende sentre i CFR, heller ikke omtale av handelsnavn, kommersielle produkter, eller organisasjoner innebærer godkjennelse av den amerikanske regjeringen eller CFR. Følgende Colon CFR sentre bidratt data til dette manuskriptet, og ble støttet av følgende kilder: Australasian tykktarmskreft Familie Registeret (U01 CA097735), Seattle tykktarmskreft Familie Registeret (U01 CA074794) og Ontario Registeret for studier av familiær tykktarmskreft (U01 CA074783) . Dachs ble støttet med tilskudd fra det tyske Research Council (Deutsche Forschungsgemeinschaft, BR 1704 /6-1, BR 1704 /6-3, BR 1704 /6-4 og CH 117 /1-1), og den tyske utdanningsdepartementet og forskning (01KH0404 og 01ER0814). Dals ble støttet av National Cancer Institute, National Institutes of Health, USA Department of Health and Human Services (R01 CA48998 til MLS). Gecco er støttet av National Cancer Institute, National Institutes of Health, USA Department of Health and Human Services (U01 CA137088). Finansieringen av genom-wide skanning av Dals ble PLCO, og WHI levert av National Cancer Institute, National Institutes of Health, USA Department of Health and Human Services (R01 CA059045). HPFS, NHS, PHS: The National Institutes of Health støttet HPFS (P01 CA 055 075, R01 137178, P50 CA 127 003), NHS (R01 137178, P50 CA 127 003, P01 CA 087 969), og PHS (CA42182). MEC er støttet av R37 CA54281, P01 CA033619, og R01 CA63464. PLCO ble støttet av egenutført Research Program av divisjon for Cancer Epidemiology og genetikk og støttet av kontrakter fra Divisjon for Cancer Prevention, National Cancer Institute, NIH, DHHS. Kontrollprøver ble genotypet som en del av kreft genetiske markører for skanning Følsomhet (CGEMS) prostatakreft, som støttes av egenutført Research Program av National Cancer Institute. Datasettene som brukes i denne analysen ble åpnet med riktig godkjenning gjennom dbGaP online ressurs (https://www.cgems.cancer.gov/data_acess.html) gjennom dbGaP sjonsnummer 000207v.1p1.c1. (National Cancer Institute (2009) Kreft genetiske markører av følsomhet (CGEMS) data hjemmeside, https://cgems.cancer.gov/data_access.html; Yeager et al 2007).. Kontrollprøver ble også genotypet som en del av GWAS av lungekreft og røyking (Landi et al. 2009). Midler til dette arbeidet ble gitt gjennom National Institutes of Health, gener, miljø og helse Initiative [NIH GEI] (Z01 CP 010 200). De mennesker som deltar i GWAS er utledet fra prostata, lunge, kolon og Ovarian Screening Trial og studiet er støttet av egenutført ressurser fra National Cancer Institute. Bistand med genotype renhold, samt med generell studiekompetanse koordinering, ble gitt av Gene Miljø Association Studies, Genève Coordinating Senter (U01 HG004446). Bistand med data rengjøring ble gitt av National Center for Biotechnology Information. Finansiering støtte for genotyping, som ble utført ved Johns Hopkins University Center for arvelig sykdom Research, ble gitt av NIH GEI (U01 HG 004438). Datasettene som brukes for analysene er beskrevet i dette manuskriptet ble hentet fra dbGaP på https://www.ncbi.nlm.nih.gov/gap gjennom dbGaP sjonsnummer phs000093. PMH ble støttet av National Institutes of Health (R01 CA076366 til PAN). VITAL ble støttet delvis av National Institutes of Health (K05 CA154337) fra National Cancer Institute og Office of Kosttilskudd. WHI: WHI Programmet er finansiert av National Heart, Lung, and Blood Institute, National Institutes of Health, US Department of Health and Human Services gjennom kontrakter N01WH22110, 24152, 32100-2, 32105-6, 32108-9, 32111- 13, 32115, 32118-32119, 32122, 42107-26, 42129-32, 44 221, og 268200764316C. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Genome-wide assosiasjonsstudier (GWAS) har blitt identifisert single-nukleotid polymorfismer (SNPs) forbundet med tykk- og endetarmskreft (CRC) [1] – [10]. Som biologiske kandidater, har disse funnene økt vår forståelse av den genetiske etiologi av CRC. Men den følsomhet loci funnet hittil forklare bare en liten brøkdel av den genetiske risiko: den «manglende arvelig» problem [7]. Blant andre forklaringer, er mangelen på en omfattende undersøkelse av gen-genet interaksjon (GxG) ofte betraktet som en mulig kilde for den uforklarte arvelig [11] – [14]. En nyere artikkel antyder også at det mangler arvbarhet problemet kan skyldes overvurdering av additiv arvbarheten hvis forutsetningen om at det ikke er noen GxG eller GXE samspill er feil [15]. Standarden GWAS test for foreningen er å bruke en enkelt-locus tilnærming, testing av en SNP i en tid på tvers av hele genomet; imidlertid den underliggende genetiske mekanismen av en kompleks sykdom, som CRC, innebærer sannsynligvis samspill mellom flere loci. Testing hvert locus individuelt uten å vurdere andre loci som det kan interagere kan gå glipp sanne genetiske effekter. Sammenlignet med single-locus tilnærming, har det vært svært få genom-wide undersøkelser av GxG, sannsynligvis minst delvis på grunn av den begrensede tilgjengeligheten av individuelle nivå storskala GWAS data og analytiske problemer og begrensninger i beregningen gitt massive antall mulige interaksjoner. Et genom-wide studie av psoriasis har rapportert overbevisende bevis for en interaksjon mellom variantene på

HLA-C Hotell og

ERAP1

loci [16]. En annen studie identifisert en GxG mellom en tidligere identifisert locus

C1orf106 og Selge en ny locus

TEC

for Crohns sykdom, med samspillet med hell kopiert i et uavhengig datasett [17]. Så langt har ingen GxG blitt identifisert for CRC.

I denne artikkelen fokuserer vi på testing parvis GxG for CRC bruker GWAS data i genetikk og Epidemiology of Colorectal Cancer Consortium (Gecco) og tykktarmskreft familie Registry (CCFR) med en total utvalgsstørrelse på 10,907 tilfeller og 13,216 kontroller. Vi presenterer en enkel, men effektiv metode for testing interaksjon: den gjennomsnittlige risiko på grunn av interaksjon (ARDI). Vi utførte et genom-wide søk for å identifisere SNPs samspill med tidligere identifisert CRC mottakelighet loci i 14 selvstendige regioner (rs6687758 /1q41, rs10936599 /3q16.2, rs16892766 /8q23.3, rs6983267 /8q24, rs10795668 /10p14, rs3802842 /11q23, rs7136702 /12q13.13, rs4444235 /14q22.2, rs4779584 /15q13, rs9929218 /16q22.1, rs4939827 /18q21, rs10411210 /19q13, rs961253 /20p12.3, rs4925386 /20q13.33) [1] – [10]. Vi har prioritert disse kjent mottakelighet loci fordi de har blitt bekreftet å være assosiert med CRC risiko i tidligere studier. Vi har også gjennomført et genom-wide søk etter parvis GxG. For å lindre beregningskapasitet og redusere antall multiple sammenligninger, brukte vi marginal tilknytning screening og undersøkt bare parvise samspill mellom den SNPs forbifarten at skjermen.

Resultater

GxG for 14 kjente CRC Følsomhet Loci

Etter bruk QC og utvalgskriteriene, var det totalt 2,011,668 SNPs i vanlig blant studier i fase i-studier (Materialer og metoder, tabell 1).

Vi valgte interaksjoner som har fast-effekt meta-analyse p-verdier og lt; 10

-6 i fase i for replikering i fase II. Disse interaksjonene er oppsummert i tabell 2. For SNPs som er i LD (r

2 0,8), rapporterte vi bare den mest betydningsfulle samspill SNP. Samlet vi identifisert 12 interaksjoner med p 10

-6 i fase 1, inkludert tre i samspill SNPs valgt for hvert av de kjente loci rs6687758, rs4925386; to samvirkende SNPs valgt for kjente locus rs7136702, og en samvirkende SNP for hver av kjente locus rs4779584, rs10795668, rs9929218 og rs961253 hhv.

I løpet av fase II, samspillet mellom kjente loci rs10795668 og rs367615 viste bevis for replikering (OR = 0,76, 95% KI 0,61 til 0,95; p = 0,01) med en kombinert fase i og II OR på 0,74 (95% KI 0,67 til 0,83; p = 4,19 × 10-8). rs367615 ligger på 5q21, og har en MAF på 0,22 i CEU befolkning. Ytterligere inkludering av to avanserte kolorektal adenom studier i replikering studien ytterligere styrket statistisk signifikans nivået på replikering (OR = 0,78 og 8,97 × 10

3); OR og p-verdi for fase I, II og avanserte adenom studier kombinert er 0,75 og 2,88 × 10

-8. rs10795668 ble genotypet i 10 studier og tilregnet i 11 studier med gjennomsnittlig godtgjørelses R

2 på 0,97 (område 0,92 til 1,00); rs367615 ble genotypet i 4 studier og tilregnet i 17 studier med gjennomsnittlig R

2 på 0,98 (område 0,91 til 1,00). Skogen plott som viser individuelle studieresultatene er vist i figur 1. Vi observerte ikke bevis for heterogenitet, og tilfeldige effekter resultatene i andre faste effekter resultater for dette samspillet. Figur 2 viser den regionale tilknytningen tomten. Flere LD partnere av rs367615 viser også tegn til interaksjon med rs10795668.

Skap størrelser er proporsjonal med den inverse varians for hver undersøkelse og linjene viser de konfidensintervall. Diamantene representerer de fikserte effekter meta-analyseresultater, med bredden av diamant som representerer konfidensintervall. Resultatene av to avanserte adenom studier (HPFS Adv Adnm og NHS Adv Adnm) vises nederst, men ikke innarbeidet i meta-analysen.

Den venstre y-aksen viser -log10 av meta-analyse interaksjon p-verdi. Den høyre y-aksen viser rekombinasjon hastighet. Hvert punkt på tomten representerer resultatet for en SNP. Diamanten prikk representerer SNP rs367615 og de runde prikkene representerer andre SNPs. Forskjellen farger av SNPs indikerer forskjellig LD styrken mellom tilsvarende SNP og rs367615, målt ved r

2. Den nederste del av figuren viser genene i den plottede regionen.

Vi undersøkte også den to-locus interaksjon mønster for SNP par som er beskrevet ovenfor ved hjelp av et ubegrenset modell. Tabell 3 (a) oppsummerer OR og utvalgsstørrelse for hver genotype kombinasjon i forhold til referanse genotyper for fase I og II-studier kombinert. Tabell 3 (b) og tabell 3 (c) sammenfatte den eller for hver SNP stratifisert ved genotyper av den andre. I tabell 3 ser vi at personer som bærer AG genotype for rs10795668 og CT-genotyper for rs367615 ha en statistisk signifikant økt sykdomsrisiko sammenlignet med de som bærer referanse genotyper på begge loci (rs10795668: GG /rs367615: TT). Men for personer som bærer AG eller AA genotype for rs10795668, bære CT genotyper reduserer betydelig risikoen sykdommen. Samspillet ELLER kan også beregnes fra bordet. For eksempel, hvis det var ingen interaksjon effekt, prøver som bærer GG for rs10795668 og CT for rs367615 ville ha en økt risiko sammenlignet med referansegruppen (OR ville være 1,03 * 1,11 = 1,14). Men de faktisk har en statistisk signifikant redusert risiko (OR = 0,87; p = 2,99 × 10

-3) på grunn av samspillet (OR = 0,76). Samspillet OR er av rs10795668: AG /rs367615: CT, rs10795668: AG /rs367615: CC, rs10795668: AA /rs367615: CT og rs10795668: AA /rs367615: CC i tabell 3 (a) kan lett bli beregnet til 0,76, 1,01 , 0,60 og 0,89, respektivt. Dette ser ut som en uvanlig interaksjon mønster. Det er imidlertid verdt å merke seg at størrelsen på utvalget er relativt liten når genotype av rs367615 er CC og som et resultat, vil hele eller estimater i den tredje kolonnen har store p-verdier og brede konfidensintervall. Å ta hensyn til den lille utvalgsstørrelse, og for å hjelpe tolkning, vi re-konstruert interaksjonstabellen ved å kombinere CT og CC genotype av rs367615 og AG og AA genotyper av rs10795668. Tabell 3 (d) viser at CT /CC genotyper av rs367615 har en økt risiko når genotype av rs10795668 er GG. På den annen side, er kombinasjonen av AG /AA genotype av rs10795668 og CT /CC genotype av rs367615 har en beskyttende effekt.

Som vi ha plass ARDI og ubegrenset modell for den øverste samspillet mellom rs10795668 og rs367615, ville det være interessant å se også resultatene fra multiplikativ modell. Multiplikativ interaksjon eller er beregnet til 0,83 med kombinert p = 3,14 × 10

-6, som er mindre viktig i forhold til ARDI modell.

GxG blant Topp Marginale SNPs

Basert på meta-analysen resultatene av den marginale foreningen analyse for alle unntatt to avanserte adenom studier, valgte vi 606 SNPs for å teste GxG med MAF 0,05, gjennomsnittlig R

2 0,3, og både faste og tilfeldige effekt meta-analyse p 0,0001. Både faste og tilfeldige effekter p-verdier ble brukt fordi vi ønsket å unngå å velge SNPs med signal dominert av noen få studier. Med dette utvalgskriterium, alle valgt SNPs hadde heterogenitet p-verdi 0,1. Etter å ha søkt en LD-beskjæring rutine (Materialer og metoder), forble 163 SNPs

I fase I, observerte vi fem par SNPs med fast effekt meta-analyse interaksjon p-verdi. 5 × 10

-5 (tabell 4). Disse fem vekselvirkninger peker på 3 uavhengige resultater, som angitt ved korrelasjon av de to første SNP (rs2170568 og rs7006896, R «> 2 = 0,78), og de neste to SNP (rs2200579 og rs10879357, R’> 2 = 0,75). I replikering, den GxG mellom rs1571218 /20p12.3 og de to korrelerte SNPs rs2200579 og rs10879357 som er på 12q21.1 er signifikante på nivå 0,1 (p-verdier er 0,04 og 0,06, henholdsvis), med interaksjons ORS i samme retning . Den kombinerte fase I og II analyse OR og p-verdier er 0,81 og 4,61 × 10

-6 og 0,80 og 2,51 × 10

-6, henholdsvis. Samspillet mellom rs1571218 og rs10879357 bestått Bonferronikorreksjon med terskel 3,79 × 10

-6 = 0,05 /(163 * 162/2). Etter inkludert to avanserte kolorektal adenom studier, replikering ELLER og p-verdien er 0,89 og 0,17 for rs1571218 og rs10879357; den kombinerte analysen OR og p-verdien er 0,82 og 1,15 × 10

-5. rs1571218 ble vel regnet i alle studier med gjennomsnittlig godtgjørelses R

2 på 0,95 (område 0,91 til 0,98); rs10879357 ble genotypet i 11 studier og tilregnet i 10 studier med gjennomsnittlig R

2 på 0,78 (område 0,76 til 0,80). Skogen Plottet viser konsistente resultater på tvers av de enkelte studiene (figur 3). Igjen, vi ikke observere heterogenitet og tilfeldige effekter resultatene i andre faste effekter resultater.

Skap størrelser er proporsjonal med den inverse varians for hver undersøkelse og linjene viser de konfidensintervall. Diamantene representerer de fikserte effekter meta-analyseresultater, med bredden av diamant som representerer konfidensintervall. Resultatene av to avanserte adenom studier (HPFS Adv Adnm og NHS Adv Adnm) vises nederst, men ikke innarbeidet i meta-analysen.

De to-locus interaksjon mønster for rs1571218 og rs10879357 er oppsummert i tabell 5 (a). OR for hver SNP stratifisert ved genotyper av den andre er sammenfattet i tabell 5 (b) og tabell 5 (c). I tabell 5 ser vi at alle ikke-referansekombinasjoner er forbundet med en økt risiko sykdom sammenlignet med referansegruppen. Men på grunn av interaksjoner med invers foreninger, risikoen er ikke så stor som de ville ha vært uten interaksjon. For eksempel, hvis det var ingen interaksjon effekt, personer som utfører AG for rs10879357 og GT for rs1571218 ville ha en høyere risiko i forhold til referansegruppen (OR = 1,12 × 1,18 = 1,32). Imidlertid er risikoen lavere (OR = 1,08) på grunn av interaksjon (OR = 0,82). Beregnet som ovenfor, samspillet OR er av rs1571218: GT /rs10879357: AG, rs1571218: GT /rs10879357: AA, rs1571218: TT /rs10879357: AG og rs1571218: TT /rs10879357: AA i tabell 5 (a) er 0,82, 0,84, 0,83 og 0,89, henholdsvis, som synes å følge en dominant genetisk modell. Tabell 5 (b) viser den skadelige tilknytning allel A i rs10879357 ser ut til å bli oppveid av allelet T av rs1571218. Et lignende mønster kan også observeres for rs1571218 i tabell 5 (c). Dette indikerer at det kan være en eksklusiv samspill mellom rs10879357 og rs1571218.

Vi beregnet også multiplikativ samspillet OR (= 0,94) og kombinert p (= 0,08) mellom rs1571218 og rs10879357.

diskusjon

i denne store studien, utførte vi et genom-wide søk etter parvise GxG for hver av de kjente CRC mottakelighet loci og blant topp SNPs med små p-verdier for marginale effekter. Så vidt vi vet, representerer dette den første omfattende GxG skanne for tykktarmskreft. Den mest betydningsfulle samspillet funnet i vår undersøkelse av kjente loci og andre SNPs genom-wide var mellom den kjente locus rs10795668 (10p14) og rs367615 (5q21) med replikering p = 0,01 og kombinert p = 4,19 × 10

-8. De effektstørrelser er svært like i fase I og fase II-studier, og det er ingen tegn på heterogenitet (P

het = 0,39). Blant de beste marginale SNPs, den mest lovende samspillet var mellom rs1571218 (20p12.3) og rs10879357 (12q21.1) (nominell p = 2,51 × 10

-6, justert p = 0,03). Igjen, effektstørrelser er svært like i fase I og fase II-studier, og det er lite bevis for heterogenitet (P

het = 0,74).

Den kjente locus rs10795668 i vår identifisert samhandling ligger i et intergeniske region innenfor 10p14. Så langt, funksjonen til denne SNP er ikke klart definert, og det har ikke blitt relatert til spesifikke gen (er). De nærmeste spådd gener i denne regionen er

BC031880 Hotell og

HV455515 Hotell og

DD431424

, de to sistnevnte er nylig identifisert regulatoriske gener for

hTERT

, en genetisk region som inneholder mottakelighet loci av flere ulike krefttyper, inkludert tykktarmskreft [9], [18] – [27]. Andre gener i nærheten er

TAF3 Hotell og

GATA3 plakater (~0.6 M bp).

tilhører GATA3

til GATA familien av transkripsjonsfaktorer som er viktige for T-celle utvikling.

TAF3

er en

TBP

-associated faktor (TAF); disse bidra til arrangøren anerkjennelse og selektivitet og fungere som antiapoptotic faktorer [28]. rs10795668 har også blitt funnet å være korrelert med ekspresjonen av

ATP5C1 product: [29], som er involvert i cellemetabolismen. rs367615 ligger i en intergeniske region i 5q21, hvor det er ett medlem av Wnt signalveien (

APC

) kjent for å være viktig i både familiær og ikke-familiær kolorektal kreft samt

MCC

, kanskje også viktig i CRC [30], [31]. Nærmeste gener til rs367615 er

PJA2

,

MAN2A1 Hotell og

FER

.

PJA2

er ansvarlig for ubiquitinering av cAMP-avhengig protein kinase type I og type II-alpha /beta regulatoriske subenheter og for målretting dem for proteasomal degradering [32].

PJA2

er blitt funnet å binde de ubiquitin-konjugerende enzym

UbcH5B product: [33], som fungerer i ubiquitinering av tumor-suppressor protein p53.

FER

regulerer celle-celle adhesjon og medierer signalering fra celleoverflaten til cytoskjelettet via vekstfaktorreseptorer.

MAN2A1

er et Golgi enzym viktig i N-glykan behandling [34]. Ved ytterligere bioinformatiske analyse, identifiserte vi to mulige funksjonelle kandidater, rs2201016 og rs2201015, som er i sterk LD med rs367615 (r

henholdsvis 2 verdier på en og 0,916). Som vist i UCSC Genome Browser view (Figur S2, Tabell S2), rs2201016 og rs2201015 faller innenfor en region i sterk DNAse overfølsomhet og evolusjonære bevaring. Som vist i tabell 3 (a), ser ut til interaksjonen til å bli drevet av CT gruppen av rs367615, som er et uvanlig fenomen og kan være relatert til heterozygot fordel. Imidlertid er det mindre allelet heterozygot (CC) genotype forholdsvis sjelden, slik at det er vanskelig å entydig estimere effektstørrelse i den genotypet. Selv om begge SNPs peke på potensielt relevante gener som er involvert i kreftutvikling, fremme grunnleggende forskning og oversette disse GWAS funnene i klinisk fordel vil kreve ytterligere funksjonell karakterisering gjennom

in vitro Hotell og

in vivo

analyse.

Vi har observert en statistisk signifikant interaksjon mellom rs1571218 /20p12.3 og rs10879357 /12q21.1 (og en marginalt signifikant interaksjon med en nær ved og korrelert SNP, rs2200579). SNP rs1571218 i samme region (20p12.3) og beskjedent korrelert (r

2 = 0,56) med de kjente CRC locus rs961253. Den nærmeste genet er benmorfogent protein 2 (

BNIP2

), som er en del av transformerende vekstfaktor-beta (TGF-β) pathway. TGF-β reaksjonsvei spiller en viktig rolle i celleproliferasjon, differensiering og apoptose [35] og er fastslått som viktige i CRC [36]. To samspill SNPs rs2200579 og rs10879357 står tett sammen ( 4 k bp hverandre) ved 12q21.1 og er korrelert (r

2 = 0,76). Disse SNP’er faller i intronic regionen

TPH2

, som er et hastighetsbegrensende enzym i syntesen av serotonin [37]. Serotonin er kjent for å være involvert i en rekke sentralnervesystem aktivitet. Det er også bevis for at serotonin er mitogent i forskjellige kreftcellelinjer [38] – [40]. En studie har vist at mangel på serotonin fører til en reduksjon av tumorvekst i en musemodell av tykktarmskreft allotransplantater [41]. Videre bioinformatiske analyse viste at rs10879357 er i LD (r2 = 0,697) med et synonymt koding SNP (rs4290270) i ​​exonic regionen mot tampen av TPH2. Videre

in vivo

eller

in vitro

analyse er nødvendig for å fastslå om denne varianten har en funksjonell effekt som mRNA stabilitet. Fordi rs2200579 og rs10879357 er i et gen rik region, er det også mulig at SNPs påvirke andre enn gener

TPH2

.

I denne utredningen ble det studier delt inn i fase I og II i henhold til tiden deres genotype data ble tilgjengelig. Fase II var forventet å tjene som validering /replikering av fase I. For den kjente loci GxG søk, fase II p-verdi mellom rs10795668 og rs367615 er 0,01, som er nominelt signifikant på 0,05 nivå, men ikke passerer Bonferroni terskel ( 0,05 /12). Blant de beste marginale SNPs, fase II p-verdi mellom rs1571218 og rs10879357 heller ikke passere Bonferroni terskel (0,05 /5) selv når den kombinerte p-verdien passerer Bonferroni terskel (3,79 × 10

-6 = 0,05 /(163 * 162/2)). Faktisk ble kombinert test anbefalt i to-trinns GWAS fordi replikasjonstesten har vist seg å være mindre effektiv i forhold til kombinert test [42]. Derfor er større utvalgsstørrelse nødvendig for å nå nok kraft til å gjenskape våre funn.

Adenomer er godt kjent forstadier av tykktarmskreft. Derfor undersøkte vi om de observerte interaksjoner for kolorektal kreft er også sett i avanserte kolorektale adenomer. Våre funn tyder på at samspillet mellom rs10795668 og rs367615 er til stede i avanserte adenomer, noe som tyder på at de genetiske variantene kan opptre tidlig i utviklingen av tykktarmskreft. I motsetning til dette ble interaksjonen mellom rs1571218 og rs10879357 ikke observert i avansert adenom, noe som kan tyde på at de genetiske varianter virker på et senere stadium av kreftutvikling. Men funnene må tolkes med varsomhet, som antall adenomer er relativt liten ( 1000 tilfeller).

I marginal tilknytning analyse, den mest brukte modellen er den log-additiv modell, der genotypen er kodet som 0, 1 eller 2 (basert på antall telle alleler). Det er derfor naturlig å bruke samme genetiske koding i en to-locus interaksjon modell for å teste for GxG. I interaksjonen modellen, er interaksjonen virkning modellert av produktet av de to genotyper av SNP. Som vi kan se i tabell 6 (a), dette samspillet modellen forutsetter at samspillet når begge SNPs har homozygot genotype (= 2) er fire ganger så stort som når begge SNPs har heterozygot genotype (= 1). Med andre ord, går ut i denne modellen i tabell 6 (b), som er en sterk antagelse. Faktisk kan vi se at samspillet mønsteret i tabell 3 (a) er ikke i tråd med denne forutsetningen. Noen enkle beregninger viser at = log (0,89), som faktisk representerer en mindre effekt størrelse i forhold til = log (0,76). Faktisk har vi funnet i simulering at brudd på denne forutsetningen kan føre til betydelig tap av kraft (figur S1). En forsiktig måte for å unngå å stille en så sterk antagelse er å bruke en fri-modell, som også er en utbredt metode [17], [43]. Ved hjelp av en ubegrenset modellen kan unngå brudd på forutsetningene, men kan føre til betydelig tap av kraft på grunn av den økte frihetsgrader (fra 1 til 4). Vår ADRI metoden bruker den samme genetiske koding som log-additiv modell for å tillate alleliske effekter for hovedeffekter, noe som også gjør interaksjonen test uavhengig av den marginale screening. For samspillet, anslår vår metode gjennomsnittlig samspillet effekten av,,, og. Fordi er en gjennomsnittlig effekt, er det mindre utsatt for heterogenitet blant studier. Som et resultat, er vår metode mer stabil og reproduserbar i forhold til ubegrenset og log-additiv modell. Det er verdt å påpeke at når den underliggende genetiske modellen er faktisk log-additiv, er ARDI mindre kraftig i forhold til den vanlige samhandlingsmodell med log-additiv genetisk koding. For fremtidige søknader, trenger en modell utvalg teknikk for å bli utviklet for å finne de mest aktuelle modellen med minst tap av makt. En annen verdt å merke seg er at den skiller mellom eneste modellen, som forutsetter uavhengighet mellom SNPs i kontroller, er kjent for å være kraftigere enn tilfellet kontroll kombinert modell mens testing for gen-gen interaksjon [44], [45]. I vårt tilfelle er ARDI en sak kontroll kombinert tilnærming slik at strømmen kan også bli styrket ved hjelp av sin sak bare motstykke. Vi ikke gjennomføre tilfellet med bare ARDI av to grunner: det er relativt vanskelig å fullstendig unngå brudd på uavhengighet antagelsen (og dermed opprettholde den type I Error Rate) i tilfellet med bare modell på grunn av kompleksiteten i LD strukturen av det humane genom, dvs. langtrekkende LD [46]; i tillegg er dagens tilgjengelige pakken [47] for å montere en sak kun modell med kovariater gjelder bare for genotypet SNPs mens våre data omfatter kalkulatoriske doser. Som en pågående arbeid, utvikler vi en pakke som kan passe case-bare modell for to kalkulatoriske SNPs mens du justerer for kovariater.

GxG er vanligvis definert som avvik fra hovedeffekter [13] . Derfor, hvis de underliggende hovedeffektene er ikke korrekt angitt, rest viktigste effektene kan inngå som en del av samspillet effekt i den statistiske modellen [48]. Som et resultat av testing av interaksjonen implisitt evaluerer det gjenværende hovedeffekten og interaksjonseffekt i fellesskap. https://cleo.whi.org/researchers/Documents%20%20Write%20a%20Paper/WHI%20Investigator%20Short%20List.pdf.

Legg att eit svar