PLoS ONE: Omfattende SNP skanne av DNA-reparasjon og DNA Damage responsgener Avslør Multiple Følsomhet Loci overdragelse Risiko for Tobacco Associated Leukoplaki og Oral Cancer

Abstract

Polymorphic varianter av DNA reparasjon og skader responsgener spille stor rolle i kreftutvikling. Disse variantene er mistenkt som predisposisjon faktorer til Oral plateepitelkreft (OSCC). For identifisering av mottakelige varianter som påvirker OSCC utvikling i indiske befolkningen, ble «maksimalt informativ» metode for SNP utvalg fra HapMap data til ikke-HapMap populasjoner brukt. Tre hundre tjuefem SNPs fra 11 viktige gener involvert i dobbel tråd pause reparasjon, mismatch reparasjon og DNA-skade respons trasé ble genotypet på totalt 373 OSCC, 253 leukoplaki og 535 ubeslektede kontrollpersoner. De betydelig forbundet SNPs ble validert i en ekstra kohort av 144 OSCC pasienter og 160 kontroller. Den rs12515548 av

MSH3

viste signifikant sammenheng med OSCC både i oppdagelsen og valideringsfasen (oppdagelse P-verdi: 1.43E-05, replikering P-verdi: 4.84E-03). To SNPs (rs12360870 av

MRE11A

, P-verdi: 2.37E-07 og rs7003908 av

PRKDC

, P-verdi: 7.99E-05) ble funnet å være signifikant bare forbundet med leukoplaki . Stratifisering av fag basert på mengden av tobakksforbruket identifisert SNPs som ble assosiert med enten høy eller lav tobakk utsatt gruppe. Studien avdekker en synergi mellom forbundet SNPs og livsstilsfaktorer i predisposisjon for OSCC og leukoplaki

Citation. Mondal P, Datta S, Maiti GP, Baral A, Jha GN, Panda CK, et al. (2013) Omfattende SNP Scan av DNA-reparasjon og DNA-skader responsgener Avslør Multiple Følsomhet Loci overdragelse Risiko for Tobacco Associated Leukoplaki og Oral Cancer. PLoS ONE 8 (2): e56952. doi: 10,1371 /journal.pone.0056952

Editor: Robert W. Sobol, University of Pittsburgh, USA

mottatt: 13. oktober 2012; Godkjent: 16 januar 2013; Publisert: 20 februar 2013

Copyright: © 2013 Mondal et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble støttet delvis av Institutt for Bioteknologi Grants BT /PR /5524 /med /14/649/2004 og BT /01 /COE /05/04. Ingen ekstra ekstern finansiering ble mottatt for denne studien. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Oral plateepitelkarsinom (OSCC) er den tiende hyppigste kreft over hele verden. I India, rangerer OSCC først blant menn og fire blant kvinner [1], [2]. Munnhulen regionene som er berørt av denne kreft er tunge, munnslimhinnen, leppe og tannkjøtt. Kjente risikofaktorer for kreft i munnhulen er tobakk tygging og røyking, alkoholforbruk, HPV infeksjon og kjønn [3]. Forekomsten (9,8 hos menn, 5,2 i kvinnelig per 10,0000 personer per år) og dødelighet (22,1 hos menn, 9,4 i kvinnelig per 100.000 personer per år) av OSCC eskalerte i indisk bestander på grunn av en økende rente (35%) av tobakk [4], [5]. Blant ulike provinser i India, har Vest-Bengal befolkning høy alder standardisert tobakksrelaterte kreftdødelighet (33,4) og kumulativ risiko 5,0% (99% konfidensintervall [CI] 04.01 til 05.08) [2]. Den mest vanlige kliniske presentert premaligne lesjoner i munnslimhinnen er oral leukoplaki med en forekomst på 0,1-0,5% og frekvensen av transformasjon til kreft er 1-2% per år [6]. Behandling og vurdering av risikoen og progresjon av leukoplaki er fortsatt et problem, som gjenoppstår til tross for det fjernes via kirurgi og kjemoterapi ikke redusere forekomsten av kreft [7]. Dermed er genetisk markør basert risikovurdering nødvendig for tidlig oppdagelse.

Mange genetiske assosiasjonsstudier har identifisert SNPs i flere viktige gener som

p53, p73 Hotell og

MDM2

som risiko faktorer til OSCC og leukoplaki utvikling [8] – [10]. En Genome Wide Association Study (GWAS) på Øvre Aerodigestive Tract Kreft (UADT), som inkluderte munnhulen regioner, identifisert mottakelige varianter hovedsakelig i

aldehyd dehydrogenase product: (

ADH

) genet klynge [11 ]. Cellular DNA-reparasjonsprosesser stabil genomet ved å redusere kreftfremkallende indusert mutasjoner [12]. Men studier om reparasjons genvarianter og OSCC mottakelighet fokusert hovedsakelig på

XRCC

gruppe av gener og på noen andre DNA-reparasjons forbundet gener som

ATM

,

NBN Hotell og

MRE11A

i ulike populasjoner over hele verden [13], [14]. I indiske populasjoner, sammenslutning av polymorfismer i

XRCC1, XRCC3, NAT2, XPD, ERCC2 Hotell og

OGG1

med OSCC er rapportert [15] -. [19]

dobbel tråd pauser (DSB), anses å være den mest dødelige blant de forskjellige typer av skader [20] og Non homolog End sammenføyning reparasjon (NHEJ) er den viktigste veien for DSB reparasjonsprosessen [21]. Den andre DNA reparasjon vei som har blitt rapportert å bli svekket i OSCC er mismatch reparasjon (MMR) veien. Medlemmene av MMR spiller viktige roller i å redusere mutasjonshastigheten og genomiske ustabilitet [12].

MLH1 Hotell og

MSH2

av MMR er inaktivert av arrangøren hyper-metylering i OSCC [22]. Disse DNA-reparasjonsgener er også viktige mål for mange anti-kreft narkotika utviklingsstudier [23], [24]. Polymorfismer i disse genene modulere individuelle respons på kreftfremkallende stoffer [25] og narkotika [26], [27].

Vi utførte en case-control forening studie for å identifisere risiko SNPs på større DSB reparasjon (

RAD50, MRE11A, NBS1, PRKDC, XRCC5, XRCC6 Hotell og

LIG4

), MMR (

MSH6 Hotell og

MSH3

) og nøkkelen DNA skade respons (

ATM Hotell og

ATR

) gener i muntlig kreft og leukoplakimateriale pasienter fra delstaten Vest-Bengal i østlige India. I discovery fasen genotypet vi 321 SNPs i 626 tilfeller (373 individer med OSCC og 253 individer med leukoplaki) og 535 alderstilpassede kontroller med lignende tobakksrøyking og /eller tyggevaner og ingen muntlige plager. Deretter validert vi betydelig tilhørende SNPs i et eget replikering kohort av 114 OSCC pasienter og 160 kontroller fra de samme geografiske områder. Til slutt utførte vi en multidimensjoner Reduction (MDR) analyse for å observere SNP-SNP og SNP-miljø interaksjon.

Metoder

Etikk erklæringen

Prosedyrer for innsamling av blodprøver og skriftlig informert samtykke skjema ble gjennomgått og godkjent av Institutional Etisk Komité, csir-Indian Institute of Chemical Biology, Kolkata, India.

skriftlig informert samtykke ble innhentet fra alle saks og kontrollpersoner etter å forklare samling prosedyrer og Hensikten med studien på lokale språk.

fag

i discovery fasen, ble 373 OSCC og 253 leukoplakimateriale pasienter rekruttert mellom 2006 og 2009 fra R. Ahemed Dental College og Hospital, Kolkata India etter patolog fra sykehuset bekreftet disse to typene av lesjon av Histo-patologiske undersøkelser. Disse pasientene er kaste bestander av gruppen lav og middels inntekt (årlig familieinntekt $ 100 og $ 300, henholdsvis) fra ulike distrikter i delstaten Vest-Bengal i den østlige delen av India. Vi har derfor rekruttert 535 etnisk matchede men urelaterte kontrollpersoner enten fra samme sykehus som har kommet til sykehuset for dental og oral sjekke opp og har ingen muntlig plager og også direkte fra befolkningen ved å besøke forskjellige steder i delstaten Vest-Bengal . Potensialet konsekvens av å bruke sykehus basert kontroll er forspent sampling som vi har testet ved hovedkomponentanalyse og justert til skjevhet, hvis noen. Kontroll personer rekruttert fra befolkningen ble undersøkt av leger for å sikre at enkeltpersoner uten noen muntlige plager er registrert. Både pasienter og kontroller var vanlig tobakk brukere, enten i form av røyking og /eller tygging, på tidspunktet for samlingen. Vi delte både pasienter og kontroller basert på tobakk eksponeringsnivå: (a) høy dose (HD) og (b) lav dose (LD) tobakk utsatte grupper. Vi beregnet tobakksrøyking og tygde indeks, PY (Pack Year) og CY (chewing Year), henholdsvis ved hjelp av følgende formel som ble brukt i tidligere studier: (Antall sigaretter per dag /20 × Antall år) + (No . av bidis per dag /40 × Antall år) for PY og (Antall ganger per dag × Antall år) for CY [28]. Deretter brukte vi medianverdiene for PY og CY å dele fagene i HD og LD grupper. I replikering fase ble ytterligere 114 OSCC pasienter fra Chittaranjan National Cancer Institute, Kolkata, India og 160 kontroller rekruttert med de samme inklusjons- og eksklusjonskriterier. Frisk 5-10 ml blodprøver ble samlet inn med informert samtykke fra pasienter og kontroller. Informasjon om alder, kjønn, munnhygiene, tobakksvaner og alkoholforbruk ble registrert ved å intervjue både pasienter og kontroller.

Gener og SNP Utvalg

Vi valgte syv gener for valg av SNPs fra DSB reparasjon pathway (

LIG4, MRE11A, PRKDC, NBN, RAD50, XRCC5 Hotell og

XRCC6

), to store gener fra MMR pathway (

MSH6 Hotell og

MSH3

) og to gener fra DNA skade respons pathway (

ATM Hotell og

ATR

). Vi valgte alle genene til NHEJ kjerne reparasjon av veier som det er den store reparasjonsprosessen av DSB sti og også være aktiv gjennom hele cellesyklus sammenlignet med homolog rekombinasjon reparasjonsprosessen [21], [29]. Kjernekomponenten omfatter XRCC5 og XRCC6 som danner en dimer og sammen med PRKDC gjenkjenne de doble trådbrudd. Senere har MRN kompleks sammensatt av MRE11A, RAD50 og NBN rydde opp endene og til slutt LIG4 tetter gapet [29]. I mismatch reparasjon vei, vi fokusert vår studie på mismatch gjenkjenningsprosessen. To forskjellige komplekser sammensatt av MSH2-MSH3 og MSH2-MSH6 gjenkjenner mismatch og innsetting /sletting Loops (IDLs), henholdsvis. Selv om mange genetiske assosiasjonsstudier har blitt utført i

MSH2

i muntlig og tykktarmskreft, den genetiske sammenslutning av

MSH3 Hotell og

MSH6

i ulike kreftformer er bare begynnelsen for å bli forstått [30] – [34].

ATM Hotell og

ATR

gener valgt fra DNA skade respons vei som disse genene er viktige signal transdusere som starter DNA-skader relatert signalering for reparasjon [35], [36]. En «maksimalt informativ» metode for SNP utvalg fra HapMap data til ikke-HapMap populasjoner ble brukt for å velge SNPs [37]. For enkel forståelse, har vi gitt detaljer og trinnvis prosess for dette valget algoritmen med tillatelse av forfatterne i nett supplerende metoder (metoder S1). Listen over SNPs ble sendt til Illumina å anslå Golden analysen suksessrate og til slutt 321 SNPs ble valgt for discovery fasen analyse. I replikering fase genotypet vi bare de SNPs som viste signifikant sammenheng med OSCC utvikling (P-verdi 0,05). Replication av SNPs som ble funnet å være assosiert med leukoplaki ikke kunne gjøres på grunn av utilgjengelighet av en ny kohort av disse pasientene i tilstrekkelig antall.

genotyping, kvalitetskontroll og statistiske metoder

genomisk DNA ble isolert fra perifere blod leukocytter ved hjelp av QIAGEN blod DNA isoleringssett i henhold til fremstilling protokoll. Konsentrasjonen av DNA-prøver ble beregnet ved picogreen analyse og fortynnet til en konsentrasjon på 50 ng /ul. Den Illumina Golden analysen (Illumina, San Diego, USA) ble brukt for genotyping i oppdagelsen fase og i replikering fase genotyping ble utført av TaqMan analyse i sanntid PCR maskin 7500 Rask og StepOne Plus (Applied Biosystems, Foster City, USA) . Begge slags genotyping ble utført i henhold til produksjon protokoll og vi inkludert 10% prøver som replikere i hver plattform for å måle genotyping replikering feil. For Golden analysen, kastes vi data med en GenCall poengsum 0,25 som mulige uteliggere og sjekket kontroller og forurensning oversikter for hver plate. For TaqMan, brukte vi automatiserte klynger og sjekket FAM og VIC dye intensiteter, og sykle terskelverdiene i hver plate. Programvaren som brukes for genotype samtalen var Illumina er BeadStudio (versjon 2.3.43), StepOne (versjon 2.2) og 7500 SDS (versjon 2.0.5).

For å sikre høy kvalitet data i den endelige foreningen analyse, vi forkastet data på (a) SNPs som ikke har gyldig genotype oppfordrer 90% av samplet individer, og (b) personer for hvem genotype oppfordrer 8% av SNPs manglet. Videre data for SNP’er hvor Minor Allele frekvens (MAF) var mindre enn 0,05, og hadde en P-verdi 0,001 for avgang fra Hardy-Weinberg likevekt ble også kastet. Studieutformingen er vist på fig. 1. allele og genotypisk foreningen testene ble utført på fire forskjellige måter: (a) Sak versus Controls (CC), hvor saken inkluderte både OSCC og leukoplakimateriale prøver; (B) Kreft versus Controls (CAC), hvor bare OSCC prøver ble ansett som saker; (C) Leukoplaki versus kontroll (LC) og (d) Cancer versus Leukoplaki (CAL), hvor leukoplaki prøvene ble betraktet som kontroller. I hvert sett, P-verdier, odds ratio (OR) og 95% KI ble bestemt ved logistisk regresjon ved hjelp av alder, kjønn og tobakksvaner som kovariater. Til slutt ble alle ujusterte P-verdier korrigert for multippel testing av Benjamini-Hochberg trappe opp False funnraten kontroll (FDR-BH) [38]. I tillegg til å eliminere befolkningen lagdeling effekt på foreningen tester, utførte vi Identity-by-State (IBS) clustering av genotypede data og genererte første fire hovedkomponenter. Alle fire komponenter i PCA (Principal Component Analysis) ble deretter brukt som kovariater sammen med andre kovariater som nevnt tidligere for allel og genotypisk foreningen testing [39].

Som tobakk vane er sterkt assosiert med kreftutvikling , også utførte vi foreningen analyse ved hjelp av tobakksrøyking og tygde som kovariater i logistisk regresjon. Personene ble delt i høy dose (HD) og en lav dose (LD), som beskrevet ovenfor. Association P-verdi på HD og LD grupper ble også justert for alder og kjønn ved logistisk regresjon og korrigert av FDR-BH.

Association tester, logistisk regresjon, flere test rettelser og PCA ble utført ved hjelp av plink [40 ]. PCA data ble visualisert ved R [41], Mann-Whitney og chi-kvadrat tester i tabell 1 og tabell 2 ble utført online på https://faculty.vassar.edu/lowry/utest.html og http: //www .graphpad.com /quickcalcs /contingency1.cfm hhv. Kraften i undersøkelsen er beregnet ut fra https://www.stat.ubc.ca/~rollin/stats/ssize/caco.html.

MDR Analyse av SNP-SNP og SNP-miljø interaksjon

For å analysere mulig interaksjon mellom forbundet SNPs og alle kovariatene, brukte vi den ikke-parametrisk MDR tilnærming, som beskrevet tidligere [42]. MDR, en konstruktiv induksjonsprosessen [43] definerer en enkelt variabel som inneholder informasjon fra flere locus genotyper og andre sykdoms kontrollerende faktorer og butikken som enten høy eller lav sykdomsrisiko gruppe. Vi inkluderte betydelige SNPs og alle kovariater (alder, kjønn, PY og CY) å konstruere samhandlingsmodeller separat i CC, CAC, LC og CAL grupper. Statistisk signifikans ble bestemt ved bruk permutasjon testing i MDRpt (versjon 1.0_beta_2). Vi brukte 10 fold kryssvalidering og 1000 fold permutasjon testing og betraktet disse samhandlingsmodeller som betydelig som viste en P-verdi mindre enn 0,05. Blant de store modellene, identifiserte vi viktige de som har en kryssvalidering konsistens (CVC) ≥9, som data var kryss validert 10 ganger av MDR. Den beste modellen ble så definert med den største nøyaktighet testing balansen (TBA) blant de viktige modellene. MDR og MDRpt er åpen kildekode og fritt tilgjengelig fra https://www.epistasis.org.

Vi bygger også hierarkisk samhandling entropi grafer å få rask tilgang og tolker MDR-modeller basert på teorien om informasjon gevinst som beskrevet tidligere [44] med Orange programvarepakke [45].

Resultater

Prøve Konstatering

Vi har presentert fordeling av alder, kjønn, PY og CY av alle prøvene rekruttert i oppdagelsen og replikering fase i online tabell 1 og 2, henholdsvis. Vi har funnet at noen av parametrene som var signifikant forskjellig i forskjellige sammenligningsgrupper. Vi har derfor justert alder, kjønn og tobakk vane i alle foreningen tester av logistisk regresjon. Men for å vurdere bidraget av tobakk eksponering for sykdom disposisjon, vi også utført foreningen test uten sin justering etter deling fagene i høye og lave dosegruppene med oppdagelsen fase prøvene.

DNA Repair genvarianter Confer Risk /beskyttelse til OSCC og Leukoplaki

i discovery fasen, ble noen av genotyping data fjernet på grunn av følgende årsaker: (i) 13 individer med 92% genotyping samtaler, (ii) 6 SNPs med 90% genotyping samtaler, (iii) 18 SNPs fjernet basert på Hardy-Weinberg test med P-verdi 0,001, og (iv) 108 SNPs fjernet for MAF 0,05. I den endelige analysen ble observert mer enn 98% genotyping hastighet med 195 SNPs i 336 OSCC, 239 leukoplaki og 512 kontrollprøver. Den genomiske inflasjon faktor (λ) av datasettet QC var 1 til 1,01. Vi fant at kraften i undersøkelsen er 81%, noe som anses som tilstrekkelig for identifisering av foreninger

Tabell 3 gir P-verdier for ulike foreningen tester som:. (A) uten justering av kovariatene [alder, kjønn og tobakk vane ved logistikkregresjonsanalyse] og korrigeringer for multippel testing [Benjamini-Hochberg fdr for multippel testing], (b) uten noen kovariat justering, men med korreksjon for flere testing, (c) med kovarianteffekter justeringer, men ingen multiplum testing korreksjon og (d) med både kovarianteffekter justeringer og multippel testing korreksjon. Vi fant rs12515548 av

MSH3

å være signifikant assosiert med CC gruppen [P-verdien 7.83E-03, OR: 1,733 (1,333 til 2,254)]. Betydningen av denne krets øker når sammenligning ble utført hver for seg mellom munnhulen og kontroll (tabell 3). En annen SNP rs207943 av

XRCC5

viste også signifikant sammenheng med kreft i munnhulen. Interessant nok har disse to SNPs ble også funnet å være signifikant assosiert med OSCC i forhold til leukoplaki prøver som kontroll (tabell 3). Disse resultatene tyder på at de har sterk innflytelse på predisposisjon for kreft i munnhulen om de blir presentert som premaligne lesjoner. To andre loci (rs7003908 av

PRKDC Hotell og rs12360870 av

MRE11A

) viste eksklusive assosiasjoner med leukoplaki; ett vesen risiko (rs12360870) og den andre beskyttende (rs7003908). Den betydelige allel sammenslutning av rs12515548, rs207943 og rs12360870 også forble signifikant på genotypisk nivå (tabell S1).

Vi utførte stratifisering analyse for å verifisere konfunderende effekt av evolusjonære genetiske heterogenitet innenfor studerte befolkningen på foreningen resultater. Ligner clustering ble observert på begge tilfellene og kontroller (Fig. S1). Interessant, tilsvar clustering ble også observert da analysen ble gjort på grunnlag av prøvetype (dvs. OSCC, leukoplaki og kontroller, fig. S1) eller geografiske områder (Fig. S1). Vi neste utført forening test i CC gruppe ved hjelp av første fire hovedkomponenter som kovariater. SNP rs12515548 av

MSH3

forble signifikant [allel foreningen P-verdi: 0,006, OR: 1,1717 (1,318 til 2,236)] som det ble observert uten lagdel justering. Vi fortsatte denne analysen i alle fire grupper (CC, CAC, LC og CAL) og fant at ingen tilknyttede varianter ble ekskludert på grunn av den observerte clustering (tabell S2).

Tobakk Eksponering Endrer Effekt av DNA Repair Gene varianter på oral Cancer og leukoplaki Predisposition

Vi utførte forening analyse ved hjelp av tobakk eksponering som kovariat å bedre forstå sin rolle i kreft i munnhulen og leukoplaki i discovery fasen prøver. Tabell 4 viser at de fleste av de sammenlignende grupper oppviste forbindelse med lav-dose (LD) tobakk eksponeringsnivå. De to signifikant assosiert SNPs med OSCC (rs12515548 og rs207943) viste også signifikant sammenheng med lavdose tobakk eksponering gruppe. Interessant nok har disse to SNPs viste også krets med en lav dose tobakk gruppe sammenlignet mellom kreft og leukoplaki hvor leukoplaki ble ansett som referanse (CAL-LD i tabell 4). Bærere av to SNPs (rs12360870 av

MRE11A Hotell og rs7003908 av

PRKDC

) fortsatte å vise lignende effekter (et vesen risiko og andre beskyttende) på leukoplaki utvikling når de utsettes for både høy og lav dose av tobakk (LC-LD og LC-HD i tabell 4). Disse resultatene tyder på sin sterke rolle på OSCC predisposisjon uavhengig av tobakk eksponeringsnivå. Tabell S3 viser foreningens resultater på genotypisk nivå. Vi fant alle vesentlige varianter fra allel forening forble signifikant i genotypiske tester også, bortsett rs7003908 av

PRKDC

.

Validering av utvalgte SNPs i OSCC-kontroll Replication Cohort

Deretter genotypet vi rs12515548 av

MSH3 Hotell og rs207943 av

XRCC5

i en egen kohort av 114 OSCC pasienter og 160 kontrollpersoner å validere funn fase resultater. Utilgjengelighet av en egen kohort av leukoplakimateriale prøver hindret oss i validering av rs12360870 og rs7003908 som ble funnet å være signifikant assosiert utelukkende med leukoplakimateriale prøver i discovery fasen. Vi fant bare rs12515548 forble signifikant assosiert med OSCC både allel og genotypisk analyse (replikering P-verdi: allel 4.83E-03, genotypisk 0,044, Tabell 5 og Tabell S4). De kombinerte p-verdier for SNP av oppdagelse og replikering fase for allel og genotypiske tester er 1.21E-06 og 0,009, henholdsvis.

SNP-SNP og SNP-miljø Interaksjon avslører Moderate synergieffekter

Vi utførte MDR-analyse for å avdekke SNP-SNP og SNP-miljø faktorer interaksjoner i denne kohort av individer. Vi fant den mest potente samhandling i OSCC sammenlignet med kontroll er mellom rs207943, rs12515548, alder og tobakksrøyking med en TBA av 0,6011 og CVC 10 (p-verdi 0,001). Men den viktigste modellen for OSCC utvikling skjema leukoplaki var samspillet mellom rs207943, rs12515548, sex og tobakk tygging (tabell S5). For leukoplaki utvikling fra kontrollen, den mest betydningsfulle modellen var samspillet av alle kovariabler med rs12360970 etterfulgt av innlemmelse av rs7003908 (tabell S5).

Deretter vi anvendt interaksjon entropi algoritmer for å understøtte tolkning av forholdet mellom variablene . Vi fant den mest potente modellen av OSCC (CAC) som åpenbart fra permutasjon testing (rs207943-rs12515548-Age-PY) er synergistisk i naturen (Fig. 2A). Interessant, alder og kjønn bidrar til denne interaksjonen på en uavhengig måte med en entropi fjerning av 1,43% og 0,56%, respektivt. Den synergistisk interaksjon ble også observert i modellen består av rs207943, rs12515548, Sex og CY for OSCC utvikling fra leukoplaki (CAL), hvor alle faktorer virker sammen (Fig. 2B). Vi fant alder i CAC sammenligning og tobakk tygge i CAL sammenligning er de viktigste kovariater med henholdsvis 5% og 7,12% entropi fjerning,. For leukoplaki utvikling rs12360870 er den sterkeste faktoren (entropi forklarte: 6,35%) og alle signifikante interaksjoner er synergistisk (Fig 2C.). Modellen for CC sammenligning lignet både CERT og LC sammenligninger (Fig. 2D).

Disse modellene beskriver prosent av entropi forklaring av enkelt faktor eller toveis interaksjoner. Boksene beskrive SNPs og faktorer med prosentandelen av entropi forklart. Samhandling blir presentert av piler og redundans av linjer. Samhandlingsmodeller er konstruert på (A) oral cancer versus kontroll (CAC), (b) oral cancer versus leukoplaki (CAL), (C) leukoplaki versus kontroll (LC) og (D) Ved versus kontroll (CC).

Diskusjoner

Den regionale genetiske og livsstil heterogenitet blant populasjoner fra ulike deler av India har blitt nevnt av mange etterforskere [46] – [48]. Dette utgjør alvorlig hinder for den genetiske foreningen studie i indisk bestander. Vi dermed målrettet midten og lav inntekt gruppe av semi-urbane befolkningen med en aldersspredningen av 22 til 80 år fra delstaten Vest-Bengal i denne studien. Vi sørget også lignende tobakksvaner av saken og kontrollpersoner som deltok i studien. Den pågående Million Død Study (MDS) i India finner en økning i aldersspesifikke kreftrisiko på grunn av tobakk vane i befolkningen fra Vest-Bengal [2]. En annen studie også rapportert sammenslutning av oral vane og DNA-skader med OSCC og leukoplaki i disse populasjonene [49].

Den mest lovende forbundet SNP fra denne studien er rs12515548 av

MSH3

. Denne SNP ble funnet å være signifikant forbindelse i tre av fire analysesett testet i oppdagelsen fase (case-control, kreft-kontroll og kreft-leukoplaki) og også forble vesentlig i replikasjonsfasen. Det ble ikke funnet med dette SNP i GWAS av øvre aerodigestive veis kreft, og dette er den første rapporten om sammenslutning av denne SNP med OSCC. Men flere studier viste sammenslutning av andre SNPs i MSH3 og MSH6 gener i ulike kreftformer [33], [50], [51]. Det kan bemerkes at selv om vi har observert relativt sterke P-verdier i foreningen tester for den gitte utvalgsstørrelsen, kraften av studien er 0,81 og det var ingen befolkning lagdeling. Imidlertid er videre replikering avgjørende i samme og andre populasjoner. Den rs12515548 er en intronic SNP ligger nær 21th exon av

MSH3

med en endring fra G til A (https://www.ncbi.nlm.nih.gov/projects/SNP/snp_ref.cgi?rs = 12515548). To funksjonelle egenskaper kan være forbundet med denne SNP, (a) funksjonalitet forutsigelse ved bruk av F-SNP [52] avslørte at den mister evnen til å binde Gata familie av transkripsjonsfaktorer ved endring fra G til A (konfidensverdi til å binde prediksjon for forskjellig Gata transkripsjonsfaktorer i området 88,4 til 98,4) og (b) den miRBase analysen viste en økt affinitet for hSA-MIR-374a-3p til risikoen allelet (A) av SNP (skår 6,9, evalue 1.0 for allel A; ballen 60, evalue 5,6 for allel G). Direkte eksperimentell validering er nødvendig for å forstå den nøyaktige funksjonelle rolle, om noen. Resultatene fra indiske Genome Variasjon Consortium [47] og blanding kartlegging av indiske befolkningen identifisert kaste bestander av den østlige India som indo-europeiske befolkningen som viser slektskap til CEU befolkningen i HapMap [53], [54]. Vi dermed bygge en LD kartet

MSH3

hjelp kalkulatoriske data fra HapMap CEU befolkning og fant en 81 Kb LD blokk med rs12515548 som inkluderer ekson 21 (data ikke vist). Det ville være interessant å undersøke hvorvidt en slik LD blokken eksisterer i denne populasjoner, og i så fall om rs12515548 er knyttet til noen annen funksjonell SNP av

MSH3

. De intronic SNP rs207943 av

XRCC5

, som også viste signifikant sammenheng med OSCC utvikling, er til stede i en antatt bindingssete av transkripsjonsfaktoren Skn-en for

C. elegans

. Det binder seg bare med ikke-risiko G allel av SNP (F-SNP prediksjon scorer 0,5, innbinding poengsum 87,1). Den menneskelige homolog av Skn-en, NRF 1/2/3 er en viktig transkripsjonsfaktor som er involvert i oksidativt stress motstand [55]. De Nrf2 mangelfull mus har dempet uttrykk for mange avgift og antioksidant enzymer og er svært utsatt for kreftfremkallende toksisitet og kreftutvikling [56]. Dermed manglende evne Skn-en binding med risiko allelet C i denne SNP og OSCC progresjon må undersøkes nærmere.

Studien har også undersøkt genetiske risikofaktorer knyttet til utvikling av leukoplaki og konvertering til OSCC . Vi har funnet forskjellige SNP’er å være forbundet utelukkende med utvikling av leukoplaki fra normale individer og progresjon av leukoplaki til kreft. For eksempel, rs7003908 av

PRKDC

ble rapportert å være assosiert med prostata og urinblæren kreft i nord-indiske befolkning og glioblastom i USA [57] – [59]. Identifisering av en bestemt risiko SNP assosiert med kreft-leukoplaki sammenligning ville være verdifull som en prognostisk biomarkør for påvisning av tilfeller der leukoplaki ville ha potensial for konvertering til munnhulekreft. Imidlertid er replikering av foreningen i en annen kohort av leukoplakimateriale pasienter nødvendig for å validere disse resultatene.

tobakk eksponering er en kjent miljøfaktor assosiert med kreft i munnhulen og leukoplaki. Derfor utførte vi foreningen test uten sin justering og stratifisering fagene basert på deres eksponeringsnivåer tobakk. Observasjonen at noen polymorfe varianter av DNA-reparasjon og skader responsgener utstilt assosiasjon til en annen tobakks utsatt grupper tyder på at DNA-skader signalene forskjellig behandlet av ulike polymorfe varianter av disse genene. Lignende observasjon er også gjort i tidligere studier med

p53

genet polymorfismer [28]. Det kan bemerkes at disse SNPs kan være nyttig for utvikling av tobakk-assosiert logisk markør for oral cancer og leukoplaki. MDR Analysen avdekket alder i OSCC og tygge i leukoplaki er de to viktigste kovariater som samhandler synergistisk med de mest potente risiko SNPs av de respektive sykdommer (rs12515548 og rs207943 for OSCC og rs12360870 for leukoplaki). Studien viste synergi mellom SNPs og redundans mellom livsstilsfaktorer riktignok uten additiv effekt. Dette bestemte fenomener ble også observert med SNPs fra DNA-reparasjonsgener i andre Caner typer [60]. Dermed kan det bli foreslått at den samlede reparasjonskapasiteten bidratt med ulike reparasjons machineries og uavhengige effekter av ulike livsstilsfaktorer er den ultimate determinant av kreft i munnhulen og leukoplaki predisposisjon i et individ.

Denne studien tyder på at

MSH3, XRCC5, MRE11A Hotell og

PRKDC

å være de fire viktigste gener som ville endre risikoen for predisposisjon for kreft i munnhulen og leukoplaki i disse østlige indiske populasjoner. Polymorfe varianter av disse genene ble funnet å være signifikant assosiert med bryst-, bukspyttkjertelen, kolorektal og eggstokk-kreft [61] – [64]. Men til vår beste kunnskap, ingen av variantene som er identifisert i denne studien ble tidligere rapportert å være assosiert med andre kreft, unntatt rs7003908.

Legg att eit svar