PLoS ONE: patrilineal Bakgrunnen for spiserørskreft og mage Cardia kreftpasienter i en Chaoshan høyrisikoområde i Kina

Abstract

Taihangfjellene rekke nord-sentrale Kina, den sørlige regionen området i Fujian-provinsen, og Chaoshan vanlig i Guangdong-provinsen er 3 store regioner i Kina kjent for sin høye forekomsten av spiserørskreft (EF). Disse områdene også har høye forekomster av mage Cardia kreft (GCC). Forfedrene til Chaoshanese, nå de store innbyggere i Chaoshan vanlig, var fra nord-sentrale Kina. Vi antok at EU og GCC pasienter i Chaoshan områder har et felles opphav med Taihangfjellene pasienter. Vi analyserte 16 østasiatiske spesifikke Y-kromosomet biallelic markører (enkeltnukleotidpolymorfi, Y-SNPs) og 6 Y-kromosom kort tandem repeat (Y-STR) loci i 72 EF og 48 GCC pasienter fra Chaoshan og 49 EF og 63 GCC pasienter fra Taihangfjellene rekkevidde. Vi har også sammenlignet data for 32 Chaoshan hakkaer og 24 medlemmer av Aboriginal Hun mindretall som bor i nærheten av Chaoshan området. Analyse var av frekvensfordeling og hovedkomponent, korrelasjon og hierarkisk klyngeanalyse av Y-SNP. Chaoshan pasienter ble nært knyttet til Taihangfjellene pasienter, selv om de er geografisk fjernt. Y-STR-analyse viste at de 4 pasientgrupper var mer nært beslektet med hverandre enn med andre grupper. Nettverk analyse av haplogruppe O3a3c1-M117 viste en høy grad av pasientspesifikke underlaget. Vi foreslår at EU og GCC pasienter fra disse 2 områdene dele en lignende patrilineal genetisk bakgrunn, som kan spille en viktig rolle i den genetiske faktoren av EF og GCC i disse populasjonene

Citation. Liu S, Huang B, Huang H, Li X, Chen G, Zhang G, et al. (2013) patrilineal Bakgrunnen for spiserørskreft og mage Cardia kreftpasienter i en Chaoshan høyrisikoområde i Kina. PLoS ONE 8 (12): e81670. doi: 10,1371 /journal.pone.0081670

Redaktør: Suminori Akiba, Kagoshima Universitetet Graduate School of Medical and Dental Sciences, Japan

mottatt: 9. juni 2013, Godkjent: 17 oktober 2013; Publisert: 10.12.2013

Copyright: © 2013 Liu et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble sponset av NSFC-Guangdong felles fond sentralt prosjekt (U1132004), NSFC (31171226, 81101548), Guangdong International Cooperative Technical Innovation Platform (sertifikater gihz1106), og NSF Guangdong-provinsen (S2011020002393). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Esophageal kreft (EC) er en av de vanligste døds kreft på verdensbasis. Kina har geografiske «hot spots» av høy EC forekomst. Et velkjent område med høy risiko for EF i Kina er Taihangfjellene området mellom Henan, Hebei, og Shanxi provinser i nord-sentrale Kina, den berømte «Asiatiske EC belte» som strekker seg fra de kaukasiske fjellene, over det nordlige Iran, hele vei til Nord-Kina [1]. I tillegg, er forekomsten av magekreft Cardia (GCC) høy i beltet. For eksempel, verdens standardisert forekomsten av EF og GCC i Linxian, Henan-provinsen, var 81.96 /100 000 mennesker og 31.04 /100 000, henholdsvis mellom 1983 og 2002 [2], [3]. Den Chaoshan området i det sørlige Kina er et annet EC høyrisikoområde. De alders standardisert forekomst i Nanao øya til EU og GCC var 74,47 /100000 og 34,81 /100 000, henholdsvis mellom 1995 og 2004 [4].

De geografiske funksjoner i sør-strand Chaoshan og nord-sentral Taihangfjellene området er tydelig, men forekomsten av EF og GCC er høy innenfor disse 2 områdene [5]. Vi og andre har rapportert familiær aggregering av EF og GCC og økt EC og GCC risiko i familiemedlemmer i denne høyrisiko befolkningen [6] – [9]. I Chaoshan høy risikoområde, er forekomsten av EF og GCC ikke selv blant befolkningsgrupper, selv om de blir utsatt for det samme miljøet

De 3 viktigste bestandene i Chaoshan området består av 2 Han populasjoner -. Chaoshanese med Chaoshan dialekter og Hakka med Hakka dialekter – og en lokal opprinnelig Hun befolkningen. Siden Qing-dynastiet (216~207 BC), Henan og Shanxi Han personer i Nord-sentrale Kina migrert inn i Chaoshan området i Guangdong-provinsen via Fujian-provinsen på grunn av krig og hungersnød. De ble etter hvert den dominerende innbyggerne i Chaoshan området og kalles Chaoshanese [10], så Chaoshan dialekt er lik gammel kinesisk. Hakka Chinese stammer fra nord Han-kinesere av Yellow River og Luohe River bassenget av Central Plain. Fra Jin-dynastiet (266~316 AD) til Tong-dynastiet (960~1297 AD), ble de tvunget til å flytte til sørlige områdene også på grunn av kriger. Når Hakkas kom i Chaoshan området, hadde Chaoshanese allerede avgjort i den rike sletten området, slik at Hakkas måtte bosette seg i fjellområdene, hvor de bodde sammen med de lokale innfødte, den Hun befolkningen (fig 1).

piler viser nord-sør vandringer Han innbyggere fra nord-sentrale Kina ifølge historiske kilder. 218BC, AD311 og AD669 er de tre store tidsperioder på nord-sør vandringer

Hakka og Chaoshanese populasjoner viser egenskapene til sine unike kulturer [10] – [13]. Som har mange likheter til nord Han-kinesere, inkludert noen av funksjonene i dialekt, livsstil, skikker og vaner [10]. Den Chaoshan Hun befolkningen er den eneste innfødte og minoritetsbefolkningen. Hun mennesker hovedsakelig arbeider i jordbruk, skogbruk og husdyrhold; deres språk og leve skikker avvike fra Han-befolkningen [14]. Selv om alle 3 bestander er utsatt for en lignende geografiske miljø, bare Chaoshanese har en høy forekomst av EF og GCC.

Vår tidligere forskning av Y-kromosom og mtDNA haplogruppene konkluderte med at høyrisikogrupper EC i Taihang Mountain, Fujian Minnan og Guangdong Chaoshan dele en lignende patrilineal og matrilineal genetisk bakgrunn [15], [16]. I denne studien har vi ytterligere utforsket patrilineal genetiske strukturen i EU og GCC pasienter Chaoshan høyrisikoområder og sammenlignet den med matchet høyrisikogrupper og tilsvarende populasjoner med lav risiko. Vi forsøkte å undersøke om Chaoshan kreftpasienter har et felles opphav med Taihangfjellene pasienter og om de har de samme unike Y-kromosom haplotyper. Vi sammenlignet også disse dataene for Y-kromosom enkeltnukleotidpolymorfi (Y-SNPs) og Y-kromosom kort tandem repeat (Y-STRs) med at andre kinesiske populasjoner fra offentlige databaser for å utforske den relative genetiske affinitet av de studerte populasjonene. Vi først analysert ikke-rekombinerende delen av Y-kromosom (NRY) i disse 6 populasjoner med 16 østasiatiske-spesifikke biallelic markører [17], [18] (SNPs), som var preget av lav mutasjonsraten og lav sannsynlighet for rygg og parallell mutasjon og egnet for sporing tidlig demografiske begivenheter i menneskehetens historie. Da vi undersøkte den genetiske avstanden mellom EU og GCC pasienter med Y-STR loci med relativt høy mutasjonsraten og hensiktsmessig for å analysere forholdet mellom nære grupper og deres mikroevolusjon [15], [16]. Begge Y-SNP og Y-STR analyseresultater støtter at Chaoshan pasientene har nær genetisk slektskap med Taihangfjellene pasienter og pasienter har nærmere forhold til hverandre enn med høy risiko befolkningen.

Resultater

Distribusjon av NRY Haplogroups i de 6 Studerte bestander i Kina

Y-SNP genotyping avslørte haplogroup hyppighet av Chaoshan EC eller GCC pasienter, Taihangfjellene EC eller GCC pasienter, og Chaoshan Hakka og hun populasjoner. Den høyeste haplogruppe av Chaoshan pasienter var O3a3c1-M117, som er karakteristisk haplogruppe for nord Østasiater (tabell 1). Det var også høy for Taihangfjellene pasienter, men var betydelig lavere for Chaoshan Hakka og hun populasjoner enn Chaoshan pasienter (p 0,05). Både Chaoshan Hakka og hun populasjoner viste en høy frequceny av O1a *, den karakteristiske haplogruppe for Sørøst asiater. Det var signifikant høyere for Chaoshan Hakka enn Chaoshan pasienter (p 0,05). Den Hun befolkningen viste en unik høy frekvens av O3a3b * sammenlignet med andre studerte populasjoner, unntatt Chaoshan GCC pasienter med svært lav frekvens på 2,08%.

Principal Component Analysis avslørt nært slektskap mellom fire pasientgrupper

Prinsipal komponent analyse (PCA) innebærer en matematisk prosedyre som forvandler en rekke korrelerte variabler i en (mindre) antall ukorrelerte variabler som kalles hovedkomponenter. De første hovedkomponent står for så mye av variasjonen i dataene som mulig, og hver påfølgende komponent står for så mye av den resterende variasjonen som mulig. I prinsipal-komponent plottet, er den minste avstanden mellom to populasjoner, jo nærmere den genetiske forholdet mellom de to. Figur 2 viser resultatene av prinsipal komponent analyse, med 3 komponenter (PC1, 2, 3), for Y-SNP frekvenser basert på genotyping resultatene av de 6 undersøkte populasjoner og flere data for andre kinesiske Han. Til sammenligning ble haplotype frekvenser av 4 høyrisikogrupper fra Chaoshan (CSHR), Fujian (FJHR) og Taihangfjellene (THHR) områder inkludert [15]. De 3 komponentene utgjorde 86,2% av den totale variasjonen i Y-SNP. De 4 pasientgrupper og 3 høyrisikogrupper gruppert sammen. De Chaoshan hun og Hakka bestander dannet en annen klynge. Resten av Nord-Han og Southern Han dannet en annen gruppe. Den Chaoshan pasienter og høy risiko befolkningen ble isolert fra Chaoshan Hakka og hun populasjoner og Guangzhou Han.

Jo mindre avstand mellom populasjoner, jo nærmere forholdet. Vi delte 26 bestander inn i 3 grupper: 1) Cluster1 (rød sirkel): 4 pasientgrupper og 3 populasjoner med høy risiko for spiserørskreft (EF): CSEC: Chaoshan EC pasienter, CSCC: Chaoshan mage Cardia kreft (GCC) pasienter, CSHR : Chaoshan høy-risiko befolkning; FJHR: Fujian høyrisiko befolkningen; THEC: Taihangfjellene EC pasienter; THCC: Taihangfjellene GCC pasienter; og THHR: Taihangfjellene høyrisiko befolkningen; 2) Cluster2 (grønn sirkel) Chaoshan Hakka (CSKJ) og hun befolkning (CSSZ); 3) Cluster3 (Oransje sirkel) nordlige og sørlige Han populasjoner. Northern Han populasjoner: HEB: Hebei Han; LN: Liaoning Han; XJ: Xinjiang Han; NMG: Neimeng Han; HB: Hubei Han; HN: Henan Han; GS: Gansu Han; SX: Shanxi Han; SD: Shangdong Han. Southern Han populasjoner: GD: Guangzhou Han; SH: Shanghai Han; ZJ: Zhejiang Han; AH: Anhui Han; JS: Jiangsu Han; Hun: Hunan Han; JX: Jiangxi Han; SC:. Sichuan Han

positiv korrelasjon mellom 4 pasientgrupper og kinesiske Han-pasient

Y-SNP haplogroup hyppighet for pasientgrupper med høy risiko befolkning fra samme område var positivt korrelert, og frekvenser for alle pasientgrupper ble positivt korrelert med Fujian og Chaoshan høyrisikogrupper (tabell 2). Frekvenser for Chaoshan EF pasienter og Chaoshan Hakka var korrelert men koeffisienten var lavest. Frekvenser for HC var positivt korrelert med de fleste av de kinesiske Han-frekvensene og de for HNEC var positivt korrelert med noen av de kinesiske Han-frekvensene.

Hierarkiske klyngeanalyse isolater Pasienter og høy-risiko Befolkning fra andre populasjoner

For å studere slektskap mellom de 4 pasientgrupper og deres forhold til andre Han og minoritets nasjonaliteter, analyserte vi Y-SNP data ved hierarkisk klyngeanalyse med gjennomsnittlig kobling (mellom grupper). Vi sammenlignet 17 kinesiske Han-populasjoner (befolkning informasjon var den samme som fra hovedkomponentanalyse), 3 sørlige minoritets nasjonaliteter (Yao, Zhuang og Dong [19] og 5 nordminoritets nasjonaliteter (tibetanske, mongolske (MG), Hui, Ewenki ( . EWK), Shui) de Taihangfjellene pasienter med høy risiko befolkningen (Taihang) var genetisk nært og dannet en gren, i mellomtiden, de Chaoshan pasientene var genetisk nær høyrisikogrupper Chaoshan og Fujian (Chaoshan, Fujian) og dannet en annen gren (fig. 3). Deretter krysset disse 2 grenene og gruppert med Chaoshan Hakka og hun populasjoner. Alle andre populasjoner gruppert utenfor den viktigste grenen dannet av populasjoner fra høyrisikoområder. Derfor EC eller GCC pasienter og høyrisikogrupper var nærmere genetisk med hverandre enn med Chaoshan Hakka, Hun og andre bestander

Viser affinitet mellom de undersøkte populasjonene, høy-risiko befolkning, kinesiske Han og kinesiske minoritet nasjonaliteter Taihang:.. Taihangfjellene høy-risiko befolkning; Chaoshan: Chaoshan høyrisiko befolkningen; Fujian Fujian høyrisiko befolkningen. De andre forkortelser er definert i Metoder og Figur 2.

Genetisk Avstand Analyse og konstruksjon av et fylogenetisk tre

Vi brukte Y-STR data for å undersøke de genetiske sammenhenger mellom fire pasientpopulasjoner. R

st avstander mellom par av populasjoner ble beregnet på grunnlag av 6 Y-STRs: DYS389 (I, II), DYS390, DYS391, DYS392, DYS393 og DYS394. Vi inkluderte 6 flere kinesiske populasjoner og 3 høyrisikogrupper: Zhejiang [20], Henan [21], Dongbei [22], Tianjing [23], Hunan Han [24], og tibetanske [25], og Chaoshan, Fujian, og Taihang Moutain høyrisikogrupper, som alle tilhører den Sino-tibetanske språkfamilien [15], som gjør de 4 pasientgrupper. Fra R

ST avstand matrise, bygget vi en unrooted nabo-sammenføyning tre (Fig. 4). De pasientgrupper var nærmere hverandre enn til høyrisikogrupper og andre kinesiske Han-populasjoner.

De 4 pasientgrupper er nær hverandre og er gruppert med bestander med høy risiko.

Nettverk Analyse av Y-STR Haplogroups av de 4 pasientgrupper og 3 høyrisikogrupper

Den høyeste haplogruppe frekvens deles av Chaoshan pasientene var O3a3c1-M117 (tabell 1). Nettverket for pasienter og høy risiko populasjoner ble ytterligere konstruert basert på haplogruppe O3a3c1-M117. I alt 12 Henan og 15 Chaoshan EC pasienter, 17 Chaoshan og 9 Henan GCC pasienter, og 23 Chaoshan, 8 Henan og 24 Fujian høyrisikopersoner tilhørte haplogruppe O3a3c1-M117. Personer med Y-STR frekvens 2 ble fjernet fra analysen. Til slutt, data for 55 personer ble inkludert og analysert (fig. 5). Sentral node var representert ved 8 Fujian høyrisikopersoner, 1 Henan høy risiko individuell og en Chaoshan EC pasient. Alle de andre haplogroup O3a3c1-M117 personer kom fra denne sentral node. Denne sentral node var koblet til 5 ett-trinns naboer, med 2 naboer som representerer 5 Fujian høy-risiko individer; den tredje nabo representert 8 Chaoshan høyrisikopersoner, 1 Henan høyrisiko individ, 2 Fujian høyrisikopersoner og en Chaoshan EC pasient; fjerde nabo representert 2 Chaoshan EC pasienter, en Chaoshan høy risiko individuell og en Fujian høy risiko individ; og den femte nabo representert en Chaoshan GCC pasient og en Chaoshan høy risiko individ. De fleste pasienter ble samlet fra den femte ett-trinns nabo og således gruppert i hovedsak i ett område (sirkel i fig. 5). Dette området inkludert alle GCC pasienter og 5 EC pasienter, med de resterende 6 EF pasienter spredt i andre noder.

De fleste pasientgrupper ble samlet inn en node og gruppert hovedsakelig i ett område (sirkel). Sirkler representerer linjene, er området proporsjonal med frekvensen, og fargen indikerer befolkning opprinnelsesland.

Materialer og metoder

Prøvetaking og DNA-ekstraksjon

Blodprøver av 288 urelaterte hanner ble hentet fra Taihangfjellene og Chaoshan høyrisikoområder. Informert samtykke ble innhentet fra alle fag. Fag var 1) Chaoshan pasienter-72 EF og 48 GCC pasienter; 2) Taihangfjellene pasienter-49 EF og 63 GCC pasienter; og 3) Chaoshan EC lav-risiko befolkning-24 Hun mennesker fra Chaoshan Fenghuang Mountain og 32 Chaoshan Hakka fra Chaoshan Puning fylket. Sykdom hos alle pasienter ble bekreftet patologisk. Alle deltakerne i studien ble gitt skriftlig informert samtykke. Studien ble godkjent av etisk komité av Shantou University Medical College. Genomisk DNA ble ekstrahert fra fullblod ved TIANamp Blood DNA kit (DP318-03) (Tiangen Biotech Co., Beijing).

Genotyping av Y-SNPs og Y-STRs

Y- SNPs ble genotypet ved Sequenom MassARRAY iPLEX Gold modul (Sequenom Inc.) (PCR primere og skjøte primere er i tabell 3). M1 polymorfisme (Alu innsetting, også kalt YAP) var direkte analysert ved agarosegel-elektroforese etter PCR [26]. MT ble genotypet ved fluorescens-PCR som beskrevet tidligere [15], og fluorescensmerkede ekstensjonsprodukter ble kapillær elektroforese på en ABI 3730x Genetic Analyzer (ABI, USA). Alle primere ble syntetisert ved Sangon Co. (Shanghai). I 1999 Su et al. konstatert 17 Y-kromosom haplogrupper basert på 19 østasiatiske-spesifikke biallelic markører som fars strukturen Østasiater [19]. Den justerte phylogenetics diagram av Y-SNPs [27] omfatter nesten 600 SNPs og definerer 311 haplogrupper. Fylogenetisk diagram av 17 haplogruppene definert ved 16 Y-SNPs er i Figur 6.

De siste markørene definerer haplogruppene er ved siden av grenene.

Befolkning og genotyping

Forsøkspersonene ble genotypet for Y-SNP haplogruppe og frekvenser ble sammenlignet blant de 4 pasientpopulasjoner og hun og Hakka populasjoner (Tabell S1). Hovedkomponent, korrelasjon og hierarkiske cluster analyser ble brukt for å analysere forholdet mellom 6 populasjonene. Tre høyrisikogrupper fra Taihangfjellene, Fujian Minnan, og Chaoshan områder og 25 tidligere publiserte kinesiske populasjoner ble sammenlignet. De 25 kinesiske populasjoner ble delt inn i 4 grupper etter geografisk plassering og nasjonalitet [15]. Northern Han (NHS) og nordlige minoritets nasjonaliteter (NMNS), sørlige Han (SH) og sørlige minoritets nasjonaliteter (SMNs)

NH populasjoner var Hebei [28], Liaoning (data levert av staten Key Laboratory of Genetic Engineering og Senter for Antropologiske studier, School of Life Sciences, Fudan University), Xinjiang, Gansu, Shanxi, Neimeng, Shandong og Henan [28]; SH populasjoner var Hunan, Hubei, Zhejiang, Jiangxi, Shanghai, Anhui, Jiangsu, Sichuan [28], Guangzhou og Guangxi (data fra Fudan University); NMN populasjoner var tibetanske, mongolske, Hui, Ewenki, og Shui (data fra Fudan University); data for 3 sørlige minoritets nasjonaliteter (Yao Zhuang og Dong [19] og 5 nordminoritets nasjonaliteter (tibetanske, mongolske, Hui, Ewenki, og Shui populasjoner ble levert av Fudan University). Chaoshan pasienter, Henan pasienter, Chaoshan Hakka og Chaoshan Hun befolkningen tilhører SHS, NHS, SHS, og SMNs hhv. Guangzhou Han, Chaoshan Hakka, og Chaoshan pasientene hører til Guangfu, Hakka, og Fulao /Helao klaner, henholdsvis de 3 store klaner i Guangdong-provinsen. Chaoshan Hun mennesker omfatte de store SMNs som bor i Chaoshan området. Disse 4 bestandene er geografisk plassen.

MT-rapporter kan brukes til å analysere minutt genetisk mangfold i nære populasjoner, så på bakgrunn av Y-SNP resultater, Y-STRs var . brukes til å analysere genetisk differensiering og opprinnelse blant pasienter og høyrisikogrupper (Tabell S2) Vi har lagt Y-STR data for 3 høyrisikogrupper fra vår tidligere forskning [15] og i 6 tidligere publiserte populasjoner: Zhejiang [20] Henan [21], Dongbei [22], Tianjing [23], Hunan Han [24] og tibetanske folket [25].

i hvilken grad av genetisk differensiering av befolkningen ble anslått av R

st statistikk på grunnlag av de Y-STR haplotyper ved bruk av Alrequin 3,1. En nabo-sammenføyning treet ble konstruert i henhold til R

st avstand matrise med bruk av MEGA 5.1. Et nettverk av Y-STR data ble konstruert ved bruk av Network 4.6.1.1 (www.fluxus-engineering.com). I nettverkskartet, personer med de samme mutasjonene av Y-STRs var i samme node, og en node kan generere andre noder på grunn av gradvis Y-STR mutasjon [15].

Diskusjoner

Chaoshanese er etterkommere av nord-sentrale Kina Han-folk. Nord-sentral kinesiske Han begynte å migrere inn i det sørlige Kina begynner i Qin-dynastiet (216 f.Kr.). Han-dynastiet (206 f.Kr.-220 e.Kr.) opplevde en annen 3 bølger av storskala migrasjon i det sørlige Kina på grunn av nedgangen i den innfødte befolkningen i dette området. Gradvis, over 2000 år, den nordlige sentrale kinesiske Han ble den viktigste befolkningen – Chaoshanese i Chaoshan regionen, heter Helao, som direkte migrert fra nord-sentrale Kina, eller Fulao, som først flyttet til Fujian Minnan, deretter til Chaoshan med godt lysen språk og skikker fra nord-sentrale Kina. De Taihangfjellene folk i nord-sentrale Kina, Fujian Minnan og Chaoshan områdene godt kjent for sin høye forekomsten av EF [15].

Med utviklingen av diagnostiske metoder og forbedret epidemiologi, flere GCC tilfeller har blitt bekreftet i disse områdene. EF og GCC er de 2 mest vanlige kreftformer i disse 3 områdene. Vår tidligere genetisk forskning viste at høyrisikogrupper i disse 3 områdene deler et felles opphav [15], [16]. I denne studien, studerte vi Y-kromosom haplogrupper av EU og GCC pasienter fra Chaoshan og Taihangfjellene områder å utforske videre fars genetisk bakgrunn av pasientene. Vi sammenlignet data med 2 lavrisiko Chaoshan Hakka og hun populasjoner og 3 høyrisikogrupper. Vi først analysert fordelingen av Y-SNP haplogrupper blant de undersøkte bestandene. Den haplogruppe med høyest frekvens deles av Chaoshan EC og GCC pasienter var O3a3c1-M117, en av de nord Han dominerende haplogroups, som også var høy i Taihangfjellene pasienter, men lav i Chaoshan Hakka og hun populasjoner. Sammenlignet med Chaoshan pasienter og høyrisikobefolkningen, Chaoshan Hakka og hun populasjonene viste en relativt høyere frekvens av den sørlige innfødte dominerende O1 *. I likhet med Taihangfjellene pasienter, Chaoshan pasientene viste nord Han dominerende haplogroups som høyeste frekvens haplogruppene, så Chaoshan og Taihangfjellene pasientene er relativt nært beslektet.

På Y-SNP prinsipal komponentanalyse, fars struktur for Chaoshan pasienter avvek fra det som for Chaoshan Hakka og hun bestander, selv om de er i geografisk nærhet og Chaoshan Hakka er også etterkommere av nord-sentrale kinesiske Hans. Chaoshan pasienter gruppert tett med Fujian og Henan høy-risiko befolkning og pasienter, selv om de er geografisk fjernt. Chaoshan Hakka og hun populasjoner klynget sammen, som er enig med historiske opptegnelser. Chaoshan Hakka hovedsakelig bor fjellområdet, for mer genflyt med Hun befolkningen, som også bor i fjellområdene. Y-SNP haplotype frekvensene ble positivt korrelert blant pasienter, noe som ytterligere støtter deres nære genetiske tilhørighet. Resultatene av hierarkisk klyngeanalyse støttet også nært genetisk slektskap mellom pasienter og høyrisikogrupper. Fylogenetisk, pasientgrupper ble mer nært knyttet til hverandre enn med høy risiko befolkningen (Fig. 4). Nettverksanalyse (Fig. 5) antydet at patrilineal avstamning av haplogroup O3a3c1-M117 personer var Taihangfjellene og Fujian høyrisikopersoner og Chaoshan EC pasienter som utgjorde den sentrale noden, og pasienter i de O3a3c1-M117 individer fra to undersøkte områdene var i stor grad fra en ett-trinns naboer som inneholder en Chaoshan høy risiko individuell og en Chaoshan GCC pasient. Den haplogruppe O3a3c1-M117 nettverksanalyse viste variasjon mellom bestander, men også en høy grad av pasientspesifikke underlaget. Alle 14 GCC pasienter og 5 av de 11 pasientene EC falle inn i en klynge (fig. 5, sirkel). Haplogruppe O3a3c1-M117 pasienter kan ha sin opprinnelse fra samme forfedrenes haplogruppe. Derfor foreslår vi patrilineal genetisk slektskap mellom de 2 geografisk adskilte GCC og EC pasienter i Kina.

Nye genom-wide association studier fra Kina høyrisikoområder viste signifikant sammenheng med en variant på 10q23 i PLCE1 og begge esophageal plateepitelkarsinom og mage Cardia adenokarsinom, som fremhever de vanligste genetiske mekanismer som kan bidra til etiologien av både kreft [29]. Selv om EU og GCC er patologisk tydelig, de epidemiologiske studier [2] – [9], genom-wide association studier og studien alle støtter at EC og GCC kan dele felles genetiske struktur. EC og GCC er anatomisk tilstøtende, og de har lignende embryogenese. De er utsatt for lignende miljøtilstanden i løpet av livet. Men hvorfor de kan bli berørt av et felles genetisk struktur er fortsatt ukjent.

Vi foreslår at EU og GCC ikke oppstår tilfeldig i høyrisikogrupper, men er nært forbundet med en viss patrilineal bakgrunn struktur og disse relaterte pasienter kan arve en sykdomsfremkallende genetisk struktur fra deres felles forfedre.

i sammendraget, er det patrilineal genetiske struktur Chaoshan og Taihangfjellene pasienter lignende, og pasienter har nærmere slektskap med hverandre enn med bestander med høy risiko. EF og GCC pasienter dele en siste felles stamfar. I kontrast til Chaoshan Hakka og hun populasjoner har en relativt fjernt forhold til Chaoshanese mennesker, noe som kan forklare delvis den høye forekomsten av EF og GCC i Chaoshanese mennesker.

Hjelpemiddel Informasjon

Tabell S1.

Rådata for individuell Y-SNP

doi:. 10,1371 /journal.pone.0081670.s001 plakater (XLS)

Tabell S2.

Rådata for individuell Y-STR

doi:. 10,1371 /journal.pone.0081670.s002 plakater (XLS)

Legg att eit svar