PLoS ONE: Y-kromosom Bevis for felles opphav av tre kinesiske populasjoner med høy kreftfaren

Abstract

Høy forekomst av spiserørskreft (EF) finnes i mennesker i Henan Taihangfjellene, Fujian Minnan, og Chaoshan regioner i Kina. Historiske rekorder beskrive store bølger av populasjoner migrerer fra nord-sentrale Kina (Henan og Shanxi Hans) gjennom kyst Fujian-provinsen til Chaoshan vanlig. Selv om disse regionene er geografisk fjernt, hypotese vi at EF høyrisikogrupper i disse tre områdene kunne dele et felles opphav. Derfor brukte vi 16 østasiatiske spesifikke Y-kromosomet biallelic markører (enkeltnukleotidpolymorfi, Y-SNPs) og seks Y-kromosom kort tandem repeat (Y-STR) loci å antyde opprinnelsen til EC høyrisiko Chaoshan befolkningen ( CSP) og genetiske forholdet mellom CSP og EF høyrisiko Henan Taihangfjellene befolkningen (HTMP) og Fujian befolkningen (FJP). De dominerende haplogroups i disse tre bestandene er O3 *, O3e *, og O3e1, med ingen signifikant forskjell mellom populasjonene i hyppigheten av disse genotyper. Frekvensdistribusjon og prinsipal komponent analyse viste at CSP er nært knyttet til den HTMP og FJP, selv om det tidligere er geografisk nærmere andre populasjoner (Guangfu og Hakka klaner). Den FJP er mellom CSP og HTMP i hovedkomponent tomten. CSP, FJP og HTMP er mer nært knyttet til kinesiske Hans enn til minoriteter, bortsett Manchu kinesisk, og er etterkommere av Sino-tibetanere, ikke Baiyues. Korrelasjonsanalyse, hierarkisk clustering analyse, og fylogenetisk analyse (nabo-sammenføyning treet) all støtte nært genetisk slektskap mellom CSP, FJP og HTMP. Nettverket for haplogruppe O3 (inkludert O3 *, O3e * og O3e1) viste at HTMP har høyest STR haplotype mangfold, noe som tyder på at HTMP kan være en stamfar befolkning for CSP og FJP. Disse funnene støtter potensielt viktig rolle felles opphav i å forstå mer om genetisk mottakelighet i EF etiologi i høyrisikogrupper og har implikasjoner for fastsettelse av molekylære grunnlaget for denne sykdommen

Citation. Huang H, Su M Li X, Li H, Tian D, Gao Y, et al. (2010) Y-kromosom Bevis for felles opphav av tre kinesiske populasjoner med høy kreftfaren. PLoS ONE 5 (6): e11118. doi: 10,1371 /journal.pone.0011118

Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, USA

mottatt: 24 mars 2009; Godkjent: 19 mai 2010; Publisert: 15 juni 2010

Copyright: © 2010 Huang et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Dette arbeidet ble støttet av Natural Science Foundation National of China (nr 30210103904) og Foundation i Guangdong-provinsen, Kina (No. A1080203) Key Natural Science. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

den ikke-rekombinerende delen av Y-kromosom (NRY) har unike egenskaper, inkludert farsarv, fravær av rekombinasjon ved meiose, og en relativt lav sannsynlighet for tilbakevendende mutasjoner, dermed endowing det med population- og området- spesifikke polymorfismer. Således er NRY spesielt nyttig for studier av humane og evolusjon populasjonsgenetikk. To typer polymorfismer finnes på NRY: enkeltnukleotidpolymorfi (SNPs) og kort tandem repeat (STR) loci, hver med ulike mutasjon priser og mekanismer. Følgelig, kombinert analyse ved hjelp av disse 2 typer av polymorfe markører øker effekten av NRY for bruk i sporing menneskets utvikling samt migrasjon gjennom ulike geografiske steder og tidsskalaer, og derfor kan også være effektive i skildrer de faderlige strukturer av populasjoner.

Ja, i 1999, Su et al. [1] konstatert 17 Y-kromosom haplogrupper basert på 19 østasiatiske-spesifikke biallelic markører som avslører de faderlige strukturer av populasjoner i Øst-Asia. Ved å undersøke 63 populasjonsprøver fra Asia, Afrika, Amerika, Europa og Oseania, forfatterne fant at sørøst populasjoner i Øst-Asia er mer genetisk mangfoldig enn er nord seg og foreslo at Østasiater stammer fra sør. På bakgrunn av Y-SNP og Y-STR varians, konkluderte de at den første oppgjør av moderne mennesker i Øst-Asia inntraff ca 18,000-60,000 år siden [1].

Esophageal kreft (EC) er en av de mest vanlige dødskreftformer verdensom [2] og har høy forekomst i enkelte geografiske regioner. I Kina, de fleste EU-pasienter lever i den såkalte «EC belte», som strekker seg fra det sentrale Kina vestover gjennom Sentral-Asia til Nord-Iran [3] – [4]. Det mest kjente området for høy EC Risiko er nord-sentrale Henan Taihangfjellene området (HTM befolkningen [HTMP]), ligger blant Henan, Hebei, og Shanxi provinser (Fig. 1). Mindre kjente regionene er den sørøstlige kyst Chaoshan Plain i Guangdong-provinsen (CS befolkningen [CSP]) og Minnan område i Fujian-provinsen (FJ befolkningen [FJP]). Selv om de 2 siste provinsene er relativt geografisk isolert fra det indre av Kina, er de fortsatt anses å ligge i EF belte og bevis eksisterer for en høy EC risiko innenfor disse områdene [5] – [6]. For eksempel, i en relativt isolert distrikt i CSP-Nanao Island-årsgjennomsnittet råolje forekomsten av EC var 103.98 /100.000 mennesker fra 1995 til 2004; de alders standardisert forekomsten av EC var 72~150 /100 000 menn og 26~64 /100000 kvinner, med en betydelig økt forekomst for menn, men ikke kvinner mellom 1995 og 2004 [5]. For FJP, 18 fylker rapporterte en dødelighet for EC større enn 30 /100.000 mennesker [7], som er minst det dobbelte av landsgjennomsnittet [8]. CSP, FJP og HTMP er tilhører Nordøst-asiatiske grupper.

Piler viser nord-sør vandringer Han innbyggere fra nord-sentrale Kina ifølge historiske kilder. CSP, Chaoshan EC høy-risiko befolkning; FJP, Fujian EC høy-risiko befolkning; HTMP, Henan Taihangfjellene EC høyrisiko befolkningen.

De geografiske av sør-strandsonen (Chaoshan og Fujian områder) og nord-sentrale Kina (Henan og Shanxi) er tydelig, men populasjoner innenfor disse områdene har en høy risiko for EC [9]. Ifølge historiske poster [10] – [11], Han som bor i nord-sentrale Kina (Henan og Shanxi Hans) migrert kontinuerlig i Chaoshan området gjennom Fujian-provinsen for å unnslippe krig og hungersnød, og etter hvert ble den dominerende innbyggerne i Chaoshan. Videre har familiær aggregering av EC blitt observert i nord-sentrale Kina og Chaoshan området [12] – [14]. Disse funnene støtter potensielt viktig rolle felles opphav bidra til genetisk mottakelighet for EF i høyrisikogrupper i Kina.

Derfor hypotese vi at disse tre EC populasjoner med høy risiko kan være genetisk beslektet. For å teste vår hypotese om felles opphav, analyserte vi 16 østasiatiske-spesifikke biallelic markører [1], [15] (SNPs) og sju Y-STR loci ble analysert for å undersøke NRY strukturen i EF høyrisiko CSP, FJP og HTMP. Faktisk haplogroup hyppighet og hovedkomponent, korrelasjon, hierarkisk clustering, fylogenetisk (nabo-sammenføyning tre) og nettverk analyserer all støtte nært genetisk slektskap av CSP, FJP og HTMP. Fastslå genetisk bakgrunn av EF-pasienter kan bidra til å avklare de molekylærgenetiske mekanismer for esophageal kreftutvikling, bedre vurdering av risikofaktorer hos personer fra høyrisikogrupper, og fremme gjennomføringen av effektiv screening og forebyggende tiltak.

Resultater

Distribusjon av NRY haplogruppene i de tre EU-høyrisikogrupper i Kina

haplogroup hyppighet av de tre EU-høyrisikogrupper var basert på Y-SNP skrive. Som vist i tabell 1, ble 10 Y- kromosom haplogrupper identifisert. Y-kromosom haplogrupper av de tre undersøkte bestandene hovedsakelig klynger seg rundt O3 *, O3e *, og O3e1, som er de karakteristiske haplogroups for nord Østasiater; den totale frekvensene var 65,16%, 66,21% og 60,42% for CSP, FJP og HTMP, henholdsvis, og var ikke signifikant forskjellig mellom populasjoner (2-sidig

X

2 = 4,213,

p

= 0,122). Disse resultatene gir bevis for genetisk slektskap mellom disse tre EC høyrisikogrupper. O *, O1 *, O2a *, og O2a1, de fire vanligste haplogruppene i de sørlige Østasiater, var hyppigere i CSP og HTMP enn i FJP (2-sidig

X

2 = 8,355,

p

= 0,015). C *, D1, og F * haplogruppene var mer vanlig i den nordlige enn sørlige gruppen, og deres kombinerte frekvensene var betydelig lavere i CSP enn i de to andre (2-sidig

X

2 = 11,327,

p

= 0,003). Disse resultatene støtter hypotesen om genflyt mellom HTMP, FJP, og CSP.

PC analyse viser nært slektskap mellom de tre EU-høyrisikogrupper

PC tomter på Y- SNP og Y-STR frekvenser er vist på fig. 2 og 3, henholdsvis, og er basert på genotyping resultatene fra de tre EU-høyrisikogrupper og ytterligere data fra andre kinesiske populasjoner. Fig. 2 og 3 er de to-dimensjonale kurver for komponent 1 (PC1) og komponent 2 (PC2). Den kumulative bidrag PC1 og PC2 stod for 79,88% og 76,88%, henholdsvis av den totale variasjoner fra henholdsvis Y-SNP og Y-STR,. Som vist på fig. 2, de tre EU-populasjoner med høy risiko i hovedsak danne en klynge. To nord Hans populasjoner (merket 4 og 5) og Hakka (merket 13) befolkningen, to sørlige Hans (merket 22 og 23) klynge sammen, henholdsvis. Resten av nord Hans og sørlige Hans danne en annen gruppe. EF høy risiko CSP er isolert både fra Guangzhou Han (merket 15) og Hakka populasjoner. De tre EC høyrisikogrupper og Manchu danner en distinkt klynge (Fig. 3). De er mer nært knyttet til kinesiske Hans enn til de andre seks minoriteter. Seks minoritets nasjonaliteter og en Southern Han (merket 4) er spredt. Resten av de nordlige og sørlige Hans danne en annen gruppe.

I prinsipal-komponent tomten, jo mindre avstand mellom populasjoner, jo nærmere forholdet deres. Generelt 23 bestander er delt inn i 4 grupper: de tre EU høyrisikogrupper, to Northern Han populasjoner (merket 5 og 6) og Hakka befolkning, to Southern Han populasjoner (merket 22 og 23) og resten av Nord-Han og Southern Han klynge, respektivt. 1, Chaoshan EC høy-risiko befolkning; 2, Fujian EC høy-risiko befolkning; 3, Henan Taihangfjellene EC høyrisiko befolkningen; 4, Hebei Han; 5, Liaoning Han; 6, Xinjiang Han; 7, Shangdong Han; 8, Gansu Han; 9, Shanxi Han; 10, Neimeng Han; 11, Henan Han; 12, Hakka Han; 13, Hunan Han; 14, Hubei Han; 15, Guangzhou Han; 16, Zhejiang Han; 17, Jiangxi Han; 18, Shanghai Han; 19, Anhui Han; 20, Jiangsu Han; 21, Yunnan Han; 22, Guangxi Han; 23, Sichuan Han. 4-11 refererer til Nord-Han og 12-23 til Southern Han.

Dette kartet står for 76,88% av den opprinnelige genetisk variasjon. De tre EC høyrisikogrupper og Manchu skjema 2 klynger; de tre nord Han (merket 10-12) og fem Southern Han populasjoner (merket 5-9) danner en annen gruppe. De gjenværende bestandene er spredt. 1, Chaoshan EC høy-risiko befolkning; 2, Fujian EC høy-risiko befolkning; 3, Henan Taihangfjellene EC høyrisiko befolkningen; 4, Fujian Han; 5, Anhui Han; 6, Yunnan Han; 7, Henan Han; 8, Zhejiang Han; 9, Guangzhou Han; 10, Dongbei Han; 11, Beijing Han; 12, Tianjing Han; 13, tibetansk; 14, Uygur; 15, Krigiz; 16, Manchu; 17, Shui; 18, Naxi; 19, Zhuang. 4-9 refererer til Southern Hans, 10-12 til Nord-Hans, 13-17 til nordminoritets nasjonaliteter, 18-19 til Southern minoritets nasjonaliteter.

korrelasjonsanalyse viser positive assosiasjoner mellom de tre EC høy -risk populasjoner og kinesiske Hans

For ytterligere å belyse forholdet mellom populasjoner, vi utført korrelasjonsanalyse basert på Y-SNP haplogruppe og Y-STR haplotype frekvenser (tabell 2 og 3, henholdsvis). Signifikant positiv korrelasjon eksisterte blant de tre EU-høyrisikogrupper. Korrelasjonskoeffisienten mellom EF høy risiko CSP og FJP var høyere enn mellom CSP og EF høy risiko HTMP. Videre viser tabell 2 et positivt korrelert mellom HTMP og det meste av den kinesiske Hans, en positiv korrelasjon mellom FJP og bare Liaoning Han, og en positiv korrelasjon mellom CSP og Hakka, Hebei, og Hunan Hans (tabell 2) . På grunn av dårlig kommunikasjon og transport i fortiden, kan Chaoshan og Fujian områder har blitt et relativt lukket samfunn, med mindre genflyt med andre bestander, og fordi EU høyrisiko HTMP ligger i det sentrale Kina, kan denne bestanden har hatt flere muligheter å kommunisere med andre kinesiske Hans. Tabell 3 viser en positiv sammenheng mellom de tre høyrisikogrupper og de kinesiske Hans. Uventet, dataene viser en positiv sammenheng mellom de tre undersøkte populasjoner og Manchu, som er en nordlig minoritetsbefolkningen. Ingen signifikant korrelasjon ble funnet mellom andre populasjoner og de tre EU-høyrisikogrupper. Avviket mellom data i tabell 2 og 3 kan være relatert til de sammenlignede befolkninger og de forskjellige egenskapene til MT-rapporter og SNPs. SNPs er preget av lav mutasjonsraten og lav sannsynlighet for rygg og parallelt mutasjon, noe som gjør SNP analyser egnet for å spore tidlige demografiske begivenheter i menneskehetens historie. Mutasjonsraten MT-rapporter er mye høyere enn for SNPs, og derfor det tidligere er egnet for å undersøke detaljer om demografiske hendelser oppstår på en nyere tidsskala.

De tre EC populasjoner med høy risiko klynge i Sino-tibetanske språkfamilien

For å avgrense den genetiske forholdet mellom de tre EU-høyrisikogrupper og populasjoner basert på andre språkfamilier, vi utført en ytterligere prinsipal komponent analyse ved hjelp av data, forut av staten Key Laboratory of Genetic Engineering og Senter for Antropologiske studier (School of Life Sciences, Fudan University), som inkluderer Y-SNP data for 64 kinesiske bestander som tilhører de 5 språkfamilier: Sino-tibetanske, Hmong-Mien, Daic ( Baiyue), austronesisk, og Austroasiatic.

Y-kromosom haplogroup profiler identifisert i disse populasjonene ble behandlet som input vektorer for PC analyse. Den kumulative bidrag PC1 og PC2 stod for 54,85% av den totale variansen. En PC prikkplott ble trukket med verdier for PC1 og PC2 som X og Y akser, henholdsvis. Som vist på fig. 4, er PC1 verdier knyttet til en strammere gruppering av bestander som tilhører den Sino-tibetanske språkfamilien; høye PC2 verdier er assosiert med en mer spredt fordeling av Sino-tibetanske populasjoner. De tre EC høyrisikogrupper er samlet i den høyre delen av PC tomten, blant de mest intense fordelingen av Sino-tibetanere.

Chaoshan, populasjoner Henan Taihangfjellene og Fujian EC høyrisiko er gruppert sammen og ligger blant Sino-tibetanske populasjoner, noe som antyder et nært genetisk relasjon mellom dem.

korrelasjonsanalyse ble utført for å søke opprinnelsen til hver PC (tabell 4). PC1 viste en signifikant negativ korrelasjon med PC2 (r = -0,44,

P

0,001). Analyse av PC1 viste at antallet negativt korrelert haplogruppene, til tross for deres svake korrelasjoner, var større enn den av de positive grupper. O3e * er den eneste haplogruppe med en signifikant positiv korrelasjon med PC1 (r = 0,61,

P

0,05). For PC2, antall positivt og negativt korrelert haplogrupper var lik. O2a * og O1 representerer de sørlige innfødte haplogroups i østasiatiske befolkningen og O3e * er trolig en nordlig haplogruppe. Som vist i tabell 4, er fordelingen av O3e *, O2a *, og O1 motsatt med PC1 og PC2. O3e * var positivt korrelert med PC1, men O2a * og O1 ble negativt korrelert. O2a * og O1 var positivt korrelert med PC2, men O3e * er negativt korrelert. Dette funnet innebærer at disse tre haplogrupper er de viktigste komponentene i PC1 og PC2. Av notatet, analyse av kun haplogruppe O3e * var i samsvar med fordelingen av Sino-tibetanske populasjoner vist i fig. 4. Videre de tre EU-populasjoner med høy risiko er nesten på toppen verdien av PC1 og klynge med noen Sino-tibetanske populasjoner, noe som tyder på at bestandene EF høyrisiko er alle typiske Sino-tibetanske populasjoner.

hierarkisk klyngeanalyse viser isolering av EC høyrisiko cluster fra andre populasjoner

for ytterligere å belyse tilhørighet blant de tre EU-høyrisikogrupper og andre kinesiske bestander, ble hierarkisk klyngeanalyse utført med gjennomsnittlig kobling (mellom grupper) basert på Y-SNP data. For å illustrere klyngen av de tre høyrisikogrupper og dens forhold til andre Hans, Baiyue og Hmong-Mien grupper, vi inkludert 20 kinesiske Hans [16] – [18], data for Liaoning, Guangzhou og Guangxi Hans ble levert av staten Key Laboratory of Genetic Engineering og Senter for Antropologiske studier (School of Life Sciences, Fudan University), to Hmong-Mien (Hun [19] og Yao [1]) og to Baiyue populasjoner (Zhuang og Dong) [1] ( fig. 5). Informasjonen om data for sammenligning, er vist i tabell 5. hierarkisk klyngeanalyse belyser det genetiske avstanden mellom populasjoner. På fig. 5, er EF høyrisiko CSP genetisk like ved EC høy risiko FJP og HTMP. Den genetiske avstanden mellom FJP og CSP er kortest. Videre er det tre isolert fra andre populasjoner, noe som innebærer en bestemt migrasjon hendelse i antikken.

Viser affinitet mellom de tre EU-høyrisikogrupper. De fleste kinesiske Hans er gruppert i en stor klynge i den øvre delen av dendrogram.

Genetisk avstand analyse og konstruksjon av et fylogenetisk tre

For å undersøke de genetiske forholdene ytterligere mellom de tre EC høyrisikogrupper, ble Rst avstander mellom par av populasjoner beregnet på grunnlag av syv Y-MT ved bruk av Alrequin 3,1 programvare. Seks flere kinesiske populasjoner ble inkludert i denne analysen: Zhejiang [20], Henan [21], Dongbei [22], Tianjing [23], og Hunan Hans [24], og tibetansk [25], som alle tilhører den Sino -Tibetan språkfamilie, som gjør de tre EU-høyrisikogrupper. Fra Rst avstand matrise ble en unrooted nabo-sammenføyning tre konstruert med bruk av MEGA 2.1-programvaren (Fig. 6). EF høy risiko SSP var nært knyttet til EF høy risiko FJP og HTMP. Alle tre er nærmere kinesiske Hans enn til den tibetanske befolkningen. De Hunan, Tianjing, Dongbei, og Henan Hans er gruppert sammen.

Denne unrooted treet ble konstruert ved bruk av genetiske avstander mellom populasjoner. Viser at EC høy risiko Chaoshan er svært nær EC høy risiko FJP og at to er gruppert med EC høy risiko HTMP. Hunan, Tianjing, Dongbei, og Henan Hans er gruppert i den øvre delen av treet.

Nettverk analyse av Y-STR haplogruppene av de tre EU-høyrisikogrupper

høyeste haplogruppe frekvens deles av CSP, FJP og HTMP var haplogruppe O3. Nettverket for haplogruppe O3 ble ytterligere bygget ved hjelp av Network 4,516 programvare (www.fluxus-engineering.com) basert på alle haplogruppe O3 (inkludert O3 *, O3e * og O3e1 *) enkeltpersoner for å analysere forholdet mellom CSP, FJP og HTMP. Som vist på fig. 7, 29 personer fra HTMP har 26 Y-STRs, den høyeste Y- MT-frekvens av alt, hvorav seks er felles for CSP og /eller FJP. 58 personer fra SSP har 47 Y- STRs, 49 personer fra FJP har 37 Y MT-rapporter. Y- STR frekvensen for CSP er litt høyere enn den til FJP, som kan være på grunn av den geografiske nærhet av disse to områdene, og mer hyppig gene flyte mellom dem.

I nettverket, HTMP ha mer STR haplogroup polymorfismer enn CSP og FJP. Seks Y-STRs av HTMP er del av CSP og /eller FJP. Sirkler representerer linjene, er området proporsjonal med frekvensen, og fargen indikerer befolkning opprinnelsesland.

Diskusjoner

Våre hypoteser for denne studien, som EF høyrisikogrupper i Henan Taihangfjellene , Fujian Minnan, og Chaoshan regioner i Kina kunne dele et felles opphav, var basert på historiske registreringer av migrasjon over Kina. I Sør-Kina (Guangdong distrikt) de Baiyue bestander dannet den tidligste bosetningen i moderne historie. Før 2200 f.Kr., en gren av Baiyue befolkningen-the Minyue-var hovedgruppen bor i Chaoshan kystnære områder. Den nord-sør strategiske ekspansjon startet av keiser Qin Shi Huang initiert store sørover vandringer i Sentral-Kina Hans fra 214 f.Kr. videre [26]. Under Han-dynastiet (206 BC~220 AD), tre bølger av store vandringer i det sørlige Kina førte til en nedgang i den innfødte befolkningen i dette området. Som registrert i stamtavler og gamle inskripsjoner under den nordlige Song-dynastiet (960~1127 AD), et stort antall sørlige Fujian folk, spesielt fra Quanzhou og Putian, slo seg ned i Chaoshan området [27]. Gradvis, over en periode på 2000 år, ble dette den store befolkningen i Chaoshan region (kalt Helao eller Fulao folkeslag), kommer i stor grad fra Henan og Shanxi via Fujian med godt vedlikeholdt språk og skikker fra nord-sentrale Kina. På grunn av geografisk isolasjon og den historiske vanskeligheter med å reise, ble Helao /Fulao en relativt isolert befolkning. Foreløpig fleste Fujian og Chaoshan populasjoner tror de er etterkommere av nord-sentrale Kina Hans, som er støttet av genealogiske opptegnelser, steintavler, og arkeologiske funn [28]. Vårt team har samlet og analysert 40 genealogies av forskjellige etternavn i Chaoshan områder. Nesten alle forfedrene til disse 40 genealogies kommer fra Nord-sentrale Kina. De fleste av dem først avgjort i Fujian, deretter flyttet til (data upubliserte) den Chaoshan området. Dette resultatet bekreftes også historisk rekord og vår hypotese.

Forekomst og dødelighet for EC er svært høy i CSP, FJP, og HTMP områder. Vi foreslår at Chaoshan strand regionen er et EF høy risiko området på grunn av den genetiske bakgrunnen til CSP og FJP deles med de i nord-sentrale Kina. Forfedrene til EF høyrisiko CSP kan ha kommet fra EC høyrisiko HTMP via FJP. Denne studien gir genetisk bevis som støtter denne hypotesen

Generelt populasjoner som deler lignende mønstre av haplogruppe distribusjon vil sannsynligvis ha en relativt nær genetisk sammenheng. I denne studien, de tre EU-populasjoner med høy risiko ligner hverandre i fordelingen av haplogruppene O3 *, O3e * og O3e1 (tabell 1), noe som antyder at de er relativt nært beslektet. PC og korrelasjon analyser ble også utført for å ytterligere verifisere genetisk slektskap mellom de tre EU-høyrisikogrupper og andre grupper. Som vist i PC analyse, faderlig struktur for EC høy risiko CSP er forskjellig fra det som for Guangzhou og Hakka Hans, selv om de er i geografisk nærhet og alle anser seg selv etterkommere av nord-sentrale Kina Hans. I motsetning til EF høy risiko CSP tett gruppert med EF høy risiko FJP og HTMP, selv om HTMP og CSP er geografisk disjunct. I tillegg korrelasjonsanalyse basert på Y-SNP haplogruppe og Y-STR haplotype frekvenser avdekket en positiv korrelasjon mellom de tre EU-høyrisikogrupper, noe som ytterligere støtter deres nære genetisk slektskap.

Som historisk registrert to årtusener siden, sørlige Kina ble opprinnelig bebodd av de sørlige innfødte, inkludert de snakker Daic (Baiyue), østerriksk-asiatiske, og Hmong-Mien språk [29] – [30]. Derfor følger vi Daic, Hmong-Mien, Sino-tibetanske, austronesisk, og Austroasiatic bestander i PC analyse for sammenligning. Resultatene i fig. 4 og korrelasjonsanalyse (tabell 4) viser at EF høy risiko CSP er relatert til Sino-tibetanere, ikke Baiyues, som er konsistent med migrasjonshistorie av CSP. Resultatene av hierarkisk clustering analyse støtte videre utgangen genetisk slektskap mellom de tre EU-høyrisikogrupper. Videre våre resultater viser også at disse tre bestandene er nærmere Yunnan Han og to Baiyue populasjoner (Zhuang og Dong) enn med andre kinesiske Hans, som antyder genflyt mellom dem. Fars genetiske struktur av de tre EU-høyrisikogrupper er forskjellig fra de andre kinesiske Hans. Fylogenetisk slektskap mellom de tre undersøkte bestandene ble videre avdekket i en nabo-sammenføyning tre (Fig. 6). Nettverket for haplogruppe O3 (inkludert O3 *, O3e * og O3e1) viste at HTMP har en høyere STR haplotype mangfold enn CSP og FJP, mens deling noen STR mutasjoner med CSP og FJP, noe som tyder på det nære forholdet mellom dem og videre som tyder på at HTMP kan være en stamfar befolkning for CSP og FJP. Samlet utgjør disse funnene støtter hypotesen om at EF høyrisiko CSP aksjer vanligste genetiske egenskaper med EC høy risiko FJP og HTMP, og at de kan dele en siste felles stamfar. Uventet, fant vi en positiv sammenheng mellom de tre EU-populasjoner og Manchu, en nordlig minoritetsbefolkningen. Grunnen til dette affinitet er ukjent, men antyder genflyt mellom disse gruppene.

Selv om vi brukte to typer Y-kromosom polymorfe markører og viste konsistente resultater fra flere analyser, populasjoner fra andre EU høyrisikoområder var ikke inkludert i denne studien, slik at vi ikke kan fastslå om alle bestandene EC høyrisiko deler en felles genetisk bakgrunn. For ytterligere å undersøke dette aspektet, er det nødvendig med en storstilt studie av EF høyrisikogrupper.

I sammendraget, patrilineal genetiske strukturen i EC høyrisiko CSP, antyder HTMP, og FJP en opprinnelse i genetisk bakgrunn av EF høyrisiko CSP. De tre EC høyrisikogrupper i denne undersøkelsen synes å dele en lignende patrilineal genetisk bakgrunn som kan forklare, i det minste delvis, den høye forekomsten av EC i disse områder i Kina. I hvilken grad andre faktorer som miljø og skikker kan bidra til den høye forekomsten av EC gjenstår å bli utforsket.

Materialer og metoder

Prøvetaking og DNA-ekstraksjon

blod~~POS=TRUNC prøver~~POS=HEADCOMP av 211 ubeslektede friske menn ble samlet inn fra de tre EU høyrisikoområder i Kina i løpet av 2002-2004; 89 prøver var fra Chaoshan området, 48 fra Henan Taihangfjellene området og 74 fra Fujian området (Minnan område). Alle individer ga sitt samtykke før de ble inkludert i studien. Studien ble godkjent av de etiske gjennomgang komiteer for medisinsk College of Shantou University. Genomisk DNA ble ekstrahert fra fullblod ved standard fenol /kloroform fremgangsmåter [31]. DNA-prøver ble lagret ved -20 ° C etter ekstraksjon.

Genotyping av Y kromosom SNPs og STRs

Tre strategier ble brukt til å skrive Y-SNPs og Y-MT-rapporter. SNP’er uten endringer lengde (basesubstitusjoner) ble genotypet av en PCR-basert rflp (PCR-RFLP) -metoden (primer informasjon, restriksjonsenzymer, mønster av polymorfisme, og PCR-betingelser finnes i tabell 6) [17], [32 ]. SNP’er med lengde variasjon (for eksempel delesjon eller innskudd) ble skrevet av fluorescens-PCR (primer informasjon og PCR-betingelser finnes i tabell 7), og fluorescensmerkede ekstensjonsprodukter ble underkastet elektroforese på en 3 100 Genetic Analyzer (ABI Company, USA). Y-MT ble også analysert ved hjelp av denne metoden (tabell 7). Analyse av M1 polymorfisme (Alu innsetting, også kalt YAP, se tabell 6) ble ved agarosegelelektroforese direkte etter PCR [33]. Alle primere ble syntetisert ved Sangon Co (Shanghai, Kina). Restriksjonsendonukleaser ble kjøpt fra New England Biolabs, USA. Y-SNP haplogroup oppdrag var basert på skrive resultater. Fylogenetisk diagram av 17 haplogruppene definert ved 16 Y-SNPs er i fig. 8 [34].

Dette diagrammet defineres av 16 Y kromosomet biallelic markørene som er tegnet i henhold til NRY haplogruppe treet i Øst-Asia (vist i referanse 34). De siste markørene definerer haplogruppene er ved siden av grenene.

Dataanalyse

Y-SNP haplogruppe for hvert individ ble definert i henhold til genotyping resultater og fig. 7. Y-kromosom haplogrupper kan betraktes som en monophyletic klade i fylogenetisk tre (dvs. et sett av haplogruppene som omfatter alle etterkommere av deres siste felles stamfar, utledes fra de delte mutasjoner). For eksempel, O3 *, O3e *, og O3e1 * all del en T → C mutasjon ved locus M122. O3 * er nedarvet haplogruppe av M122C lene, mens O3e * og O3e1 * er 2 avledet haplogroups med flere mutasjoner, henholdsvis M134 og M117,. Haplogroup frekvensene ble beregnet og sammenlignet blant de tre EU-høyrisikogrupper. Khikvadrattester ble utført for å vurdere forskjellene i haplogruppe frekvens mellom populasjoner.

Det ble utført PC analyse og korrelasjonsanalyse for å sammenligne den genetiske tilhørighet blant de tre EU-høyrisikogrupper og andre grupper. Studien populasjoner ble definert som nord østasiatisk (NEAPs) og sørlige østasiatiske populasjoner (SEAPs) i henhold til deres geografiske steder. Yangtze-elven ble brukt som en geografisk grense for å skille NEAPs og SEAPs; NEAPs ble videre delt inn i nord Hans (NHS) og nordlige minoritets nasjonaliteter (NMNS), og SEAPs ble definert som sørlige Hans (SHS) og sørlige minoritets nasjonaliteter (SMNS). Andre Y-SNP data er tillatt for å dele de store kinesiske Han-populasjoner i 2 grupper (for detaljerte komparative data, se tabell 5): NHS, inkludert Hebei [17], Liaoning, data levert av staten Key Laboratory of Genetic Engineering og Senter for antropologiske studier (School of Life Sciences, Fudan University), Xinjiang, Gansu, Shanxi, Neimeng [16], Shandong og Henan [17] populasjoner; og SHS, inkludert Hakka [18], Hunan, Hubei, Zhejiang, Jiangxi, Shanghai, Anhui, Jiangsu, Yunnan, Sichuan [17], Guangzhou og Guangxi populasjoner, data fra Statens Key Laboratory of Genetic Engineering og Senter for Antropologiske studier (School of Life Sciences, Fudan University). Lagt til analyse var Y-STR data for 16 bestander, som var den totale befolkningsgrupper som vi kunne få fra referanser.

Legg att eit svar