Articles

mitokondriell DNA-historia för Sri Lankas Etniska människor: deras relationer inom ön och med de indiska subkontinentala populationerna

MtDNA-polymorfismer och delade haplotyper av Sri Lanka

mtDNA HVS-1 (np. 16 024 till np. 16 383 i rCRS) och en del av HVS-2 (np. 57 till np. 309 av RCRS) sekvenser erhölls från 271 individer som tillhör fem Sri Lankas etniska populationer: 75 Vedda människor, 60 Up-country singaleser och 40 Low-country singaleser, 39 Sri Lankas tamiler och 57 Indiska tamiler. De polymorfier som observerats i studien finns i kompletterande tabell S3. Deletioner observerades vid nukleotidpositionerna 16 166, 16 258 och 249 medan Infogningar påträffades vid 16 188, 16 380 och 284.

det observerades totalt 147 haplotyper i de fem Sri Lankas populationer i denna studie. Trettio av dem delades mellan minst två populationer. Vedda-befolkningen har den lägsta andelen delade haplotyper bland sina undergrupper (63%) vilket indikerar deras större genetiska mångfald bland undergrupper. Sri Lankas tamiler och indiska tamiler hade liknande delad andel (85%) medan singaleser i upplandet har lite högre antal befolkningsspecifika haplotyper (73%) än singaleser i lågt land (70%) (Tabell 1). Intressant, det högsta antalet haplotypdelning hittades mellan Vedda med singaleser i upplandet och med singaleser i lågt land. Å andra sidan fanns det ingen haplotypdelning mellan Vedda-folket med någon av tamilerna (Tabell 1).

Tabell 1 haplotypdelning och matchande sannolikheter mellan Sri Lankas populationer

Mångfaldsindex

genetisk mångfald inom undergrupperna av Sri Lankas etniska populationer bedömdes med haplotypdiversitet (H) och nukleotiddiversitet (Brasilien). Resultaten sammanfattas i kompletterande tabell S4. H varierade från 0,503-1,000 och 0,006-0,019. I allmänhet uppvisade Singalesiska (Up-country och Low-country) och tamilska (Sri Lankas och indiska) undergrupper relativt högre haplotypdiversitet (0.861–1.000) än Vedda (0.503–0.965). Trenden med nukleotiddiversitet följer haplotypdiversiteten. Högre nukleotiddiversiteter (0,009–0,019) observerades bland singaleser och tamiler. I synnerhet observerades lägre nukleotiddiversitet (0,006–0,009) i två Vedda-undergrupper (VA-råtta och VA–Dal) än i resten av Vedda-undergrupperna (0,012-0,014).

mönster av genetisk variation som avslöjas av genetiskt avstånd och fylogenetiska analyser

genetiska avstånd bland 21-undergrupper av fem etniska populationer i Sri Lanka beräknades från HVS-1 och en del av HVS-2-sekvenser som använder Tajima-Nei-metoden.27 resultatet visas i Tilläggstabell S5. Manteltestet för korrespondens mellan genetiska och geografiska minimala avstånd utfördes också, från vilket den signifikanta korrelationen mellan de två avståndsmatriserna (r=0,15; P=0,02) erhölls; resultatet föreslog att mönstret för genetisk differentiering observerad bland studerade populationer åtminstone delvis kan förklaras i ljuset av isolation-by-distansmodellen.

ett orotat grann-förenande träd konstruerades för fylogenetiska förhållanden mellan 21 undergrupper av fem etniska populationer i Sri Lanka som illustreras i Figur 2. En annan fylogenetisk konstruktion utfördes också för de fem Etniska befolkningarna när alla undergrupper inom en befolkning kollapsade; resultatet visas i Tilläggsfigur S1.

Figur 2
figure2

Unrooted neighbor-joining (NJ) träd av de 21 Sri Lankas populationer baserat på netto genetiska avstånd. (Förkortningar anges i Tilläggstabell S1).

det framgår helt klart av kompletterande figur S1 att Vedda-befolkningen var genetiskt separerad från andra Sri Lankas etniska populationer, med genetiskt avstånd mindre mellan dem. Indiska tamiler etablerade det närmaste genetiska förhållandet med sina Sri Lankas Etniska motsvarigheter. Up-country singaleser bildade nära genetiska anslutningar med Sri Lankas tamiler och lågland singaleser.

Figur 2 illustrerar mer insikter i de genetiska förhållandena mellan de studerade populationerna, med beskrivningen av genetisk variation bland undergrupper inom varje etnisk befolkning. Från detta orotade grannanslutande träd bekräftades att det fanns ett större genetiskt avstånd mellan Vedda-folket och resten av befolkningen. Två Vedda-undergrupper (VA-Dam och VA-Hen) blandades med singaleserna, både Up-country och Low-country, men inte med någon av tamiler. Tamilerna, både Sri Lankas och indiska, grupperade tillsammans. Den genetiska matrisen där de tamilska och singalesiska undergrupperna, som inte tydligt kan separeras från varandra, observerades mot en stor gren av trädet, med majoriteten av Vedda-folket mot den andra. Intressant nog var vissa Singalesiska grupper (SU-Mul, SU-Mee och SL-Lan) relativt närmare tamiler än resten av singalesiska undergrupper.

huvudkomponentanalys

nettogenetiska avstånd från HVS-1 och en del av HVS-2-sekvenser (kompletterande tabell S5) och från haplogruppfördelningsfrekvenser (kompletterande tabell S6), bland 21 undergrupper av fem etniska populationer i Sri Lanka behandlades som ingångsvektorer för PCA. Figur 3 visar PCA-kartan konstruerad från haplogruppfördelningsfrekvenser, för de två första huvudkomponenterna, som tillsammans står för 82,44% av den totala variansen. Majoriteten av Vedda-undergrupperna (utom VA-Dam) var väl separerade från andra etniska befolkningar i Sri Lanka på den första PC-axeln. Deras separation från andra etniska populationer förlängs ytterligare på den andra PC-axeln. Majoriteten av singalesiska och tamilska undergrupper bildar nära genetiska proximiteter mellan sig på båda PC-axlarna. Stort undantag från denna kluster finns i SU-Thu. Det var uppenbart att singaleser i upplandet är genetiskt närmare Sri Lankas tamiler. Å andra sidan, Sri Lankas tamilska undergrupper var närmare varandra jämfört med indiska tamiler. Generellt sett var Vedda-undergrupper mer spridda på PCA-kartan än inom någon annan etnisk befolkning, vilket återspeglade större mångfald bland dem. PCA-karta konstruerad från nettogenetiska avstånd från HVS-1 och en del av HVS-2-sekvenser, vilket överensstämmer med PCA-kartan konstruerad från haplogruppfördelningsfrekvenser, visas också i Tilläggsfigur S2.

Figur 3
figure3

Principal component analysis (PCA) karta över de 21 Sri Lankas subpopulationer baserade på netto genetiska avstånd härledda från haplogruppfördelningsfrekvenser. (Förkortningar anges i Tilläggstabell S1). En fullfärgsversion av denna figur finns tillgänglig på Journal of Human Genetics journal online.

PCA utvidgas ytterligare till att omfatta olika andra etniska populationer från den indiska subkontinenten (kompletterande tabell S2) Figur 4. Resultatet som visas i Figur 5 stod för 52,59% av den totala variationen. Alla singalesiska och tamilska undergrupper blandas väl med majoriteten av de indiska subkontinentala populationerna och bildar en stor genetisk matris. Indiska tamiler separerades dock från resten av Sri Lankas undergrupper, utom SU-Bam och SL-Ban, på den första PC-axeln. Detta stärker ytterligare hypotesen att Indiska tamiler skiljer sig genetiskt från resten av de srilankanska etniska grupperna. Vissa Vedda-grupper (VA-Dal, VA-Hen och VA-Dam) är belägna vid periferin av denna genetiska matris, medan andra (VA-Pol och VA-Rat) endast etablerade ett avlägset förhållande till matrisen.

Figur 4
figure4

populationer av Indien som användes i denna studie. (Förkortningar anges i Tilläggstabell S1 och Tilläggstabell S2). En fullfärgsversion av denna figur finns tillgänglig på Journal of Human Genetics journal online.

Figur 5
figure5

principal component analysis (PCA) karta över de 21 Sri Lankas subpopulationer med indiska populationer baserade på netto genetiska avstånd. (Förkortningar anges i Tilläggstabell S1 och Tilläggstabell S2). En fullfärgsversion av denna figur finns tillgänglig på Journal of Human Genetics journal online.

MtDNA haplogrupp i Sri Lanka

även om mitokondriell kodningsregion innehåller flera fylogenetiskt relevanta platser som är användbara för att tilldela haplotyper till en haplogrupp, är kontrollregionen också lovande i förmodad haplogruppanslutning.28, 29 enligt haplogroup-uppdraget baserat på HVS-1 och en del av HVS-2-sekvenser av Sri Lankas befolkning med Mitotool (http://www.mitotool.org)17 och Haplogrep 1515 och sedan manuellt kontrollerade den igen med phylotree build 15 (http://www.phylotree.org)16 (kompletterande tabell S3), den totala Haplogruppanalys indikerade att nästan 50% av individerna från alla studerade populationer tillhörde haplogrupp m-linjer (inklusive haplogrupp m, d och g) följt av cirka 25% av R-linjer (inklusive haplogrupp r, p och T) och 20% av U-linjer. Andra mindre frekventa linjer var nästan 4% av R0 (inklusive haplogrupp HV och H) och nästan 2% av N-linjer (inklusive N och W) (Tabell 2).

Tabell 2 haplogruppsfrekvens i Sri Lankas befolkning

haplogrupp M var den vanligaste haplogruppen i Indiska tamiler (70,18%), vilket främst bidrog av sub-haplogrupper M5A (14,03%) och m2a (12,28%). Dessa sub-haplogrupper hittades sällan i andra populationer. Singalesiska, singalesiska och Sri Lankas tamiler uppvisade liknande frekvenser av haplogrupp M (41,67-43,59%), även om de hade olika sub-haplogroups frekvenser. Detta kan tyda på att den senare nämnda, särskilt upp-Land singalesiska och låg-land Singalesiska är närmare besläktade med varandra än till Indiska tamiler som har en känd migration historia från Indien. Under tiden hade Vedda-personer den lägsta frekvensen av haplogrupp M (17,33%). Det är ganska förvånande att se en sådan lägre frekvens av M-haplogrupp i Vedda-befolkningen jämfört med södra Indiska stamgrupper (70-80%) samt södra Indiska kastpopulationer (65%).30 Detta beror förmodligen på effekten av genetisk drift i den mindre befolkningen i Vedda. Detta stöds av annan observation av minskad intrapopulation mångfald bland undergrupperna av Vedda människor.

å andra sidan visade Vedda människor och lågland singaleser relativt höga frekvenser av haplogrupp R (45.33 respektive 25%) som främst bidrog med sub-haplogrupp R30b (38,67 och 20%). Haplogruppen var mindre frekvent i singalesiska, Sri Lankas tamiler och indiska tamiler. Haplogrupp u hittades mestadels i Vedda (29,33%) och upp-Land Singalesiska (23,33%), med högsta bidrag från sub-haplogrupper U1a ’ C (12 respektive 5%) och U7a (13,33 respektive 11,67%).

haplogruppsfrekvensen för Vedda-personer från varje plats visas i Tilläggstabell S7. Låg frekvens av M-haplogrupp och höga frekvenser av R-och U-haplogrupper befanns vara de unika egenskaperna hos Vedda. Frekvenserna för dessa haplogrupper varierade emellertid mellan Vedda från olika platser. Två Vedda-grupper (VA-Dam och VA-Hen) har frekvensen av M-haplogrupp nära den för singalesiska, singalesiska och Sri Lankas tamiler, vilket indikerar den genetiska blandningen mellan dessa två Vedda-grupper och de andra tre populationerna. Vedda-undergrupperna delade haplogrupp R30b / R8a1a3 vid relativt höga frekvenser, den egenskap som inte finns bland undergrupper av andra etniska befolkningar på ön, föreslog ett gemensamt gemensamt ursprung för Vedda-befolkningen. Median sammanfogning nätverk av HVS – 1 och en del av HVS-2 sekvens av haplogrupper R (62 individer, 21 haplotyper) och U (52 individer, 25 haplotyper) från fem lankesiska populationer konstruerades (kompletterande figur S3). I allmänhet var nätverket överens med mtDNA haplogroup-analysen. Även om det finns mindre frekvens för båda haplogrupperna, haplotyperna, som tillhör dessa haplogrupper, av de andra fyra srilankanska populationerna var mer olika än Vedda haplotyper, som också var mycket härledda inom trädet. Mediananslutningsnätverket som innehåller data om HVS-1 och en del av HVS-2-sekvenser av haplogrupper R och U24, 25 Från Indiska populationer utfördes också (kompletterande figur S4). Mediananslutningsnätverkskartan avslöjar inte en basal status för Veddas sekvenser för genetisk differentiering av haplogrupper R och U. Det är mer troligt att dessa två haplogrupper, visade sig vara särskilt vanliga i Vedda, härleddes från förfäder på den indiska subkontinenten.

tre haplogrupper, M2, U2i (U2a, U2b och U2c) och R5, erkända som ett paket med indiska specifika mtDNA-klader som hyser en lika djup koalescent ålder på cirka 50 000-70 000 år,30 var närvarande i de etniska befolkningarna i Sri Lanka. Alla etniska populationer som studerats har R5 med sin högsta frekvens (10%) observerad i singalesiska Uppland. Haplogrupp U2 hittades i alla studerade populationer med sin markerade högfrekvens (10.25%) observeras i Sri Lankas tamiler. Intressant nog presenteras alla typer av haplogrupper i Vedda-människor, utom underhaplogrupper M36d och M73’79, också i andra etniska grupper.

det finns flera Västra eurasiska haplogrupper, som tillhör HV -, W -, T -, U1 -, U5-och U7-linjerna, som finns i Sri Lankas etniska populationer (Tabell 2). Det västra eurasiska bidraget till den srilankanska moderns genpool var cirka 19,94%, vilket överensstämmer med den tidigare rapporten.30 intressant, Västra eurasiska bidrag av 28.19, 25.33, 25 och 20% upptäcktes i Sri Lankas tamiler, Vedda-människor, singalesiska och singalesiska lågländer, medan endast ett bidrag på 1,75% var tydligt i de indiska tamilerna. Detta återspeglade återigen det nära genetiska förhållandet mellan de två Singalesiska grupperna och Sri Lankas tamiler jämfört med indiska tamiler. Haplogrupp U1a och U7a var den enda väst eurasiska härstamning observerats i Vedda människor. Haplogrupp T var närvarande i två populationer; Singalesiska (5%) och Sri Lankas tamiler (2,56%), medan haplogrupp W endast var närvarande i singalesiska (3,33%).

lägre frekvenser än de västra eurasiska haplogrupperna observerades för de östasiatiska haplogrupperna (M12 och G), som stod för 5,91% av den totala variationen.

den genetiska strukturen hos de lankesiska populationerna

gruppering av de lankesiska populationerna enligt olika kriterier utfördes och testades statistiskt med hjälp av en analys av molekylär varians för att avslöja den bästa modellen som representerar naturlig befolkningsdifferentiering. Förutom de etniska kriterier som antagits genom hela denna studie klassificerades populationer i grupper enligt språkligt, geografiskt och förmodat raskriterium. Resultaten visas i tabell 3. När populationer klassificerades i två grupper, vedda människor förmodligen representerar tidigaste invånarna på ön och andra för nykomlingar, denna gruppering gav den minsta variansen mellan undergrupper inom en population (87.85, P<0.001) och maximal varians bland populationer (8.15, P<0.001), som representerar den bästa modellen för befolkningsdifferentiering. Denna modell av befolkningsdifferentiering är kompatibel med en djupare rot av genetisk avvikelse mellan vedda-och icke-Vedda-populationerna än mellan undergrupper inom varje population.

tabell 3 analys av molekylär varians (AMOVA) hos Sri Lankas populationer