Articles

Mitochondrial DNA history of Sri Lankan ethnic people: their relations within the island and with the Indian subcontinental populations

MtDNA polymorphisms and shared haplotypes of Sri Lanka

de mtDNA HVS-1 (np. 16 024 tot np. 16 383 RCR ‘ s) en een deel van HVS-2 (np. 57 tot np. 309 van de rCRS) sequenties werden verkregen van 271 individuen behorend tot vijf Sri Lankaanse etnische populaties: 75 Vedda ‘ s, 60 Singalezen uit het Up-country en 40 Singalezen uit het Low-country, 39 Sri Lankaanse Tamils en 57 Indiase Tamils. De waargenomen polymorfismen in de studie zijn weergegeven in aanvullende tabel S3. Schrappingen werden waargenomen bij nucleotideposities 16 166, 16 258, en 249 terwijl inserties werden aangetroffen bij 16 188, 16 380 en 284.

er werden in totaal 147 haplotypes waargenomen in de vijf Sri Lankaanse populaties van deze studie. Dertig van hen werden verdeeld over ten minste twee populaties. De Vedda-populatie heeft het laagste percentage haplotypes onder hun subgroepen (63%) wat wijst op hun grotere genetische diversiteit onder de subgroepen. Sri Lankaanse Tamils en Indiase Tamils hadden een vergelijkbaar aandeel (85%), terwijl het aantal haplotypen in het Singalees in het Upland iets hoger ligt (73%) dan het Singalees in het Lowland (70%) (Tabel 1). Interessant is dat het grootste aantal haplotypieën werd gevonden tussen Vedda met Singalees in het Bovenland en Singalees in het laagland. Aan de andere kant was er geen haplotype gedeeld tussen de Vedda mensen met een van de Tamils (Tabel 1).

Tabel 1 Haplotypedeling en matchingskansen tussen Sri Lankaanse populaties

Diversiteitsindices

genetische diversiteit binnen de subgroepen van Sri Lankaanse etnische populaties werd beoordeeld op haplotypediversiteit (h) en nucleotidediversiteit (π). De resultaten zijn samengevat in aanvullende tabel S4. H varieerde van 0,503-1.000 en π van 0,006-0,019. In het algemeen vertoonden de Singalese (Up-country en Low-country) en Tamil (Sri Lankaanse en Indiase) subgroepen een relatief grotere haplotypediversiteit (0,861–1.000) dan die van de Vedda (0,503–0,965). De trend van nucleotidediversiteit volgt de haplotypische diversiteit. Hogere nucleotidediversiteiten (0,009–0,019) werden waargenomen bij Sinhalese en Tamils. In het bijzonder werd een lagere nucleotidediversiteit (0,006–0,009) waargenomen in twee Vedda-subgroepen (VA-Rat en VA–Dal) dan in de rest van de Vedda-subgroepen (0,012-0,014).

patroon van genetische variatie zoals aangetoond door genetische afstand en fylogenetische analyses

genetische afstanden tussen 21 subgroepen van vijf etnische populaties in Sri Lanka werden berekend op basis van HVS-1 en een deel van HVS-2 sequenties met behulp van de Tajima-Nei methode.27 het resultaat is weergegeven in aanvullende tabel S5. De Mantel test voor de overeenstemming tussen genetische en geografische minimale afstanden werd ook uitgevoerd, waaruit de significante correlatie tussen de twee afstand matrices (r=0,15; P=0,02) werd verkregen; het resultaat suggereert dat het patroon van genetische differentiatie waargenomen onder bestudeerde populaties ten minste gedeeltelijk verklaarbaar is in het licht van het isolatiemodel per afstand.

Er werd een boom zonder wortels gebouwd voor fylogenetische relaties tussen 21 subgroepen van vijf etnische populaties in Sri Lanka, zoals geïllustreerd in Figuur 2. Een andere fylogenetische constructie werd ook uitgevoerd voor de vijf etnische populaties wanneer alle subgroepen binnen een populatie waren ingestort; het resultaat wordt getoond in aanvullend figuur S1.

Figuur 2
figure2

niet-wortelde neighbor-joining (NJ) boom van de 21 Sri Lankaanse populaties gebaseerd op de netto genetische afstanden. (Afkortingen zijn opgenomen in aanvullende tabel S1).

uit aanvullend figuur S1 blijkt duidelijk dat de Vedda-populatie genetisch gescheiden was van andere Sri Lankaanse etnische populaties, met minder genetische afstand tussen hen. Indiase Tamils vestigden de nauwste genetische relatie met hun Sri Lankaanse etnische tegenhangers. Up-country Singalees gevormd nauwe genetische banden met Sri Lankaanse Tamils en Low-country Singalees.

Figuur 2 illustreert meer inzichten in de genetische relaties tussen de bestudeerde populaties, met de beschrijving van genetische variatie tussen subgroepen binnen elke etnische populatie. Uit deze boom zonder wortels werd bevestigd dat er een grotere genetische afstand was tussen de Vedda en de rest van de bevolking. Twee Vedda subgroepen (VA-Dam en VA-Hen) werden vermengd met de Singalezen, zowel Up-country als Low-country, maar niet met een van de Tamils. De Tamils, zowel Sri Lankaanse als Indiase, groepeerden zich samen. De genetische matrix waarin de Tamil en Singalese subgroepen, die niet duidelijk van elkaar kunnen worden gescheiden, werden waargenomen naar één belangrijke tak van de boom, met de meerderheid van de Vedda mensen naar de andere. Interessant is dat sommige Singalese groepen (SU-Mul, su-Mee en SL-Lan) relatief dichter bij Tamils stonden dan bij de rest van de Singalese subgroepen.

Principal component analysis

De netto genetische afstanden van HVS-1 en een deel van HVS-2 sequenties (aanvullende tabel S5), en van haplogroup distributie frequenties (aanvullende tabel S6), Onder 21 subgroepen van vijf etnische populaties van Sri Lanka werden behandeld als input vectoren voor PCA. Figuur 3 displays de PCA kaart opgebouwd uit haplogroup distributie frequenties, voor de eerste twee belangrijkste componenten, die samen goed voor 82.44% van de totale variantie. De meerderheid van de Vedda subgroepen (behalve VA-Dam) waren goed gescheiden van andere etnische populaties van Sri Lanka op de eerste PC-as. Hun scheiding van andere etnische bevolkingsgroepen wordt verder uitgebreid op de tweede PC-as. De meerderheid van de Singalese en Tamil subgroepen vormen nauwe genetische proximiteiten onderling op beide PC-Assen. Grote uitzondering op deze clustering is te vinden in SU-Thu. Het was duidelijk dat Singalezen in het binnenland genetisch dichter bij Sri Lankaanse Tamils staan. Aan de andere kant, Sri Lankaanse Tamil subgroepen waren dichter bij elkaar in vergelijking met Indiase Tamils. Over het algemeen waren de Vedda-subgroepen meer verspreid op de kaart van de PSO dan binnen enige andere etnische bevolking, wat een grotere diversiteit onder hen weerspiegelde. PCA kaart geconstrueerd van naar de netto genetische afstanden van HVS-1 en deel van HVS-2 sequenties, welk zit in overeenkomst met naar de PCA kaart geconstrueerd van haplogroup distributie frequenties, is ook getoond in aanvullende figuur S2.

Figure 3
figure3

Principal component analysis (PCA) map van de 21 Sri Lankaanse subpopulaties gebaseerd op netto genetische afstanden afgeleid van haplogroup distributie frequenties. (Afkortingen zijn opgenomen in aanvullende tabel S1). Een full color versie van deze figuur is beschikbaar op het Journal of Human Genetics journal online.

de PSO wordt verder uitgebreid met diverse andere etnische populaties uit het Indiase subcontinent (aanvullende tabel S2) Figuur 4. Het in Figuur 5 weergegeven resultaat was goed voor 52,59% van de totale variatie. Alle Singalese en Tamil subgroepen vermengen zich goed met de meerderheid van de Indiase subcontinentale populaties en vormen een grote genetische matrix. Echter, de Indiase Tamils werden gescheiden van de rest van de Sri Lankaanse subgroepen, met uitzondering van SU-Bam en SL-Ban, op de eerste PC-as. Dit is een verdere versterking van de hypothese dat Indiase Tamils genetisch onderscheiden zijn van de rest van de Sri Lankaanse etnische groepen. Sommige Vedda-groepen (VA-Dal, VA-Hen en VA-Dam) bevinden zich aan de rand van deze genetische matrix, terwijl andere (VA-Pol en VA-Rat) slechts een verre relatie met de matrix hebben vastgesteld.

Figuur 4
figure4

in dit onderzoek gebruikte populaties in India. (Afkortingen zijn opgenomen in aanvullende tabel S1 en aanvullende tabel S2). Een full color versie van deze figuur is beschikbaar op het Journal of Human Genetics journal online.

Figure 5
figure5

Hoofdcomponentanalyse (PCA) kaart van de 21 Sri Lankaanse subpopulaties met Indiase populaties op basis van netto genetische afstanden. (Afkortingen zijn opgenomen in aanvullende tabel S1 en aanvullende tabel S2). Een full color versie van deze figuur is beschikbaar op het Journal of Human Genetics journal online.

MtDNA haplogroup in Sri Lanka

hoewel de mitochondriale codering regio bevat verscheidene fylogenetically relevante sites die nuttig zijn in het toewijzen haplotypes aan een haplogroup, de controle regio is ook veelbelovend in vermeende haplogroup affiliatie.28, 29 Volgens de haplogroep opdracht op basis van HVS-1 en een deel van de HVS-2-sequenties van de Sri Lankaanse bevolking met behulp van Mitotool (http://www.mitotool.org)17 en Haplogrep 1515 en vervolgens handmatig gecontroleerd met phylotree bouwen 15 (http://www.phylotree.org)16 (Aanvullende Tabel S3), de algemene haplogroep analyse bleek dat bijna 50% van de individuen van de bestudeerde populaties behoorde tot haplogroep M geslachten (met inbegrip van haplogroep M, D en G), gevolgd door ongeveer 25% van de R-typen (met inbegrip van haplogroep R, P en T) en 20% van U afstammingslijnen. Andere minder frequente afstammelingen waren bijna 4% van R0 (met inbegrip van haplogroup HV en H) en bijna 2% van N afstammelingen (met inbegrip van N, en W) (Tabel 2).

Table 2 Haplogroup frequency in Sri Lankaanse populatie

Haplogroup M was de meest voorkomende haplogroup in Indiase Tamils (70.18%), die werd bijgedragen voornamelijk door sub-haplogroups M5a (14.03%) en m2a (12,28%). Deze sub-haplogroups waren zelden gevonden in andere populaties. Up-country Singalese, Low-country Singalese en Sri Lankaanse Tamils tentoongesteld soortgelijke frequenties van haplogroup M (41.67-43.59%), hoewel zij bezeten verschillende sub-haplogroups frequenties. Dit zou erop kunnen wijzen dat de later genoemde, vooral Up-country Singalezen en Low-country Singalezen nauwer verwant zijn aan elkaar dan aan Indiase Tamils die een bekende migratiegeschiedenis uit India hebben. Ondertussen, Vedda mensen had de laagste frequentie van haplogroup M (17.33%). Het is heel verbazingwekkend voor zien zodanig te lagere frequentie van M haplogroup ter naar de Vedda bevolking wanneer vergeleken met Zuid-Indiaan stamgroepen (70-80%) evenals Zuid-Indiaan kaste bevolking (65%).Dit is waarschijnlijk te wijten aan het effect van genetische drift in de kleinere populatie van Vedda. Dit wordt ondersteund door andere waarnemingen van verminderde intrapopulatie diversiteit onder de subgroepen van Vedda mensen.

aan de andere kant, Vedda mensen en Low-country Singalese toonde relatief hoge frequenties van haplogroup R (45.33 en 25%, respectievelijk) die werd bijgedragen voornamelijk door sub-haplogroup R30b (38.67 en 20%). Naar de haplogroup was minder frequent ter Up-country Singalese, Sri Lankan Tamils en Indiaan Tamils. Haplogroup u was meestal gevonden in Vedda (29.33%) en Up-Land Singalese (23.33%), met hoogste bijdrage van sub-haplogroups U1a ‘ C (12 en 5%, respectievelijk) en U7A (13.33 en 11.67%, respectievelijk).

De haplogroup frequentie van Vedda mensen van elke site wordt getoond in aanvullende tabel S7. Lage frequentie van M haplogroup en hoge frequenties van R en u haplogroups waren gevonden te zijn de unieke kenmerken van Vedda. Echter, naar de frequenties van deze haplogroups varieerde onder Vedda van verschillend plaatsen. Twee Vedda groepen (VA-Dam en VA-Hen) bezit de frequentie van M haplogroup dicht naar die van Up-Land Singalese, laag-land Singalese en Sri Lankaanse Tamils, indicating naar de genetische vermenging tussen deze twee Vedda groepen en naar de andere drie populaties. Naar de Vedda subgroepen shared haplogroup R30b / R8a1a3 ter verhoudingsgewijs hoog frequenties, naar de karakteristiek niet gevonden onder subgroepen van andere etnische populaties op naar de eiland, gesuggereerd te gemeenschappelijk gedeeld oorsprong van naar de Vedda bevolking. Mediaan toetreden netwerk van HVS-1 en deel van HVS-2 opeenvolging van haplogroups R (62 individuen, 21 haplotypes) en U (52 individuen, 25 haplotypes) van vijf Sri Lankaanse populaties werden geconstrueerd (aanvullende figuur S3). In het algemeen, het netwerk was in overeenstemming met de mtDNA haplogroup analyse. Hoewel posses minder frequentie van beide haplogroups, naar haplotypes, behorend tot deze haplogroups, van naar de andere vier Sri Lankaanse populaties waren meer divers dan Vedda haplotypes, welke waren ook hoogst afgeleid binnen naar de boom. Naar de mediaan toetreding netwerk incorporeren gegevens van HVS-1 en deel van HVS-2 opeenvolgingen van haplogroups R en U24, 25 van Indische populaties was ook uitgevoerd (aanvullende figuur S4). Naar de mediaan toetreding Netwerk kaart doet niet onthullen te basaal status van naar de Vedda ‘ s sequenties voor naar de genetische differentiatie van haplogroups R en U. Het is meer waarschijnlijk dat deze twee haplogroups, gevonden voor zitten bijzonder overwegend ter naar de Vedda, waren afgeleid van voorvaderen op naar de Indisch subcontinent.

drie haplogroups, M2, U2i (U2a, U2b en U2c) en R5, erkend als een pakket van Indian-specifieke mtDNA clades Herbergen een even diep coalescent leeftijd van over 50 000-70 000 jaar,30 waren aanwezig in de etnische populaties van Sri Lanka. Alle onderzochte etnische populaties bezitten R5 met de hoogste frequentie (10%) waargenomen in Singalees in het binnenland. Haplogroup U2 werd gevonden in alle naar de bestudeerde populaties met zijn uitgesproken hoog frequentie (10.25%) waargenomen bij Sri Lankaanse Tamils. Interessant, ALLE naar de types van haplogroups ter Vedda Volk, behalve sub-haplogroups M36d en M73 ‘ 79, zitten gepresenteerd ter andere etnische groepen ook.

Er zijn verscheidene West Euraziatische haplogroups, behorend tot de HV, W, T, U1, U5 en U7 afstammelingen, gevonden in Sri Lankaanse etnische populaties (Tabel 2). De westelijke Euraziatische bijdrage aan de Sri Lankaanse maternale genenpool bedroeg ongeveer 19,94%, wat in overeenstemming is met het vorige rapport.30 interessant, West Euraziatische bijdragen van 28.19, 25.33, 25 en 20% werden aangetroffen in de Sri Lankaanse Tamils, de Vedda-bevolking, de Singalees in het Upland en de Singalees in het laagland, terwijl slechts een bijdrage van 1,75% duidelijk was in de Indiase Tamils. Dit weerspiegelde opnieuw de nauwe genetische relatie tussen de twee Singalese groepen en Sri Lankaanse Tamils in vergelijking met Indiase Tamils. Haplogroup U1a en U7a waren de enige West Eurasian lineage waargenomen in de Vedda Volk. Haplogroup T Was aanwezig in twee populaties; laag-land Singalese (5%) en Sri Lankaanse Tamils (2.56%), overwegende Haplogroup W was aanwezig alleen in Up-land Singalese (3.33%).

lagere frequenties dan naar de West Eurasean haplogroups waren waargenomen voor naar de Oost-Aziatisch haplogroups (M12 en G), welk verantwoord voor 5.91% van naar de totaal variatie.

de genetische structuur van de Sri Lankaanse populaties

groepering van de Sri Lankaanse populaties volgens verschillende criteria werd uitgevoerd en statistisch Getest, met behulp van een analyse van moleculaire variantie, om het beste model te vinden dat de natuurlijke populatiedifferentiatie vertegenwoordigt. Naast de etnische criteria die door deze studie werden aangenomen, werden de populaties ingedeeld in groepen op basis van linguïstische, geografische en vermeende raciale criteria. De resultaten zijn weergegeven in Tabel 3. Wanneer populaties werden ingedeeld in twee groepen, Vedda-mensen die waarschijnlijk de vroegste bewoners van het eiland vertegenwoordigen en andere voor nieuwkomers, Gaf deze groep de minimale variantie tussen subgroepen binnen een populatie (87,85, P<0,001) en maximale variantie tussen populaties (8,15, P<0.001), die het beste model voor populatiedifferentiatie vertegenwoordigt. Dit model van populatiedifferentiatie is compatibel met een diepere wortel van genetische divergentie tussen de Vedda en niet-Vedda populaties dan tussen subgroepen binnen elke populatie.

Table 3 Analysis of molecular variance (AMOVA) of Sri Lankan populations