Articles

Mitochondriale DNA Geschichte von Sri Lanka ethnischen Menschen: ihre Beziehungen innerhalb der Insel und mit den indischen subkontinentalen Populationen

mtDNA Polymorphismen und gemeinsame Haplotypen von Sri Lanka

Die mtDNA HVS-1 (np. 16 024 bis np. 16 383 der RCR) und ein Teil von HVS-2 (np. 57 bis np. 309 der rCRS) Sequenzen wurden von 271 Personen erhalten, die zu fünf ethnischen Populationen in Sri Lanka gehörten: 75 Vedda Menschen, 60 Up-Land Singhalesen und 40 Low-Land Singhalesen, 39 Sri Lanka Tamilen und 57 indische Tamilen. Die in der Studie beobachteten Polymorphismen sind in der ergänzenden Tabelle S3 angegeben. Deletionen wurden an den Nukleotidpositionen 16 166, 16 258 und 249 beobachtet, während Insertionen an 16 188, 16 380 und 284 beobachtet wurden.

In den fünf srilankischen Populationen dieser Studie wurden insgesamt 147 Haplotypen beobachtet. Dreißig von ihnen wurden zwischen mindestens zwei Populationen geteilt. Die Vedda-Population hat den niedrigsten Anteil an gemeinsamen Haplotypen unter ihren Untergruppen (63%), was auf ihre größere genetische Vielfalt unter den Untergruppen hinweist. Sri-lankische Tamilen und indische Tamilen besaßen einen ähnlichen Anteil (85%), während Singhalesen im Hochland eine etwas höhere Anzahl bevölkerungsspezifischer Haplotypen aufweisen (73%) als Singhalesen im Tiefland (70%) (Tabelle 1). Interessanterweise wurde die höchste Anzahl von Haplotyp-Sharing zwischen Vedda mit Up-Country Singhalesen und mit Low-Country Singhalesen gefunden. Auf der anderen Seite gab es keinen Haplotyp-Austausch zwischen den Vedda-Leuten mit den Tamilen (Tabelle 1).

Tabelle 1 Haplotyp-Sharing- und Matching-Wahrscheinlichkeiten zwischen srilankischen Populationen

Diversitätsindizes

Die genetische Vielfalt innerhalb der Untergruppen srilankischer ethnischer Populationen wurde anhand der Haplotyp-Diversität (H) und der Nukleotid-Diversität (π). Die Ergebnisse sind in der ergänzenden Tabelle S4 zusammengefasst. H reichte von 0,503–1,000 und π von 0,006–0,019. Im Allgemeinen zeigten singhalesische (Up-Country und Low-Country) und tamilische (Sri Lanka und Indien) Untergruppen eine relativ höhere Haplotyp–Diversität (0,861–1,000) als die der Vedda (0,503-0,965). Der Trend der Nukleotid-Diversität folgt der Haplotyp-Diversität. Höhere Nukleotiddiversitäten (0,009–0,019) wurden bei Singhalesen und Tamilen beobachtet. Bemerkenswerterweise wurde in zwei Vedda–Untergruppen (VA-Ratte und VA-Dal) eine geringere Nukleotiddiversität (0,006–0,009) beobachtet als in den übrigen Vedda-Untergruppen (0,012-0,014).

Muster der genetischen Variation, wie durch genetische Distanz und phylogenetische Analysen aufgedeckt

Genetische Entfernungen zwischen 21 Untergruppen von fünf ethnischen Populationen Sri Lankas wurden aus HVS-1 und einem Teil von HVS-2-Sequenzen unter Verwendung der Tajima-Nei-Methode berechnet.27 ist das Ergebnis in der ergänzenden Tabelle S5 dargestellt. Es wurde auch der Mantel-Test auf Übereinstimmung zwischen genetischen und geografischen Mindestabständen durchgeführt, aus dem die signifikante Korrelation zwischen den beiden Entfernungsmatrizen (r = 0,15; P = 0,02) erhalten wurde; das Ergebnis legte nahe, dass das Muster der genetischen Differenzierung, das zwischen den untersuchten Populationen beobachtet wurde, im Lichte des Isolation-by-Distance-Modells zumindest teilweise erklärbar ist.Ein unbewurzelter Nachbarschaftsbaum wurde für phylogenetische Beziehungen zwischen 21 Untergruppen von fünf ethnischen Populationen Sri Lankas konstruiert, wie in Abbildung 2 dargestellt. Eine weitere phylogenetische Konstruktion wurde auch für die fünf ethnischen Populationen durchgeführt, wenn alle Untergruppen innerhalb einer Population zusammengebrochen waren; Das Ergebnis ist in ergänzender Abbildung S1 dargestellt.

Abbildung 2
Abbildung 2

Unrooted Neighbor-Joining (NJ) Tree der 21 srilankischen Populationen basierend auf den genetischen Nettoabständen. (Abkürzungen sind in der ergänzenden Tabelle S1 angegeben).

Aus der ergänzenden Abbildung S1 geht ganz klar hervor, dass die Vedda-Bevölkerung genetisch von anderen ethnischen Bevölkerungsgruppen Sri Lankas getrennt war, wobei der genetische Abstand zwischen ihnen geringer war. Indische Tamilen stellten die engste genetische Beziehung zu ihren ethnischen Gegenstücken in Sri Lanka her. Up-Country Singhalesen bildeten enge genetische Verbindungen mit srilankischen Tamilen und Low-Country Singhalesen.Abbildung 2 veranschaulicht weitere Einblicke in die genetischen Beziehungen zwischen den untersuchten Populationen mit der Beschreibung der genetischen Variation zwischen den Untergruppen innerhalb jeder ethnischen Population. Von diesem unbewurzelten Nachbarschaftsbaum wurde bestätigt, dass es einen größeren genetischen Abstand zwischen den Vedda-Leuten und dem Rest der Populationen gab. Zwei Vedda-Untergruppen (VA-Dam und VA-Hen) vermischten sich mit den Singhalesen, sowohl im Hochland als auch im Tiefland, aber nicht mit Tamilen. Die Tamilen, sowohl srilankische als auch indische, gruppierten sich zusammen. Die genetische Matrix, in der die tamilischen und singhalesischen Untergruppen, die nicht eindeutig voneinander getrennt werden können, gegenüber einem Hauptzweig des Baumes beobachtet wurden, mit der Mehrheit der Vedda-Leute gegenüber dem anderen. Interessanterweise waren einige singhalesische Gruppen (SU-Mul, SU-Mee und SL-Lan) den Tamilen relativ näher als den übrigen singhalesischen Untergruppen.

Hauptkomponentenanalyse

Die genetischen Nettoabstände von HVS-1 und einem Teil der HVS-2-Sequenzen (ergänzende Tabelle S5) und von Haplogruppenverteilungshäufigkeiten (ergänzende Tabelle S6) unter 21 Untergruppen von fünf ethnischen Populationen Sri Lankas wurden als Eingangsvektoren für PCA behandelt. Abbildung 3 zeigt die PCA-Karte, die aus Haplogruppenverteilungshäufigkeiten für die ersten beiden Hauptkomponenten erstellt wurde, die zusammen 82,44% der Gesamtvarianz ausmachen. Die Mehrheit der Vedda-Untergruppen (außer VA-Dam) war auf der ersten PC-Achse gut von anderen ethnischen Bevölkerungsgruppen Sri Lankas getrennt. Ihre Trennung von anderen ethnischen Bevölkerungsgruppen wird auf der zweiten Hauptachse weiter ausgebaut. Die Mehrheit der singhalesischen und tamilischen Untergruppen bilden enge genetische Proximitäten untereinander auf beiden PC-Achsen. Eine große Ausnahme von diesem Clustering findet sich in SU-Thu. Es war offensichtlich, dass Up-Country Singhalesen genetisch näher an Sri Lanka Tamilen sind. Auf der anderen Seite, srilankische tamilische Untergruppen waren im Vergleich zu indischen Tamilen näher beieinander. Allgemein gesagt, Vedda-Untergruppen waren auf der PCA-Karte stärker verstreut als in jeder anderen ethnischen Bevölkerung, Dies spiegelt eine größere Vielfalt unter ihnen wider. Eine PCA-Karte, die aus den genetischen Nettoabständen von HVS-1 und einem Teil von HVS-2-Sequenzen konstruiert wurde, die mit der PCA-Karte übereinstimmt, die aus Haplogruppenverteilungsfrequenzen konstruiert wurde, ist auch in der ergänzenden Abbildung S2 gezeigt.

Abbildung 3
Abbildung 3

PCA-Karte (Principal Component Analysis) der 21 srilankischen Subpopulationen basierend auf genetischen Nettoabständen, die aus den Verteilungshäufigkeiten der Haplogruppen abgeleitet wurden. (Abkürzungen sind in der ergänzenden Tabelle S1 angegeben). Eine Vollfarbversion dieser Figur ist im Journal of Human Genetics Journal online verfügbar.

Die PCA wird um verschiedene andere ethnische Bevölkerungsgruppen des indischen Subkontinents erweitert (Ergänzende Tabelle S2) Abbildung 4. Das in Abbildung 5 gezeigte Ergebnis machte 52,59% der gesamten Variation aus. Alle singhalesischen und tamilischen Untergruppen vermischen sich gut mit der Mehrheit der indischen subkontinentalen Populationen und bilden eine große genetische Matrix. Indische Tamilen wurden jedoch vom Rest der srilankischen Untergruppen getrennt, mit Ausnahme von SU-Bam und SL-Ban, auf der ersten PC-Achse. Dies stärkt die Hypothese, dass sich indische Tamilen genetisch vom Rest der srilankischen Volksgruppen unterscheiden. Einige Vedda-Gruppen (VA-Dal, VA-Hen und VA-Dam) befinden sich an der Peripherie dieser genetischen Matrix, während andere (VA-Pol und VA-Rat) nur eine entfernte Beziehung zur Matrix aufgebaut haben.

Abbildung 4
Abbildung 4

Populationen Indiens, die in dieser Studie verwendet wurden. (Abkürzungen sind in der Ergänzungstabelle S1 und der Ergänzungstabelle S2 angegeben). Eine Vollfarbversion dieser Figur ist im Journal of Human Genetics Journal online verfügbar.

Abbildung 5
Abbildung 5

Hauptkomponentenanalyse (PCA)-Karte der 21 srilankische Subpopulationen mit indischen Populationen basierend auf genetischen Nettoabständen. (Abkürzungen sind in der Ergänzungstabelle S1 und der Ergänzungstabelle S2 angegeben). Eine Vollfarbversion dieser Figur ist im Journal of Human Genetics Journal online verfügbar.

mtDNA-Haplogruppe in Sri Lanka

Obwohl die mitochondriale Kodierungsregion mehrere phylogenetisch relevante Stellen enthält, die bei der Zuordnung von Haplotypen zu einer Haplogruppe nützlich sind, ist die Kontrollregion auch vielversprechend in der mutmaßlichen Haplogruppenzugehörigkeit.28, 29 Gemäß der Haplogruppenzuweisung basierend auf HVS-1 und einem Teil der HVS-2-Sequenzen der srilankischen Bevölkerung unter Verwendung von Mitotool (http://www.mitotool.org) 17 und Haplogrep 1515 und dann manuell erneut überprüft mit phylotree build 15 (http://www.phylotree.org)16 (Ergänzende Tabelle S3) ergab die gesamte Haplogruppenanalyse dass fast 50% der Individuen aus allen untersuchten Populationen zu den Haplogruppe-M-Linien (einschließlich der Haplogruppe M, D und G) gehörten, gefolgt von etwa 25% der R-Linien (einschließlich der Haplogruppe R, P und T) und 20% der U-Linien. Andere weniger häufige Linien waren fast 4% von R0 (einschließlich Haplogruppe HV und H) und fast 2% von N Linien (einschließlich N und W) (Tabelle 2).

Tabelle 2 Haplogruppenhäufigkeit in der srilankischen Bevölkerung

Die Haplogruppe M war die häufigste Haplogruppe bei indischen Tamilen (70,18%), die hauptsächlich von den Sub-Haplogruppen M5a 14,03%) und M2a (12,28%). Diese Sub-Haplogruppen wurden selten in anderen Populationen gefunden. Up-Country Singhalesen, Low-Country Singhalesen und Sri Lanka Tamilen zeigten ähnliche Frequenzen der Haplogruppe M (41,67–43,59%), obwohl sie verschiedene Sub-Haplogruppen Frequenzen besaßen. Dies könnte darauf hindeuten, dass die später erwähnten, insbesondere Singhalesen im Hochland und Singhalesen im Tiefland, enger miteinander verwandt sind als mit indischen Tamilen, die eine bekannte Migrationsgeschichte aus Indien haben. In der Zwischenzeit hatten Vedda-Leute die niedrigste Häufigkeit von Haplogruppe M (17,33%). Es ist ziemlich erstaunlich, eine so geringere Häufigkeit von M-Haplogruppen in der Vedda-Bevölkerung zu sehen, verglichen mit südindischen Stammesgruppen (70-80%) sowie südindischen Kastenpopulationen (65%).30 Dies ist wahrscheinlich auf den Effekt der genetischen Drift in der kleineren Population von Vedda zurückzuführen. Dies wird durch andere Beobachtungen einer verringerten Intrapopulationsvielfalt unter den Untergruppen der Vedda-Bevölkerung gestützt.

Auf der anderen Seite, Vedda Menschen und Low-Country Singhalesen zeigten relativ hohe Frequenzen der Haplogruppe R (45.33% bzw. 25%), zu denen vor allem die Subhaplogruppe R30b beitrug (38,67% bzw. 20%). Die Haplogruppe war weniger häufig in Up-Country Singhalesen, Sri Lanka Tamilen und indischen Tamilen. Haplogruppe U wurde hauptsächlich in Vedda (29,33%) und Up-Country Singhalesen (23,33%) gefunden, mit dem höchsten Beitrag von Sub-Haplogruppen U1a’c (12 bzw. 5%) und U7a (13,33 bzw. 11,67%).

Die Haplogruppenhäufigkeit der Vedda-Personen von jedem Standort ist in der ergänzenden Tabelle S7 angegeben. Es wurde festgestellt, dass die niedrige Frequenz der M-Haplogruppe und die hohen Frequenzen der R- und U-Haplogruppen die einzigartigen Eigenschaften von Vedda sind. Die Häufigkeit dieser Haplogruppen variierte jedoch zwischen Vedda von verschiedenen Standorten. Zwei Vedda-Gruppen (VA-Dam und VA-Hen) besitzen die Häufigkeit einer Haplogruppe, die der von Singhalesen im Hochland, Singhalesen im Tiefland und Tamilen in Sri Lanka nahe kommt, was auf die genetische Beimischung zwischen diesen beiden Vedda-Gruppen und den anderen drei Populationen hinweist. Die Vedda-Untergruppen teilten die Haplogruppe R30b / R8a1a3 bei relativ hohen Frequenzen, das Merkmal, das bei Untergruppen anderer ethnischer Bevölkerungsgruppen auf der Insel nicht zu finden ist, deutete auf einen gemeinsamen Ursprung der Vedda-Bevölkerung hin. Medianes Verbindungsnetzwerk von HVS-1 und Teil der HVS-2-Sequenz der Haplogruppen R (62 Individuen, 21 Haplotypen) und U (52 Individuen, 25 Haplotypen) aus fünf srilankischen Populationen wurden konstruiert (Ergänzende Abbildung S3). Im Allgemeinen stimmte das Netzwerk mit der mtDNA-Haplogruppenanalyse überein. Obwohl beide Haplogruppen weniger häufig vorkommen, die Haplotypen, zu diesen Haplogruppen gehören, der anderen vier srilankischen Populationen waren vielfältiger als Vedda-Haplotypen, die auch innerhalb des Baumes stark abgeleitet waren. Das mediane Verbindungsnetzwerk mit Daten von HVS-1 und einem Teil von HVS-2-Sequenzen der Haplogruppen R und U24, 25 aus indischen Populationen wurde ebenfalls durchgeführt (ergänzende Abbildung S4). Die mediane Verknüpfungsnetzwerkkarte zeigt keinen basalen Status der Vedda-Sequenzen für die genetische Differenzierung der Haplogruppen R und U. Es ist wahrscheinlicher, dass diese beiden Haplogruppen, die in der Vedda besonders verbreitet sind, von Vorfahren auf dem indischen Subkontinent stammen.

Drei Haplogruppen, M2, U2i (U2a, U2b und U2c) und R5, anerkannt als ein Paket indischer spezifischer mtDNA-Kladen mit einem ebenso tiefen Koaleszenzalter von etwa 50 000-70 000 Jahren,30 waren in der ethnischen Bevölkerung Sri Lankas vorhanden. Alle untersuchten ethnischen Populationen besitzen R5 mit der höchsten Häufigkeit (10%), die bei Singhalesen im Hochland beobachtet wurde. Die Haplogruppe U2 wurde in allen untersuchten Populationen mit ihrer ausgeprägten hohen Häufigkeit gefunden (10.25%) bei srilankischen Tamilen beobachtet. Interessanterweise sind alle Arten von Haplogruppen in Vedda-Leuten, außer den Sub-Haplogruppen M36d und M73’79, auch in anderen ethnischen Gruppen vertreten.

Es gibt mehrere westeurasische Haplogruppen, die zu den Linien HV, W, T, U1, U5 und U7 gehören und in der ethnischen Bevölkerung Sri Lankas vorkommen (Tabelle 2). Der westeurasische Beitrag zum mütterlichen Genpool in Sri Lanka betrug etwa 19,94%, was mit dem vorherigen Bericht übereinstimmt.30 Interessanterweise Westeurasische Beiträge von 28.19, 25.33, 25 und 20% wurden in den srilankischen Tamilen, Vedda Menschen, Up-Country Singhalesen und Low-Country Singhalesen festgestellt, während nur ein 1.75% Beitrag in den indischen Tamilen offensichtlich war. Dies spiegelte erneut die enge genetische Beziehung zwischen den beiden singhalesischen Gruppen und srilankischen Tamilen im Vergleich zu indischen Tamilen wider. Die Haplogruppen U1a und U7a waren die einzigen westeurasischen Linien, die bei den Vedda beobachtet wurden. Haplogruppe T war in zwei Populationen vorhanden; Low-Country Singhalesen (5%) und Sri Lanka Tamilen (2,56%), während Haplogruppe W nur in Up-Country Singhalesen (3,33%) vorhanden war.

Niedrigere Häufigkeiten als die westeurasischen Haplogruppen wurden für die ostasiatischen Haplogruppen (M12 und G) beobachtet, die 5,91% der Gesamtvariation ausmachten.

Die genetische Struktur der srilankischen Populationen

Die Gruppierung der srilankischen Populationen nach verschiedenen Kriterien wurde unter Verwendung einer Analyse der molekularen Varianz durchgeführt und statistisch getestet, um das beste Modell für die natürliche Populationsdifferenzierung zu ermitteln. Neben den ethnischen Kriterien, die in dieser Studie angewendet wurden, wurden die Populationen nach sprachlichen, geografischen und mutmaßlichen rassischen Kriterien in Gruppen eingeteilt. Die Ergebnisse sind in Tabelle 3 dargestellt. Als die Populationen in zwei Gruppen eingeteilt wurden, Vedda-Leute, die wahrscheinlich die frühesten Bewohner der Insel darstellen, und andere für Neuankömmlinge, ergab diese Gruppierung die minimale Varianz zwischen den Untergruppen innerhalb einer Population (87,85, P<0,001) und maximale Varianz zwischen den Populationen (8,15, P<0.001), das das beste Modell für die Bevölkerungsdifferenzierung darstellt. Dieses Modell der Populationsdifferenzierung ist mit einer tieferen Wurzel genetischer Divergenz zwischen den Vedda- und Nicht-Vedda-Populationen kompatibel als zwischen Untergruppen innerhalb jeder Population.

Tabelle 3 Analyse der molekularen Varianz (AMOVA) der srilankischen Populationen