Articles

Histoire de l’ADN mitochondrial des ethnies sri-lankaises: leurs relations au sein de l’île et avec les populations sous-continentales indiennes

polymorphismes de l’ADNmt et haplotypes partagés du Sri Lanka

L’ADNmt HVS-1 (np. 16 024 à np. 16 383 du RCRS) et une partie du HVS-2 (np. 57 à np. 309 des séquences rCRS) ont été obtenues auprès de 271 individus appartenant à cinq populations ethniques sri-lankaises: 75 personnes Vedda, 60 Cingalais des Hauts-pays et 40 Cingalais des Bas-pays, 39 Tamouls Sri-Lankais et 57 Tamouls indiens. Les polymorphismes observés dans l’étude sont présentés dans le tableau complémentaire S3. Des délétions ont été observées aux positions nucléotidiques 16 166, 16 258 et 249 alors que des insertions ont été rencontrées aux positions 16 188, 16 380 et 284.

Un total de 147 haplotypes ont été observés dans les cinq populations sri-lankaises de cette étude. Trente d’entre eux ont été partagés entre au moins deux populations. La population Vedda a la plus faible proportion d’haplotypes partagés parmi leurs sous-groupes (63%), ce qui indique leur plus grande diversité génétique parmi les sous-groupes. Les Tamouls Sri-lankais et les Tamouls indiens possédaient une proportion commune similaire (85 %), tandis que le cingalais du Haut-pays a un nombre légèrement plus élevé d’haplotypes spécifiques à la population (73 %) que le cingalais du Bas-pays (70 %) (tableau 1). Fait intéressant, le plus grand nombre de partage d’haplotypes a été trouvé entre Vedda et le cingalais du Haut-pays et avec le cingalais du Bas-pays. En revanche, il n’y avait aucun partage d’haplotype entre le peuple Vedda et aucun des Tamouls (tableau 1).

Tableau 1 Partage des haplotypes et probabilités d’appariement entre les populations sri-lankaises

Indices de diversité

La diversité génétique au sein des sous-groupes de populations ethniques sri-lankaises a été évaluée par la diversité des haplotypes (H) et diversité nucléotidique (π). Les résultats sont résumés dans le tableau supplémentaire S4. H variait de 0,503 à 1,000 et π de 0,006 à 0,019. En général, les sous-groupes cingalais (Haut et Bas pays) et tamouls (Sri Lankais et Indiens) présentaient une diversité d’haplotypes relativement plus élevée (0,861-1,000) que ceux du Vedda (0,503–0,965). La tendance de la diversité des nucléotides suit la diversité des haplotypes. Des diversités nucléotidiques plus élevées (0,009–0,019) ont été observées chez les Cingalais et les Tamouls. Notamment, une diversité nucléotidique plus faible (0,006–0,009) a été observée dans deux sous-groupes Vedda (VA-Rat et VA–Dal) que dans le reste des sous-groupes Vedda (0,012-0,014).

Modèle de variation génétique tel que révélé par la distance génétique et les analyses phylogénétiques

Les distances génétiques entre 21 sous-groupes de cinq populations ethniques du Sri Lanka ont été calculées à partir de séquences HVS-1 et d’une partie de séquences HVS-2 en utilisant la méthode Tajima-Nei.27 Le résultat est indiqué dans le tableau supplémentaire S5. Le test de Mantel pour la correspondance entre les distances minimales génétiques et géographiques a également été effectué, à partir duquel la corrélation significative entre les deux matrices de distance (r = 0,15; P = 0,02) a été obtenue; le résultat suggère que le modèle de différenciation génétique observé parmi les populations étudiées est au moins partiellement explicable à la lumière du modèle d’isolement par distance.

Un arbre voisin non enraciné a été construit pour les relations phylogénétiques entre 21 sous-groupes de cinq populations ethniques du Sri Lanka, comme illustré à la figure 2. Une autre construction phylogénétique a également été effectuée pour les cinq populations ethniques lorsque tous les sous-groupes d’une population ont été effondrés; le résultat est illustré dans la figure supplémentaire S1.

Figure 2
figure2

Arbre de jonction voisin non enraciné (NJ) des 21 populations sri-lankaises sur la base des distances génétiques nettes. (Les abréviations sont indiquées dans le tableau supplémentaire S1).

Il ressort clairement de la figure supplémentaire S1 que la population Vedda était génétiquement séparée des autres populations ethniques sri-lankaises, la distance génétique étant moins grande entre elles. Les Tamouls indiens ont établi la relation génétique la plus étroite avec leurs homologues ethniques sri-lankais. Les Cingalais du haut-pays ont formé des affiliations génétiques étroites avec les Tamouls du Sri Lanka et les Cingalais du Bas-pays.

La figure 2 illustre davantage les relations génétiques entre les populations étudiées, avec la description de la variation génétique entre les sous-groupes au sein de chaque population ethnique. De cet arbre voisin non enraciné, il a été confirmé qu’il y avait une plus grande distance génétique entre le peuple Vedda et le reste des populations. Deux sous-groupes Vedda (VA-Dam et VA-Hen) ont été mêlés aux Cingalais, à la fois dans le Haut-pays et dans le Bas-pays, mais pas avec aucun des Tamouls. Les Tamouls, Sri-lankais et Indiens, se sont regroupés. La matrice génétique dans laquelle les sous-groupes tamoul et cingalais, qui ne peuvent pas être clairement séparés les uns des autres, ont été observés vers une branche majeure de l’arbre, la majorité du peuple Vedda vers l’autre. Fait intéressant, certains groupes cingalais (SU-Mul, SU-Mee et SL-Lan) étaient relativement plus proches des Tamouls que du reste des sous-groupes cingalais.

Analyse en composantes principales

Les distances génétiques nettes des séquences HVS-1 et d’une partie des séquences HVS-2 (Tableau supplémentaire S5), et des fréquences de distribution des haplogroupes (Tableau supplémentaire S6), parmi 21 sous-groupes de cinq populations ethniques du Sri Lanka ont été traitées comme vecteurs d’entrée pour l’ACP. La figure 3 montre la carte PCA construite à partir des fréquences de distribution des haplogroupes, pour les deux premières composantes principales, qui représentent ensemble 82,44 % de la variance totale. La majorité des sous-groupes Vedda (sauf VA-Dam) étaient bien séparés des autres populations ethniques du Sri Lanka sur le premier axe PC. Leur séparation des autres populations ethniques est encore étendue sur le deuxième axe PC. La majorité des sous-groupes cingalais et tamouls forment des proximités génétiques étroites entre eux sur les deux axes PC. Une exception majeure à ce regroupement se trouve dans SU-Thu. Il était évident que les cinghalais du haut-pays sont génétiquement plus proches des Tamouls sri-lankais. D’autre part, les sous-groupes tamouls sri-lankais étaient plus proches les uns des autres par rapport aux Tamouls indiens. D’une manière générale, les sous-groupes Vedda étaient plus dispersés sur la carte de l’APC qu’au sein de toute autre population ethnique, reflétant une plus grande diversité parmi eux. La carte PCA construite à partir des distances génétiques nettes de HVS-1 et d’une partie des séquences HVS-2, qui est en accord avec la carte PCA construite à partir des fréquences de distribution des haplogroupes, est également illustrée à la figure supplémentaire S2.

Figure 3
figure3

Carte d’analyse en composantes principales (ACP) des 21 sous-populations sri-lankaises basée sur des distances génétiques nettes dérivées des fréquences de distribution des haplogroupes. (Les abréviations sont indiquées dans le tableau supplémentaire S1). Une version en couleur de cette figure est disponible sur le Journal of Human Genetics journal online.

L’APC est élargie pour inclure diverses autres populations ethniques du sous-continent indien (Tableau supplémentaire S2) Figure 4. Le résultat illustré à la figure 5 représentait 52,59 % de la variation totale. Tous les sous-groupes cingalais et tamouls se mêlent bien à la majorité des populations sous-continentales indiennes, formant une grande matrice génétique. Cependant, les Tamouls indiens ont été séparés du reste des sous-groupes sri-lankais, à l’exception de SU-Bam et SL-Ban, sur le premier axe PC. Cela renforce encore l’hypothèse selon laquelle les Tamouls indiens sont génétiquement distincts du reste des groupes ethniques sri-lankais. Certains groupes Vedda (VA-Dal, VA-Hen et VA-Dam) sont situés à la périphérie de cette matrice génétique, tandis que d’autres (VA-Pol et VA-Rat) n’ont établi qu’une relation distante avec la matrice.

Figure 4
figure4

Populations de l’Inde utilisées dans cette étude. (Les abréviations sont indiquées dans les Tableaux supplémentaires S1 et S2). Une version en couleur de cette figure est disponible sur le Journal of Human Genetics journal online.

Figure 5
figure5

Carte d’analyse en composantes principales (ACP) des 21 sous-populations sri-lankaises avec des populations indiennes sur la base des distances génétiques nettes. (Les abréviations sont indiquées dans les Tableaux supplémentaires S1 et S2). Une version en couleur de cette figure est disponible sur le Journal of Human Genetics journal online.

haplogroupe de l’ADNmt au Sri Lanka

Bien que la région codante mitochondriale contienne plusieurs sites phylogénétiquement pertinents qui sont utiles pour attribuer des haplotypes à un haplogroupe, la région témoin est également prometteuse pour l’affiliation présumée à un haplogroupe.28, 29 Selon l’affectation de l’haplogroupe basée sur HVS-1 et une partie des séquences HVS-2 de la population sri-lankaise en utilisant Mitotool (http://www.mitotool.org) 17 et Haplogrep 1515, puis en le revérifiant manuellement avec phylotree build 15 (http://www.phylotree.org) 16 (Tableau supplémentaire S3), l’ensemble l’analyse des haplogroupes a indiqué que près de 50% des individus de toutes les populations étudiées appartenaient à des lignées de l’haplogroupe M (y compris les haplogroupes M, D et G) suivies d’environ 25% des lignées R (y compris les haplogroupes R, P et T) et de 20 % des lignées U. Les autres lignées moins fréquentes étaient près de 4 % de R0 (y compris l’haplogroupe HV et H) et près de 2 % de N lignées (y compris N et W) (tableau 2).

Tableau 2 Fréquence des haplogroupes dans la population sri-lankaise

L’haplogroupe M était l’haplogroupe le plus courant chez les Tamouls indiens (70,18%), qui était principalement contribué par les sous-haplogroupes M5a (14,03%) et M2a (12,28%). Ces sous-haplogroupes ont rarement été trouvés dans d’autres populations. Les Cingalais du haut-pays, les Cingalais du Bas-pays et les Tamouls du Sri Lanka présentaient des fréquences similaires de l’haplogroupe M (41,67 – 43,59%), bien qu’ils possédaient des fréquences de sous-haplogroupes différentes. Cela pourrait indiquer que les Cinghalais mentionnés plus tard, en particulier les cinghalais du Haut-pays et les cinghalais du Bas-pays, sont plus étroitement liés les uns aux autres qu’aux Tamouls indiens qui ont une histoire de migration connue de l’Inde. Pendant ce temps, les personnes Vedda avaient la plus faible fréquence d’haplogroupe M (17,33%). Il est assez étonnant de voir une fréquence aussi inférieure de l’haplogroupe M dans la population Vedda par rapport aux groupes tribaux du sud de l’Inde (70-80%) ainsi qu’aux populations de castes du sud de l’Inde (65%).30 Cela est probablement dû à l’effet de la dérive génétique dans la plus petite population de Vedda. Ceci est corroboré par d’autres observations de la diversité réduite des intrapopulations parmi les sous-groupes de personnes Vedda.

D’autre part, les Vedda et les cingalais des pays bas présentaient des fréquences relativement élevées de l’haplogroupe R (45.33 et 25%, respectivement) qui ont été apportés principalement par le sous-haplogroupe R30b (38,67 et 20%). L’haplogroupe était moins fréquent chez les Cingalais du haut-pays, les Tamouls Sri-Lankais et les Tamouls indiens. L’haplogroupe U a été principalement trouvé dans le Vedda (29,33%) et le cingalais du haut-pays (23,33%), avec la contribution la plus élevée des sous-haplogroupes U1a’c (12 et 5%, respectivement) et U7a (13,33 et 11,67%, respectivement).

La fréquence d’haplogroupe des personnes Vedda de chaque site est indiquée dans le tableau supplémentaire S7. Les basses fréquences de l’haplogroupe M et les hautes fréquences des haplogroupes R et U se sont avérées être les caractéristiques uniques de Vedda. Cependant, les fréquences de ces haplogroupes variaient entre les Vedda de différents sites. Deux groupes Vedda (VA-Dam et VA-Hen) possèdent la fréquence de l’haplogroupe M proche de celle des Cingalais du Haut-pays, des Cingalais du Bas-pays et des Tamouls du Sri Lanka, indiquant le mélange génétique entre ces deux groupes Vedda et les trois autres populations. Les sous-groupes Vedda partageaient l’haplogroupe R30b/R8a1a3 à des fréquences relativement élevées, la caractéristique que l’on ne retrouve pas parmi les sous-groupes d’autres populations ethniques de l’île, suggérait une origine commune partagée de la population Vedda. Un réseau de jonction médian de HVS-1 et d’une partie de la séquence HVS-2 des haplogroupes R (62 individus, 21 haplotypes) et U (52 individus, 25 haplotypes) de cinq populations sri-lankaises a été construit (Figure supplémentaire S3). En général, le réseau était en accord avec l’analyse de l’haplogroupe de l’ADNmt. Bien que les possessions des deux haplogroupes soient moins fréquentes, les haplotypes, appartenant à ces haplogroupes, des quatre autres populations sri-lankaises étaient plus divers que les haplotypes Vedda, qui étaient également fortement dérivés au sein de l’arbre. Le réseau de jonction médian intégrant des données de HVS-1 et d’une partie des séquences HVS-2 des haplogroupes R et U24,25 de populations indiennes a également été réalisé (Figure supplémentaire S4). La carte médiane du réseau de jonction ne révèle pas de statut basal des séquences du Vedda pour la différenciation génétique des haplogroupes R et U. Il est plus probable que ces deux haplogroupes, particulièrement répandus dans le Vedda, proviennent d’ancêtres du sous-continent indien.

Trois haplogroupes, M2, U2i (U2a, U2b et U2c) et R5, reconnus comme un ensemble de clades d’ADNmt spécifiques à l’Inde hébergeant un âge coalescent tout aussi profond d’environ 50 000 à 70 000 ans, 30 étaient présents dans les populations ethniques du Sri Lanka. Toutes les populations ethniques étudiées possèdent R5 avec sa fréquence la plus élevée (10%) observée chez les cinghalais du haut-pays. L’haplogroupe U2 a été trouvé dans toutes les populations étudiées avec sa fréquence élevée marquée (10.25%) observés chez les Tamouls sri-lankais. Fait intéressant, tous les types d’haplogroupes chez les Vedda, à l’exception des sous-haplogroupes M36d et M73’79, sont également présentés dans d’autres groupes ethniques.

Il existe plusieurs haplogroupes d’Eurasie occidentale, appartenant aux lignées HV, W, T, U1, U5 et U7, dans les populations ethniques sri-lankaises (Tableau 2). La contribution de l’Eurasie occidentale au pool génétique maternel du Sri Lanka était d’environ 19,94%, ce qui est cohérent avec le rapport précédent.30 Fait intéressant, les contributions de l’Eurasie occidentale de 28,19, 25.33, 25 et 20% ont été détectés chez les Tamouls sri-lankais, les Vedda, les Cinghalais des pays avancés et les Cinghalais des pays bas, respectivement, alors que seule une contribution de 1,75% était évidente chez les Tamouls indiens. Cela reflétait à nouveau la relation génétique étroite entre les deux groupes cingalais et les Tamouls sri-lankais par rapport aux Tamouls indiens. Les haplogroupes U1a et U7a étaient la seule lignée d’Eurasie occidentale observée chez le peuple Vedda. L’haplogroupe T était présent dans deux populations ; les Cingalais de Bas pays (5 %) et les Tamouls du Sri Lanka (2,56 %), alors que l’haplogroupe W n’était présent que dans les Cingalais de Haut pays (3,33 %).

Des fréquences plus basses que les haplogroupes Ouest-euraséens ont été observées pour les haplogroupes Est-asiatiques (M12 et G), qui représentaient 5,91 % de la variation totale.

La structure génétique des populations sri-lankaises

Le regroupement des populations sri-lankaises selon différents critères a été réalisé et testé statistiquement, à l’aide d’une analyse de la variance moléculaire, pour révéler le meilleur modèle représentant la différenciation naturelle des populations. Outre les critères ethniques adoptés tout au long de cette étude, les populations ont été classées en groupes selon des critères linguistiques, géographiques et raciaux présumés. Les résultats sont présentés dans le tableau 3. Lorsque les populations étaient classées en deux groupes, les Vedda représentant probablement les premiers habitants de l’île et d’autres pour les nouveaux arrivants, ce groupe donnait la variance minimale entre les sous-groupes au sein d’une population (87,85, P< 0,001) et la variance maximale entre les populations (8,15, P< 0.001), représentant le meilleur modèle de différenciation de la population. Ce modèle de différenciation des populations est compatible avec une racine plus profonde de divergence génétique entre les populations Vedda et non Vedda qu’entre les sous-groupes au sein de chaque population.

Tableau 3 Analyse de la variance moléculaire (AMOVA) des populations sri-lankaises