Articles

Historia del ADN mitocondrial de los pueblos étnicos de Sri Lanka: sus relaciones dentro de la isla y con las poblaciones subcontinentales indias

Polimorfismos de ADNmt y haplotipos compartidos de Sri Lanka

El ADNmt HVS-1 (np. 16 024 a np. 16.383 de las RCR) y parte de HVS-2 (np. 57 a np. 309 de las secuencias RCR) se obtuvieron de 271 individuos pertenecientes a cinco poblaciones étnicas de Sri Lanka: 75 personas Vedda, 60 cingaleses del Norte y 40 cingaleses del Sur, 39 Tamiles de Sri Lanka y 57 Tamiles indios. Los polimorfismos observados en el estudio se presentan en la Tabla suplementaria S3. Se observaron deleciones en las posiciones de nucleótidos 16 166, 16 258 y 249, mientras que se encontraron inserciones en las posiciones 16 188, 16 380 y 284.

Se observaron un total de 147 haplotipos en las cinco poblaciones de Sri Lanka de este estudio. Treinta de ellos fueron compartidos entre al menos dos poblaciones. La población Vedda tiene la proporción más baja de haplotipos compartidos entre sus subgrupos (63%), lo que indica su mayor diversidad genética entre los subgrupos. Los tamiles de Sri Lanka y los tamiles indios poseían una proporción compartida similar (85%), mientras que los cingaleses del interior tienen un número ligeramente mayor de haplotipos específicos de la población (73%) que los cingaleses de los países bajos (70%) (Cuadro 1). Curiosamente, el mayor número de haplotipos compartidos se encontró entre Vedda con cingaleses del Norte y cingaleses del Bajo país. Por otro lado, no hubo intercambio de haplotipos entre el pueblo Vedda y ninguno de los tamiles (Tabla 1).

Tabla 1 Probabilidades de compartir y emparejar Haplotipos entre poblaciones de Sri Lanka

Índices de diversidad

La diversidad genética dentro de los subgrupos de poblaciones étnicas de Sri Lanka se evaluó por diversidad de haplotipos (H) y diversidad de nucleótidos (π). Los resultados se resumen en el Cuadro suplementario S4. H varió de 0,503 a 1,000 y π de 0,006 a 0,019. En general, los subgrupos cingaleses (del interior y del interior) y tamiles (de Sri Lanka e India) exhibieron una diversidad de haplotipos relativamente mayor (0,861-1,000) que los del Vedda (0,503-0,965). La tendencia de la diversidad de nucleótidos sigue la diversidad de haplotipos. Se observaron mayores diversidades de nucleótidos (0,009–0,019) entre cingaleses y tamiles. En particular, se observó una menor diversidad de nucleótidos (0,006–0,009) en dos subgrupos Vedda (VA-Rata y VA-Dal) que en el resto de los subgrupos Vedda (0,012–0,014).

El patrón de variación genética revelado por la distancia genética y los análisis filogenéticos

Las distancias genéticas entre 21 subgrupos de cinco poblaciones étnicas de Sri Lanka se calcularon a partir de secuencias HVS-1 y parte de HVS-2 utilizando el método Tajima-Nei.27 El resultado se muestra en el Cuadro suplementario S5. También se realizó la prueba de Mantel para la correspondencia entre distancias mínimas genéticas y geográficas, a partir de la cual se obtuvo la correlación significativa entre las dos matrices de distancia (r=0,15; P=0,02) ; el resultado sugirió que el patrón de diferenciación genética observado entre las poblaciones estudiadas era al menos parcialmente explicable a la luz del modelo de aislamiento a distancia.

Se construyó un árbol de unión de vecinos sin raíces para las relaciones filogenéticas entre 21 subgrupos de cinco poblaciones étnicas de Sri Lanka, como se ilustra en la Figura 2. También se realizó otra construcción filogenética para las cinco poblaciones étnicas cuando todos los subgrupos dentro de una población se colapsaron; el resultado se muestra en la Figura Suplementaria S1.

Figura 2
figura2

sin raíces vecino-joining (NJ) árbol del 21 de Sri Lanka poblaciones con base en la red distancias genéticas. (Las abreviaturas figuran en el cuadro suplementario S1).

De la Figura suplementaria S1 se desprende claramente que la población Vedda estaba genéticamente separada de otras poblaciones étnicas de Sri Lanka, con una distancia genética menor entre ellas. Los tamiles indios establecieron la relación genética más estrecha con sus homólogos étnicos de Sri Lanka. Los cingaleses del interior formaron estrechas afiliaciones genéticas con los tamiles de Sri Lanka y los cingaleses del interior.

La Figura 2 ilustra más información sobre las relaciones genéticas entre las poblaciones estudiadas, con la descripción de la variación genética entre subgrupos dentro de cada población étnica. A partir de este árbol vecino sin raíces, se confirmó que había una mayor distancia genética entre el pueblo Vedda y el resto de las poblaciones. Dos subgrupos Vedda (VA-Dam y VA-Hen) se mezclaron con los cingaleses, tanto del Norte como del Bajo, pero no con ninguno de los tamiles. Los tamiles, tanto de Sri Lanka como de la India, se agruparon. La matriz genética en la que los subgrupos tamil y cingalés, que no pueden separarse claramente entre sí, se observaron hacia una rama principal del árbol, con la mayoría de la gente Vedda hacia la otra. Curiosamente, algunos grupos cingaleses (SU-Mul, SU-Mee y SL-Lan) estaban relativamente más cerca de los tamiles que del resto de subgrupos cingaleses.

Análisis de componentes principales

Las distancias genéticas netas de las secuencias HVS-1 y parte de HVS-2 (Tabla Suplementaria S5), y de las frecuencias de distribución de haplogrupos (Tabla Suplementaria S6), entre 21 subgrupos de cinco poblaciones étnicas de Sri Lanka, se trataron como vectores de entrada para el PCA. La Figura 3 muestra el mapa de PCA construido a partir de frecuencias de distribución de haplogrupos, para los dos primeros componentes principales, que juntos representan el 82,44% de la varianza total. La mayoría de los subgrupos Vedda (excepto VA-Dam) estaban bien separados de otras poblaciones étnicas de Sri Lanka en el primer eje PC. Su separación de otras poblaciones étnicas se amplía aún más en el segundo eje del PC. La mayoría de los subgrupos cingaleses y tamiles forman proximidades genéticas cercanas entre sí en ambos ejes de PC. La principal excepción a esta agrupación se encuentra en SU-Thu. Era evidente que los cingaleses del norte del país están genéticamente más cerca de los tamiles de Sri Lanka. Por otra parte, los subgrupos tamiles de Sri Lanka estaban más cerca unos de otros en comparación con los tamiles indios. En términos generales, los subgrupos Vedda estaban más dispersos en el mapa de la PCA que dentro de cualquier otra población étnica, lo que refleja una mayor diversidad entre ellos. El mapa de PCA construido a partir de las distancias genéticas netas de las secuencias HVS-1 y parte de HVS-2, que está de acuerdo con el mapa de PCA construido a partir de las frecuencias de distribución de haplogrupo, también se muestra en la Figura suplementaria S2.

Figura 3
figura 3

Mapa de análisis de componentes principales (PCA) de las 21 subpoblaciones de Sri Lanka basado en distancias genéticas netas derivadas de frecuencias de distribución de haplogrupo. (Las abreviaturas figuran en el cuadro suplementario S1). Una versión a todo color de esta figura está disponible en el Journal of Human Genetics journal en línea.

La PCA se amplía aún más para incluir otras poblaciones étnicas del subcontinente indio (Tabla suplementaria S2) Figura 4. El resultado mostrado en la Figura 5 representó el 52,59% de la variación total. Todos los subgrupos cingaleses y tamiles se entremezclan bien con la mayoría de las poblaciones subcontinentales indias, formando una gran matriz genética. Sin embargo, los tamiles indios se separaron del resto de los subgrupos de Sri Lanka, excepto SU-Bam y SL-Ban, en el primer eje de PC. Esto refuerza aún más la hipótesis de que los tamiles indios son genéticamente distintos del resto de los grupos étnicos de Sri Lanka. Algunos grupos Vedda (VA-Dal, VA-Hen y VA-Dam) se encuentran en la periferia de esta matriz genética, mientras que otros (VA-Pol y VA-Rat) establecieron solo una relación remota con la matriz.

Figura 4
figura 4

las Poblaciones de la India que fueron utilizados en este estudio. (Las abreviaturas figuran en los cuadros suplementarios S1 y S2). Una versión a todo color de esta figura está disponible en el Journal of Human Genetics journal en línea.

Figura 5
figura 5

el análisis de componentes Principales (PCA) mapa del 21 de Sri Lanka subpoblaciones con poblaciones indígenas, basándose en net distancias genéticas. (Las abreviaturas figuran en los cuadros suplementarios S1 y S2). Una versión a todo color de esta figura está disponible en el Journal of Human Genetics journal en línea.

haplogrupo de ADNmt en Sri Lanka

Aunque la región codificadora mitocondrial contiene varios sitios filogenéticamente relevantes que son útiles para asignar haplotipos a un haplogrupo, la región de control también es prometedora en la afiliación putativa de haplogrupo.28, 29 De acuerdo con la asignación de haplogrupo basada en las secuencias HVS-1 y parte de HVS-2 de la población de Sri Lanka utilizando Mitotool (http://www.mitotool.org)17 y Haplogrep 1515 y luego verificarlo manualmente de nuevo con phylotree build 15 (http://www.phylotree.org)16 (Tabla Suplementaria S3), el haplogrupo general el análisis indicó que casi el 50% de los individuos de todas las poblaciones estudiadas pertenecían a los linajes del haplogrupo M (incluidos los haplogrupo M, D y G), seguidos de aproximadamente el 25% de los linajes R (incluidos los haplogrupo R, P y T) y el 20% de los linajes U. Otros linajes menos frecuentes fueron casi el 4% de R0 (incluidos los haplogrupos HV y H) y casi el 2% de los linajes N (incluidos N y W) (Tabla 2).

Frecuencia del Haplogrupo de la tabla 2 en la población de Sri Lanka

El haplogrupo M fue el haplogrupo más común en los tamiles indios (70,18%), que fue contribuido principalmente por los sub-haplogrupos M5a (14,03%) y M2a (12,28%). Estos sub-haplogrupos rara vez se encontraron en otras poblaciones. Los tamiles cingaleses del norte, cingaleses del bajo y de Sri Lanka exhibieron frecuencias similares de haplogrupo M (41,67-43,59%), aunque poseían frecuencias diferentes de sub-haplogrupos. Esto podría indicar que los mencionados más tarde, especialmente los cingaleses del Norte y los cingaleses de los países bajos, están más estrechamente relacionados entre sí que con los tamiles indios que tienen un historial de migración conocido desde la India. Mientras tanto, las personas Vedda tenían la frecuencia más baja de haplogrupo M (17,33%). Es bastante sorprendente ver una frecuencia tan baja de haplogrupo M en la población Vedda en comparación con los grupos tribales del sur de la India (70-80%), así como con las poblaciones de castas del sur de la India (65%).30 Esto se debe probablemente al efecto de la deriva genética en la población más pequeña de Vedda. Esto es apoyado por otras observaciones de la reducida diversidad intrapoblacional entre los subgrupos de personas Vedda.

Por otro lado, los Vedda y los cingaleses de países bajos mostraron frecuencias relativamente altas de haplogrupo R (45.33 y 25%, respectivamente), a la que contribuyó principalmente el sub-haplogrupo R30b (38,67 y 20%). El haplogrupo era menos frecuente en los cingaleses del interior, los tamiles de Sri Lanka y los tamiles indios. El haplogrupo U se encontró principalmente en Vedda (29,33%) y cingaleses del interior (23,33%), con la mayor contribución de los sub-haplogrupos U1a’c (12 y 5%, respectivamente) y U7a (13,33 y 11,67%, respectivamente).

La frecuencia del haplogrupo de personas Vedda de cada sitio se muestra en la Tabla suplementaria S7. Se encontró que la baja frecuencia del haplogrupo M y las altas frecuencias de los haplogrupos R y U eran las características únicas de Vedda. Sin embargo, las frecuencias de estos haplogrupos variaron entre Vedda de diferentes sitios. Dos grupos Vedda (VA-Dam y VA-Hen) poseen la frecuencia del haplogrupo M cercana a la de los tamiles cingaleses del Norte, Cingaleses del Bajo y de Sri Lanka, lo que indica la mezcla genética entre estos dos grupos Vedda y las otras tres poblaciones. Los subgrupos Vedda compartieron el haplogrupo R30b / R8a1a3 a frecuencias relativamente altas, la característica no encontrada entre los subgrupos de otras poblaciones étnicas en la isla, sugería un origen compartido común de la población Vedda. Se construyó una red de unión mediana de HVS-1 y parte de la secuencia HVS-2 de haplogrupos R (62 individuos, 21 haplotipos) y U (52 individuos, 25 haplotipos) de cinco poblaciones de Sri Lanka (Figura suplementaria S3). En general, la red estaba de acuerdo con el análisis de haplogrupos del ADNmt. Aunque posee menos frecuencia de ambos haplogrupos, los haplotipos, pertenecientes a estos haplogrupos, de las otras cuatro poblaciones de Sri Lanka eran más diversos que los haplotipos Vedda, que también eran altamente derivados dentro del árbol. También se realizó la red de Unión Mediana que incorpora datos de secuencias HVS-1 y parte de HVS-2 de haplogrupos R y U24, 25 de poblaciones indias (Figura suplementaria S4). El mapa de la red de Unión Mediana no revela un estado basal de las secuencias de Vedda para la diferenciación genética de los haplogrupos R y U. Es más probable que estos dos haplogrupos, encontrados particularmente prevalentes en el Vedda, se derivaran de antepasados en el subcontinente indio.

Tres haplogrupos, M2, U2i (U2a, U2b y U2c) y R5, reconocidos como un paquete de clados de ADNmt específicos de la India que albergan una edad coalescente igualmente profunda de aproximadamente 50 000-70 000 años,30 estaban presentes en las poblaciones étnicas de Sri Lanka. Todas las poblaciones étnicas estudiadas poseen R5 con su mayor frecuencia (10%) observada en cingaleses del interior. El haplogrupo U2 se encontró en todas las poblaciones estudiadas con su marcada alta frecuencia (10.25%) observados en tamiles de Sri Lanka. Curiosamente, todos los tipos de haplogrupos en la gente Vedda, excepto los sub-haplogrupos M36d y M73’79, también se presentan en otros grupos étnicos.

Hay varios haplogrupos de Eurasia Occidental, pertenecientes a los linajes HV, W, T, U1, U5 y U7, encontrados en poblaciones étnicas de Sri Lanka (Tabla 2). La contribución de Eurasia occidental a la reserva genética materna de Sri Lanka fue de aproximadamente el 19,94%, lo que concuerda con el informe anterior.30 Curiosamente, las contribuciones de Eurasia Occidental de 28,19, 25.se detectaron 33, 25 y 20% en los tamiles de Sri Lanka, los Vedda, los cingaleses del Norte y los cingaleses de los países bajos, respectivamente, mientras que solo se observó una contribución del 1,75% en los tamiles indios. Esto reflejó una vez más la estrecha relación genética entre los dos grupos cingaleses y los tamiles de Sri Lanka en comparación con los tamiles indios. El Haplogrupo U1a y U7a fueron el único linaje eurasiático occidental observado en el pueblo Vedda. El Haplogrupo T estaba presente en dos poblaciones; cingaleses de países bajos (5%) y tamiles de Sri Lanka (2,56%), mientras que el Haplogrupo W estaba presente solo en cingaleses de países altos (3,33%).

Se observaron frecuencias más bajas que los haplogrupos de Eurasia Occidental para los haplogrupos de Asia Oriental (M12 y G), que representaron el 5,91% de la variación total.

La estructura genética de las poblaciones de Sri Lanka

La agrupación de las poblaciones de Sri Lanka de acuerdo con diferentes criterios se realizó y probó estadísticamente, utilizando un análisis de varianza molecular, para revelar el mejor modelo que representa la diferenciación natural de la población. Además de los criterios étnicos adoptados a lo largo de todo este estudio, las poblaciones se clasificaron en grupos de acuerdo con criterios lingüísticos, geográficos y raciales putativos. Los resultados se muestran en la Tabla 3. Cuando las poblaciones se clasificaron en dos grupos, los Vedda probablemente representan a los primeros habitantes de la isla y otros para los recién llegados, esta agrupación dio la varianza mínima entre subgrupos dentro de una población (87.85, P<0.001) y la varianza máxima entre poblaciones (8.15, P<0.001), que representa el mejor modelo para la diferenciación de la población. Este modelo de diferenciación poblacional es compatible con una raíz de divergencia genética más profunda entre las poblaciones Vedda y no Vedda que entre subgrupos dentro de cada población.

Tabla 3 Análisis de varianza molecular (AMOVA) de Sri Lanka poblaciones