Articles

il DNA Mitocondriale storia dello Sri Lanka etnica persone: i loro rapporti all’interno dell’isola e con l’Indiano subcontinental popolazioni

polimorfismi del dna Mitocondriale e condiviso aplotipi di Sri Lanka

Il mtDNA HVS-1 (np. 16 024 a np. 16 383 del RCRS) e parte di HVS-2 (np. 57 a np. 309 delle sequenze RCR) sono state ottenute da 271 individui appartenenti a cinque popolazioni etniche dello Sri Lanka: 75 Vedda persone, 60 Up-country singalesi e 40 Low-country singalesi, 39 tamil dello Sri Lanka e 57 tamil indiani. I polimorfismi osservati nello studio sono riportati nella Tabella supplementare S3. Le delezioni sono state osservate nelle posizioni nucleotidiche 16 166, 16 258 e 249 mentre le inserzioni sono state riscontrate in 16 188, 16 380 e 284.

Sono stati osservati un totale di 147 aplotipi nelle cinque popolazioni dello Sri Lanka di questo studio. Trenta di loro sono stati condivisi tra almeno due popolazioni. La popolazione Vedda ha la percentuale più bassa di aplotipi condivisi tra i loro sottogruppi (63%) che indica la loro maggiore diversità genetica tra i sottogruppi. I tamil dello Sri Lanka e i tamil indiani possedevano una proporzione condivisa simile (85%), mentre i singalesi dell’Alto paese hanno un numero leggermente superiore di aplotipi specifici della popolazione (73%) rispetto ai singalesi dei paesi bassi (70%) (Tabella 1). È interessante notare che, più alto numero di condivisione aplotipo è stato trovato tra Vedda con Up-country singalese e con Low-country singalese. D’altra parte, non c’era alcuna condivisione dell’aplotipo tra il popolo Vedda con nessuno dei Tamil (Tabella 1).

Tabella 1 Aplotipo la condivisione e la corrispondente probabilità tra Sri Lanka popolazioni

indici di Diversità

la diversità Genetica all’interno di sottogruppi di Sri Lanka popolazioni etniche è stato valutato da aplotipo diversità (H) e la diversità nucleotidica (π). I risultati sono riassunti nella tabella supplementare S4. H variava da 0,503 – 1,000 e π da 0,006-0,019. In generale, i sottogruppi singalesi (Up-country e Low-country) e Tamil (Sri Lanka e indiani) hanno mostrato una diversità aplotipica relativamente più elevata (0,861–1,000) rispetto a quelli del Vedda (0,503–0,965). La tendenza della diversità nucleotidica segue la diversità dell’aplotipo. Diversità nucleotidiche più elevate (0,009–0,019) sono state osservate tra singalesi e tamil. In particolare, una minore diversità nucleotidica (0,006–0,009) è stata osservata in due sottogruppi Vedda (VA-Rat e VA-Dal) rispetto al resto dei sottogruppi Vedda (0,012–0,014).

Modello di variazione genetica come rivelato dalla distanza genetica e dalle analisi filogenetiche

Le distanze genetiche tra 21 sottogruppi di cinque popolazioni etniche dello Sri Lanka sono state calcolate da sequenze HVS-1 e parte di HVS-2 utilizzando il metodo Tajima-Nei.27 Il risultato è mostrato nella Tabella supplementare S5. È stato anche eseguito il test Mantel per la corrispondenza tra distanze minime genetiche e geografiche, da cui è stata ottenuta la correlazione significativa tra le due matrici di distanza (r=0,15; P=0,02) ; il risultato ha suggerito che il modello di differenziazione genetica osservato tra le popolazioni studiate fosse almeno in parte spiegabile alla luce del modello di isolamento per distanza.

È stato costruito un albero che unisce i vicini senza radici per le relazioni filogenetiche tra 21 sottogruppi di cinque popolazioni etniche dello Sri Lanka come illustrato nella Figura 2. Un’altra costruzione filogenetica è stata eseguita anche per le cinque popolazioni etniche quando tutti i sottogruppi all’interno di una popolazione sono stati crollati; il risultato è mostrato nella figura supplementare S1.

Figura 2
figure2

Unrooted neighbor-joining (NJ) albero delle 21 popolazioni dello Sri Lanka in base alle distanze genetiche nette. (Le abbreviazioni sono riportate nella tabella supplementare S1).

È abbastanza chiaro dalla figura supplementare S1 che la popolazione Vedda era geneticamente separata dalle altre popolazioni etniche dello Sri Lanka, con una distanza genetica minore tra loro. Tamil indiani stabilito il rapporto genetico più stretto con le loro controparti etniche dello Sri Lanka. Up-country singalese formata stretti affiliazioni genetiche con tamil dello Sri Lanka e basso paese singalese.

La figura 2 illustra ulteriori approfondimenti sulle relazioni genetiche tra le popolazioni studiate, con la descrizione della variazione genetica tra sottogruppi all’interno di ciascuna popolazione etnica. Da questo albero non radicato vicino di casa, è stato confermato che c’era una maggiore distanza genetica tra il popolo Vedda e il resto delle popolazioni. Due sottogruppi Vedda (VA-Dam e VA-Hen) sono stati mescolati con i singalesi, sia Up-country che Low-country, ma non con nessuno dei Tamil. I Tamil, sia dello Sri Lanka e indiani, raggruppati insieme. La matrice genetica in cui i sottogruppi tamil e singalese, che non possono essere chiaramente separati l’uno dall’altro, sono stati osservati verso un ramo principale dell’albero, con la maggior parte del popolo Vedda verso l’altro. È interessante notare che alcuni gruppi singalesi (SU-Mul, SU-Mee e SL-Lan) erano relativamente più vicini ai Tamil che al resto dei sottogruppi singalesi.

Principal component analysis

Le distanze genetiche nette da HVS-1 e parte delle sequenze HVS-2 (Tabella supplementare S5) e dalle frequenze di distribuzione degli aplogruppi (Tabella supplementare S6), tra 21 sottogruppi di cinque popolazioni etniche dello Sri Lanka sono state trattate come vettori di input per PCA. La figura 3 mostra la mappa PCA costruita dalle frequenze di distribuzione degli aplogruppi, per le prime due componenti principali, che insieme rappresentano l ‘ 82,44% della varianza totale. La maggior parte dei sottogruppi Vedda (tranne VA-Dam) erano ben separati dalle altre popolazioni etniche dello Sri Lanka sul primo asse PC. La loro separazione dalle altre popolazioni etniche è ulteriormente estesa sul secondo asse del PC. La maggior parte dei sottogruppi singalesi e Tamil formano stretti prossimità genetiche tra di loro su entrambi gli assi PC. La principale eccezione a questo clustering si trova in SU-Gio. Era evidente che i singalesi dell’Alto paese sono geneticamente più vicini ai tamil dello Sri Lanka. D’altra parte, i sottogruppi tamil dello Sri Lanka erano più vicini l’uno all’altro rispetto ai tamil indiani. In generale, i sottogruppi Vedda erano più dispersi sulla mappa PCA che all’interno di qualsiasi altra popolazione etnica, riflettendo una maggiore diversità tra di loro. La mappa PCA costruita dalle distanze genetiche nette da HVS-1 e parte delle sequenze HVS-2, che è in accordo con la mappa PCA costruita dalle frequenze di distribuzione dell’aplogruppo, è anche mostrata nella figura supplementare S2.

Figura 3
figure3

Principal Component analysis (PCA) mappa delle 21 sottopopolazioni dello Sri Lanka basata su distanze genetiche nette derivate dalle frequenze di distribuzione degli aplogruppi. (Le abbreviazioni sono riportate nella tabella supplementare S1). Una versione a colori di questa figura è disponibile presso il Journal of Human Genetics journal online.

Il PCA è esteso ulteriormente per includere varie altre popolazioni etniche del subcontinente indiano (Tabella supplementare S2) Figura 4. Il risultato mostrato nella Figura 5 ha rappresentato il 52,59% della variazione totale. Tutti i sottogruppi singalesi e tamil si mescolano bene con la maggior parte delle popolazioni subcontinenti indiane, formando una grande matrice genetica. Tuttavia, Tamil indiani sono stati separati dal resto dei sottogruppi dello Sri Lanka, tranne SU-Bam e SL-Ban, sul primo asse PC. Ciò rafforza ulteriormente l’ipotesi che i Tamil indiani siano geneticamente distinti dal resto dei gruppi etnici dello Sri Lanka. Alcuni gruppi Vedda (VA-Dal, VA-Hen e VA-Dam) si trovano alla periferia di questa matrice genetica, mentre altri (VA-Pol e VA-Rat) hanno stabilito solo una relazione remota con la matrice.

Figura 4
figure4

Popolazioni dell’India che sono state utilizzate in questo studio. (Le abbreviazioni sono riportate nella tabella supplementare S1 e nella tabella supplementare S2). Una versione a colori di questa figura è disponibile presso il Journal of Human Genetics journal online.

Figura 5
figure5

analisi delle componenti Principali (PCA) mappa del 21 Sri Lanka sottopopolazioni con popolazioni indie basato su net distanze genetiche. (Le abbreviazioni sono riportate nella tabella supplementare S1 e nella tabella supplementare S2). Una versione a colori di questa figura è disponibile presso il Journal of Human Genetics journal online.

aplogruppo mtDNA in Sri Lanka

Sebbene la regione di codifica mitocondriale contenga diversi siti filogeneticamente rilevanti che sono utili nell’assegnazione di aplotipi a un aplogruppo, la regione di controllo è anche promettente nell’affiliazione aplogruppo putativo.28, 29, Secondo l’aplogruppo assegnazione basata su HVS-1 e la parte di HVS-2 sequenze di Sri Lanka popolazione che utilizza Mitotool (http://www.mitotool.org)17 e Haplogrep 1515 manualmente e poi ricontrollato di nuovo con phylotree costruire 15 (http://www.phylotree.org)16 (Complementare Tabella S3), il generale aplogruppo analisi ha indicato che quasi il 50% degli individui da tutti i studiato popolazioni apparteneva a aplogruppo M lignaggi (tra cui l’aplogruppo M, D e G), seguita da circa il 25% di R lignaggi (tra cui l’aplogruppo R, P, T) e il 20% di U lignaggi. Altri lignaggi meno frequenti erano quasi il 4% di R0 (incluso l’aplogruppo HV e H) e quasi il 2% di N lignaggi (inclusi N e W) (Tabella 2).

Tabella 2 Frequenza dell’aplogruppo nella popolazione dello Sri Lanka

L’aplogruppo M era l’aplogruppo più comune nei tamil indiani (70,18%), che è stato contribuito principalmente dai sub-aplogruppi M5a (14,03%) e M2a (12,28%). Questi sub-aplogruppi sono stati trovati raramente in altre popolazioni. Up-country singalesi, Low-country singalesi e tamil dello Sri Lanka esibivano frequenze simili di aplogruppo M (41,67-43,59%), anche se possedevano diverse frequenze sub-aplogruppi. Questo potrebbe indicare che il più tardi menzionato, soprattutto Up-country singalesi e basso paese singalesi sono più strettamente correlati tra loro che a tamil indiani che hanno una storia di migrazione nota dall ” India. Nel frattempo, le persone Vedda avevano la frequenza più bassa di aplogruppo M (17,33%). È abbastanza sorprendente vedere una frequenza così bassa di aplogruppo M nella popolazione Vedda rispetto ai gruppi tribali indiani meridionali (70-80%) e alle popolazioni di caste indiane meridionali (65%).30 Ciò è probabilmente dovuto all’effetto della deriva genetica nella popolazione più piccola di Vedda. Ciò è supportato da altre osservazioni sulla ridotta diversità intrapopolare tra i sottogruppi di persone Vedda.

D’altra parte, le persone Vedda e i singalesi di paesi bassi hanno mostrato frequenze relativamente alte di aplogruppo R (45.33 e 25%, rispettivamente) che è stato contribuito principalmente dal sub-aplogruppo R30b (38,67 e 20%). L ” aplogruppo era meno frequente in Up-country singalese, Tamil dello Sri Lanka e Tamil indiani. L’aplogruppo U è stato trovato principalmente in Vedda (29,33%) e singalese Up-country (23,33%), con il più alto contributo dei sub-aplogruppi U1a’c (12 e 5%, rispettivamente) e U7a (13,33 e 11,67%, rispettivamente).

La frequenza aplogruppo di persone Vedda da ogni sito è mostrato nella tabella supplementare S7. La bassa frequenza dell’aplogruppo M e le alte frequenze degli aplogruppi R e U sono state trovate per essere le caratteristiche uniche di Vedda. Tuttavia, le frequenze di questi aplogruppi variavano tra Vedda da siti diversi. Due gruppi Vedda (VA-Dam e VA-Hen) possiedono la frequenza di M aplogruppo vicino a quello di Up-country singalese, Low-country singalese e Tamil dello Sri Lanka, indicando la mescolanza genetica tra questi due gruppi Vedda e le altre tre popolazioni. I sottogruppi Vedda condividevano l’aplogruppo R30b / R8a1a3 a frequenze relativamente alte, caratteristica non riscontrabile tra i sottogruppi di altre popolazioni etniche sull’isola, suggerendo un’origine comune condivisa della popolazione Vedda. Sono stati costruiti una rete di giunzione mediana di HVS-1 e parte della sequenza HVS-2 di aplogruppi R (62 individui, 21 aplotipi) e U (52 individui, 25 aplotipi) da cinque popolazioni dello Sri Lanka (Figura supplementare S3). In generale, la rete era in accordo con l’analisi dell’aplogruppo mtDNA. Sebbene possieda meno frequenza di entrambi gli aplogruppi, gli aplotipi, appartenenti a questi aplogruppi, delle altre quattro popolazioni dello Sri Lanka erano più diversi degli aplotipi Vedda, che erano anche altamente derivati all’interno dell’albero. È stata eseguita anche la rete di giunzione mediana che incorpora i dati di HVS-1 e parte delle sequenze HVS-2 di aplogruppi R e U24, 25 provenienti da popolazioni indiane (figura supplementare S4). La mappa mediana della rete di giunzione non rivela uno stato basale delle sequenze del Vedda per la differenziazione genetica degli aplogruppi R e U. È più probabile che questi due aplogruppi, trovati particolarmente diffusi nel Vedda, derivassero da antenati del subcontinente indiano.

Tre aplogruppi, M2, U2i (U2a, U2b e U2c) e R5, riconosciuti come un pacchetto di cladi mtDNA specifici dell’India che ospitavano un’età coalescente altrettanto profonda di circa 50 000-70 000 anni,30 erano presenti nelle popolazioni etniche dello Sri Lanka. Tutte le popolazioni etniche studiate possiedono R5 con la sua più alta frequenza (10%) osservata nei singalesi di Up-country. L’aplogruppo U2 è stato trovato in tutte le popolazioni studiate con la sua marcata alta frequenza (10.25%) osservato nei Tamil dello Sri Lanka. È interessante notare che tutti i tipi di aplogruppi nelle persone Vedda, ad eccezione dei sub-aplogruppi M36d e M73 ‘ 79, sono presentati anche in altri gruppi etnici.

Ci sono diversi aplogruppi eurasiatici occidentali, appartenenti ai lignaggi HV, W, T, U1, U5 e U7, trovati nelle popolazioni etniche dello Sri Lanka (Tabella 2). Il contributo eurasiatico occidentale al pool genetico materno dello Sri Lanka era di circa il 19,94%, il che è coerente con il rapporto precedente.30 È interessante notare che i contributi eurasiatici occidentali di 28.19, 25.il 33, il 25 e il 20% sono stati rilevati rispettivamente nei tamil dello Sri Lanka, nei Vedda, nei singalesi dell’Alto e nei singalesi dei paesi bassi, mentre solo un contributo dell ‘ 1,75% è stato evidente nei tamil indiani. Ciò riflette ancora una volta la stretta relazione genetica tra i due gruppi cingalesi e tamil dello Sri Lanka rispetto ai tamil indiani. L’aplogruppo U1a e U7a erano l’unico lignaggio eurasiatico occidentale osservato nel popolo Vedda. L’aplogruppo T era presente in due popolazioni; singalese di paesi bassi (5%) e tamil dello Sri Lanka (2,56%), mentre l’aplogruppo W era presente solo nel singalese di paesi alti (3,33%).

Frequenze più basse rispetto agli aplogruppi euraseici occidentali sono state osservate per gli aplogruppi dell’Asia orientale (M12 e G), che rappresentavano il 5,91% della variazione totale.

La struttura genetica delle popolazioni dello Sri Lanka

Il raggruppamento delle popolazioni dello Sri Lanka secondo diversi criteri è stato eseguito e testato statisticamente, utilizzando un’analisi della varianza molecolare, per rivelare il miglior modello che rappresenta la differenziazione naturale della popolazione. Oltre ai criteri etnici adottati durante tutto questo studio, le popolazioni sono state classificate in gruppi in base al criterio razziale linguistico, geografico e putativo. I risultati sono riportati nella Tabella 3. Quando le popolazioni sono state classificate in due gruppi, le persone Vedda probabilmente rappresentano i primi abitanti dell’isola e altri per i nuovi arrivati, questo gruppo ha dato la varianza minima tra i sottogruppi all’interno di una popolazione (87.85, P<0.001) e la varianza massima tra le popolazioni (8.15, P<0.001), che rappresenta il miglior modello per la differenziazione della popolazione. Questo modello di differenziazione della popolazione è compatibile con una radice più profonda della divergenza genetica tra le popolazioni Vedda e non Vedda rispetto ai sottogruppi all’interno di ciascuna popolazione.

Tabella 3 Analisi della varianza molecolare (AMOVA) delle popolazioni dello Sri Lanka