Articles

mitokondrie-DNA historie af Srilankanske etniske mennesker: deres forhold på øen og med de indiske subkontinentale befolkninger

MtDNA polymorfismer og delte haplotyper af Sri Lanka

mtDNA HVS-1 (np. 16 024 til np. 16 383 i RCR ‘ erne) og en del af HVS-2 (np. 57 til np. 309 af rCRS) – sekvenserne blev opnået fra 271 individer, der tilhørte fem Srilankanske Etniske populationer: 75 Vedda-folk, 60 singalesiske og 40 singalesiske lavlande, 39 srilankanske tamiler og 57 Indiske tamiler. De polymorfier, der blev observeret i undersøgelsen, er angivet i supplerende tabel S3. Sletninger blev observeret ved nukleotidpositioner 16 166, 16 258 og 249, mens indsættelser blev fundet ved 16 188, 16 380 og 284.

der var i alt 147 haplotyper observeret i de fem Srilankanske populationer af denne undersøgelse. Tredive af dem blev delt mellem mindst to befolkninger. Vedda-befolkningen har den laveste andel af delte haplotyper blandt deres undergrupper (63%), hvilket indikerer deres større genetiske mangfoldighed blandt undergrupper. Sri Lankas tamiler og indiske tamiler havde en lignende delt andel (85%), mens Singalesere i landet har et lidt højere antal befolkningsspecifikke haplotyper (73%) end Singalesere i lavlandet (70%) (tabel 1). Interessant, højeste antal haplotype deling blev fundet mellem vedda med Up-country singalesisk og med lavland Singalesisk. På den anden side var der ingen haplotype-deling mellem Vedda-folket med nogen af tamilerne (tabel 1).

tabel 1 haplotype deling og matchende sandsynligheder mellem Srilankanske populationer

Diversitetsindekser

genetisk mangfoldighed inden for undergrupperne af Srilankanske Etniske populationer blev vurderet efter haplotype mangfoldighed (H) og nukleotiddiversitet (Chr). Resultaterne er opsummeret i supplerende tabel S4. H varierede fra 0,503–1.000 og liter fra 0,006-0,019. Generelt udviste singalesiske (Up-country og lavland) og tamilske (srilankanske og indiske) undergrupper relativt højere haplotype-mangfoldighed (0,861–1,000) end veddas (0,503–0,965). Trenden med nukleotiddiversitet følger haplotype-mangfoldigheden. Højere nukleotidforskelle (0,009–0,019) blev observeret blandt singalesere og tamiler. Især blev der observeret lavere nukleotiddiversitet (0,006-0,009) i to vedda-undergrupper (VA–Rat og VA-Dal) end i resten af Vedda-undergrupperne (0,012-0,014).

mønster af genetisk variation som afsløret ved genetisk afstand og fylogenetiske analyser

genetiske afstande blandt 21 undergrupper af fem Etniske populationer i Sri Lanka blev beregnet ud fra HVS-1 og en del af HVS-2-sekvenser, der anvender Tajima-Nei-metoden.27 resultatet er vist i supplerende tabel S5. Manteltesten for korrespondance mellem genetiske og geografiske minimale afstande blev også udført, hvorfra den signifikante sammenhæng mellem de to afstandsmatricer (r=0,15; P=0,02) blev opnået; resultatet antydede, at mønsteret for genetisk differentiering observeret blandt undersøgte populationer i det mindste delvist kunne forklares i lyset af isolationsmodellen.

et ikke-rodfæstet nabo-sammenføjningstræ blev konstrueret til fylogenetiske forhold mellem 21 undergrupper af fem etniske befolkninger i Sri Lanka som illustreret i figur 2. En anden fylogenetisk konstruktion blev også udført for de fem etniske befolkninger, da alle undergrupper inden for en befolkning blev kollapset; resultatet er vist i supplerende figur S1.

figur 2
figur2

Unrooted nabo-sammenføjning (NJ) træ af de 21 Srilankanske populationer baseret på netto genetiske afstande. (Forkortelser er angivet i supplerende tabel S1).

det er helt klart fra supplerende figur S1, at vedda-befolkningen var genetisk adskilt fra andre Srilankanske Etniske populationer, hvor genetisk afstand var mindre mellem dem. Indiske tamiler etablerede det nærmeste genetiske forhold til deres Srilankanske Etniske kolleger. Up-country Singalesere dannede tætte genetiske tilknytninger til srilankanske tamiler og Singalesere med lavt land.

figur 2 illustrerer mere indsigt i de genetiske forhold mellem de undersøgte populationer med beskrivelsen af genetisk variation blandt undergrupper inden for hver etnisk befolkning. Fra dette ikke-rodede nabo-sammenføjningstræ blev det bekræftet, at der var en større genetisk afstand mellem vedda-folket og resten af befolkningen. To vedda-undergrupper (VA-Dam og Va-Hen) blev blandet med singaleserne, både Up-country og lavland, men ikke med nogen af tamiler. Tamilerne, både srilankanske og indiske, grupperet sammen. Den genetiske matrice, hvor de tamilske og singalesiske undergrupper, der ikke klart kan adskilles fra hinanden, blev observeret mod den ene store gren af træet, med størstedelen af vedda-folket mod den anden. Interessant nok var nogle singalesiske grupper (SU-Mul, SU-Mee og SL-Lan) relativt tættere på tamiler end resten af singalesiske undergrupper.

Hovedkomponentanalyse

nettogenetiske afstande fra HVS-1 og en del af HVS-2-sekvenser (supplerende tabel S5) og fra haplogruppefordelingsfrekvenser (supplerende tabel S6) blandt 21 undergrupper af fem Etniske populationer i Sri Lanka blev behandlet som inputvektorer for PCA. Figur 3 viser PCA-kortet konstrueret ud fra haplogruppefordelingsfrekvenser for de to første hovedkomponenter, der tilsammen tegner sig for 82,44% af den samlede varians. Størstedelen af Vedda-undergrupper (undtagen VA-Dam) var godt adskilt fra andre etniske befolkninger i Sri Lanka på den første PC-akse. Deres adskillelse fra andre etniske befolkninger udvides yderligere på den anden PC-akse. Størstedelen af singalesiske og tamilske undergrupper danner tætte genetiske nærheder indbyrdes på begge PC-akser. Større undtagelse fra denne klyngedannelse findes i SU-Thu. Det var tydeligt, at Singalesere i landet er genetisk tættere på srilankanske tamiler. På den anden side var srilankanske tamilske undergrupper tættere på hinanden sammenlignet med indiske tamiler. Generelt sagt, Vedda-undergrupper var mere spredt på PCA-kortet end inden for nogen anden etnisk befolkning, hvilket afspejler større mangfoldighed blandt dem. PCA-kort konstrueret ud fra de genetiske netafstande fra HVS-1 og en del af HVS-2-sekvenser, som er i overensstemmelse med PCA-kortet konstrueret ud fra haplogruppefordelingsfrekvenser, er også vist i supplerende figur S2.

figur 3
figur3

Principal component analysis (PCA) kort over de 21 Srilankanske underpopulationer baseret på netto genetiske afstande afledt af haplogruppefordelingsfrekvenser. (Forkortelser er angivet i supplerende tabel S1). En fuld farve version af dette tal er tilgængelig på Journal of Human Genetics journal online.

PCA udvides yderligere til at omfatte forskellige andre etniske befolkninger fra Det Indiske subkontinent (supplerende tabel S2) figur 4. Resultatet vist i figur 5 tegnede sig for 52,59% af den samlede variation. Alle singalesiske og tamilske undergrupper blander sig godt sammen med størstedelen af de indiske subkontinentale populationer og danner en stor genetisk matrice. Imidlertid blev Indiske tamiler adskilt fra resten af Srilankanske undergrupper, undtagen SU-Bam og SL-Ban, på den første PC-akse. Dette styrker yderligere hypotesen om, at Indiske tamiler er genetisk forskellige fra resten af de srilankanske etniske grupper. Nogle vedda-grupper (VA-Dal, va-Hen og VA-Dam) er placeret i periferien af denne genetiske matrice, mens andre (VA-Pol og VA-Rat) kun etablerede et fjernt forhold til matricen.

figur 4
figur4

populationer af Indien, der blev brugt i denne undersøgelse. (Forkortelser er angivet i supplerende tabel S1 og supplerende tabel S2). En fuld farve version af dette tal er tilgængelig på Journal of Human Genetics journal online.

figur 5
figur5
p > principal component analysis (PCA) kort over de 21 srilankanske underpopulationer med indiske populationer baseret på netto genetiske afstande. (Forkortelser er angivet i supplerende tabel S1 og supplerende tabel S2). En fuld farve version af dette tal er tilgængelig på Journal of Human Genetics journal online.

MtDNA haplogruppe i Sri Lanka

selvom mitokondriekodningsregionen indeholder flere fylogenetisk relevante steder, der er nyttige til tildeling af haplotyper til en haplogruppe, er kontrolregionen også lovende i formodet haplogruppetilhørighed.28, 29 i henhold til haplogroup-opgaven baseret på HVS-1 og en del af HVS-2-sekvenser af srilankansk befolkning ved hjælp af Mitotool (http://www.mitotool.org)17 Og Haplogrep 1515 og derefter manuelt kontrolleret det igen med phylotree build 15 (http://www.phylotree.org)16 (supplerende tabel S3), den samlede haplogruppeanalyse viste, at næsten 50% af individerne fra alle de undersøgte populationer tilhørte haplogruppe m-slægter (inklusive haplogruppe M, D og g) efterfulgt af ca.25% af R-slægter (inklusive haplogruppe r, p og T) og 20% af U-slægter. Andre mindre hyppige Slægter var næsten 4% af R0 (inklusive haplogruppe HV og H) og næsten 2% af N slægter (inklusive N og H) (tabel 2).

tabel 2 haplogruppefrekvens i Sri Lankas befolkning

haplogruppe M var den mest almindelige haplogruppe i Indiske tamiler (70,18%), som hovedsageligt blev bidraget af underhaplogrupper M5a (14,03%) og M2A (12,28%). Disse sub-haplogrupper blev sjældent fundet i andre populationer. Up-country singalesiske, lavland singalesiske og srilankanske tamiler udviste lignende frekvenser af haplogruppe M (41,67-43,59%), skønt de havde forskellige sub-haplogrupper frekvenser. Dette kan indikere, at de senere nævnte, især singalesiske og singalesiske lavlande er tættere beslægtede med hinanden end med indiske tamiler, der har en kendt migrationshistorie fra Indien. I mellemtiden havde vedda-folk den laveste frekvens af haplogruppe M (17,33%). Det er ganske forbløffende at se en så lavere frekvens af M haplogruppe i vedda-befolkningen sammenlignet med sydindiske stammegrupper (70-80%) såvel som sydindiske kastepopulationer (65%).30 Dette skyldes sandsynligvis virkningen af genetisk drift i den mindre population af vedda. Dette understøttes af anden observation af reduceret intrapopulationsdiversitet blandt undergrupperne af vedda-folk.

på den anden side viste vedda-folk og Singalesere i lavlandet relativt høje frekvenser af haplogruppe R (45.Henholdsvis 33% og 25%), som hovedsageligt blev bidraget af under-haplogruppe R30b (38,67% og 20%). Haplogruppen var mindre hyppig i singalesiske, srilankanske tamiler og indiske tamiler. Haplogruppe U blev for det meste fundet i Vedda (29,33%) og Singalesere i Upland (23,33%) med det højeste bidrag fra sub-haplogrupper U1a ‘ C (henholdsvis 12 og 5%) og U7a (henholdsvis 13,33 og 11,67%).

haplogruppefrekvensen for Vedda-personer fra hvert sted er vist i supplerende tabel S7. Lav frekvens af M haplogruppe og høje frekvenser af R og U haplogrupper viste sig at være de unikke egenskaber ved vedda. Frekvenserne af disse haplogrupper varierede imidlertid blandt vedda fra forskellige steder. To vedda-grupper (VA-Dam og Va-Hen) besidder hyppigheden af M haplogruppe tæt på den for singalesiske, Lavlandssingalesiske og srilankanske tamiler, hvilket indikerer den genetiske blanding mellem disse to vedda-grupper og de andre tre populationer. Vedda-undergrupperne delte haplogruppe R30b / R8a1a3 ved relativt høje frekvenser, det karakteristiske, der ikke findes blandt undergrupper af andre etniske befolkninger på øen, foreslog en fælles fælles oprindelse for vedda-befolkningen. Median Sammenføjningsnetværk af HVS – 1 og en del af HVS-2 sekvens af haplogrupper R (62 individer, 21 haplotyper) og U (52 individer, 25 haplotyper) fra fem Srilankanske populationer blev konstrueret (supplerende figur S3). Generelt var netværket i overensstemmelse med mtDNA haplogroup-analysen. Selvom besidder mindre hyppighed af begge haplogrupper, haplotyperne, der hører til disse haplogrupper, af de andre fire Srilankanske populationer var mere forskellige end vedda-haplotyper, som også var stærkt afledt inden i træet. Det mediane Sammenføjningsnetværk, der indeholder data om HVS-1 og en del af HVS-2-sekvenser af haplogrupper R og U24, 25 fra indiske populationer, blev også udført (supplerende figur S4). Mediantilslutningsnetværkskortet afslører ikke en basal status for Veddas sekvenser for den genetiske differentiering af haplogrupper R og U. Det er mere sandsynligt, at disse to haplogrupper, fundet at være særlig udbredt i vedda, stammer fra forfædre på det indiske subkontinent.

tre haplogrupper, M2, U2i (U2a, U2b og U2c) og R5, anerkendt som en pakke af indisk-specifikke mtDNA-klader,der huser en lige så dyb koalescerende alder på omkring 50 000-70 000 år, 30 var til stede i de etniske befolkninger i Sri Lanka. Alle de undersøgte Etniske populationer har R5 med sin højeste frekvens (10%) observeret i Singalesere i landet. Haplogruppe U2 blev fundet i alle de undersøgte populationer med sin markante højfrekvens (10.25%) observeret i srilankanske tamiler. Interessant nok præsenteres alle typer haplogrupper i vedda-folk, undtagen sub-haplogrupper M36d og M73’79, også i andre etniske grupper.

Der er flere Vest-eurasiske haplogrupper, der tilhører HV -, V -, T -, U1 -, U5-og U7-slægterne, der findes i Srilankanske etniske befolkninger (tabel 2). Det vestlige eurasiske Bidrag til den srilankanske maternelle genpulje var omkring 19,94%, hvilket er i overensstemmelse med den tidligere rapport.30 interessant, Vest-eurasiske bidrag på 28.19, 25.33, 25 og 20% blev påvist i de srilankanske tamiler, vedda-folk, henholdsvis singalesiske og Lavlandssingalesiske, mens kun et bidrag på 1,75% var tydeligt i de indiske tamiler. Dette afspejlede igen det tætte genetiske forhold mellem de to singalesiske grupper og srilankanske tamiler sammenlignet med indiske tamiler. Haplogruppe U1a og U7a var den eneste Vest-eurasiske slægt, der blev observeret i vedda-folket. Haplogruppe T var til stede i to populationer; singalesiske lavlande (5%) og srilankanske tamiler (2,56%), mens haplogruppe V kun var til stede i singalesiske lande (3,33%).

lavere frekvenser end de Vest-eurasiske haplogrupper blev observeret for de østasiatiske haplogrupper (M12 og G), som tegnede sig for 5,91% af den samlede variation.

den genetiske struktur af de srilankanske populationer

gruppering af de srilankanske populationer efter forskellige kriterier blev udført og statistisk testet ved hjælp af en analyse af molekylær varians for at afsløre den bedste model, der repræsenterer naturlig befolkningsdifferentiering. Ved siden af de etniske kriterier, der blev vedtaget gennem hele denne undersøgelse, populationer blev klassificeret i grupper efter sprogligt, geografisk og formodet racekriterium. Resultaterne er vist i tabel 3. Da populationer blev klassificeret i to grupper, repræsenterede Vedda-folk sandsynligvis de tidligste indbyggere på øen og andre for nyankomne, denne gruppering gav den mindste varians blandt undergrupper inden for en befolkning (87,85, P<0,001) og maksimal varians blandt populationer (8,15, P<0.001), der repræsenterer den bedste model for befolkningsdifferentiering. Denne model for befolkningsdifferentiering er kompatibel med en dybere rod af genetisk divergens mellem vedda og ikke-vedda populationer end mellem undergrupper inden for hver population.

tabel 3 analyse af molekylær varians (AMOVA) af Srilankanske populationer