Articles

スリランカ民族のミトコンドリアDNAの歴史:島内およびインド亜大陸集団との関係

スリランカのMtDNA多型および共有ハプロタイプ

mtDNA HVS-1(np. 16 024 RCRの16 383)およびHVS-2の一部(np. 57をnpにする。 RCRSの309)配列は、五つのスリランカの民族集団に属する271人から得られた: 75人のヴェッダ人、60人のアップカントリー-シンハラ人、40人のローカントリー-シンハラ人、39人のスリランカ-タミル人、57人のインド-タミル人。 研究で観察された多型は、補足表S3に提供されています。 欠失はヌクレオチド位置16 166、16 258、および249で観察されたが、挿入は16 188、16 380および284で遭遇した。

この研究の五つのスリランカの集団で観察された147ハプロタイプの合計がありました。 これらのうち30人は少なくとも2つの集団の間で共有されていた。 Veddaの人口にサブグループ間のより大きい遺伝の多様性を示すサブグループ(63%)間の共有されたハプロタイプの最も低い割合がある。 スリランカのタミル人とインドのタミル人は同じような共有割合(85%)を持っていたのに対し、アップカントリーのシンハラ人は低カントリーのシンハラ人(70%)よりも人口固有のハプロタイプ(73%)の数が少し多い(表1)。 興味深いことに、ハプロタイプの共有の最大数は、アップ国シンハラ語と低国シンハラ語とVeddaの間で発見されました。 一方、Veddaの人々とTamilsのいずれかとの間にハプロタイプの共有はなかった(表1)。

表1スリランカ集団間のハプロタイプの共有とマッチング確率

多様性指数

スリランカ民族集団のサブグループ内の遺伝的多様性は、ハプロタイプの多様性(H)とヌクレオチドの多様性(γ)によって評価された。 結果は補足表S4に要約されています。 Hは0.503–1.000、γは0.006–0.019の範囲であった。 一般に、シンハラ語(アップ国と低国)とタミル語(スリランカとインド)サブグループは、Vedda(0.503-0.965)のものよりも比較的高いハプロタイプの多様性(0.861-1.000)を示 ヌクレオチドの多様性の傾向はハプロタイプの多様性に従う。 より高いヌクレオチド多様性(0.009-0.019)は、シンハラ語とタミル語の間で観察された。 特に、低いヌクレオチドの多様性(0.006–0.009)は、Veddaサブグループ(0.012-0.014)の残りの部分よりも二つのVeddaサブグループ(VA-ラットとVA–Dal)で観察された。

遺伝的距離と系統解析によって明らかにされた遺伝的変異のパターン

スリランカの五民族集団の21サブグループ間の遺伝的距離は、Hvs-1とHvs-2配列の一部からTajima-Nei法を用いて計算された。その結果を補足表S5に示す。 遺伝的および地理的最小距離間の対応のためのマンテル検定も行われ、そこから二つの距離行列(r=0.15;P=0.02)の間の有意な相関が得られた; その結果,研究集団間で観察された遺伝的分化のパターンは,距離別単離モデルに照らして少なくとも部分的に説明可能であることが示唆された。

図2に示すように、スリランカの21のサブグループ間の系統発生関係のために、根のない隣人結合ツリーを構築しました。 また、集団内のすべてのサブグループが崩壊したときに五つの民族集団に対して別の系統発生構築が行われた。

図2
図2

正味の遺伝的距離に基づいて21スリランカの集団のルートされていない隣人結合(NJ)ツリー。 (略号は補足表S1に記載されている)。

補足図S1から、ヴェッダの人口は他のスリランカの民族集団から遺伝的に分離されており、遺伝的距離はそれらの間では インドのタミル人は、スリランカの民族と最も近い遺伝的関係を確立しました。 アップカントリー-シンハラ語は、スリランカのタミル語やローカントリー-シンハラ語と密接な遺伝的提携を形成した。

図2は、各民族集団内のサブグループ間の遺伝的変異の記述と、研究された集団間の遺伝的関係に関するより多くの洞察を示しています。 この根のない隣人結合木から、Veddaの人々と残りの集団との間に大きな遺伝的距離があることが確認された。 二つのVeddaサブグループ(VA-DamとVA-Hen)は、アップカントリーとローカントリーの両方のシンハラ語と混在していたが、タミル語のいずれとも混在していなかった。 タミル人は、スリランカ人とインド人の両方で、一緒に集まった。 タミル語とシンハラ語のサブグループは、明らかに互いに分離することはできませんが、木の一つの主要な枝に向かって観察され、Veddaの人々の大部分は他の方に向かって観察された遺伝的マトリックス。 興味深いことに、いくつかのシンハラ語グループ(SU-Mul、SU-Mee、SL-Lan)は、シンハラ語のサブグループの残りの部分よりもタミル語に比較的近かった。

主成分分析

Hvs-1およびHVS-2配列の一部(補足表S5)、およびハプログループ分布頻度(補足表S6)からの正味の遺伝的距離は、スリランカの21 図3は、最初の2つの主成分のハプログループ分布頻度から構築されたPCAマップを示しており、これは合計分散の82.44%を占めています。 Veddaサブグループ(VA-Damを除く)の大部分は、最初のPC軸でスリランカの他の民族集団からよく分離されていました。 他の民族集団からの彼らの分離は、第二のPC軸にさらに拡張されています。 シンハラ語とタミル語のサブグループの大部分は、両方のPC軸上で自分たちの間で近い遺伝的近接性を形成しています。 このクラスタリングの主な例外は、SU-Thuにあります。 新進気鋭のシンハラ人は、遺伝的にスリランカのタミル人に近いことが明らかでした。 一方,スリランカのタミル亜群はインドのタミル亜群と比較して互いに近かった。 一般的に言えば、Veddaサブグループは、他の民族集団よりもPCAマップ上に分散しており、それらの間の多様性が大きかったことを反映しています。 HVS-1からの正味の遺伝的距離とHVS-2配列の一部から構築されたPCAマップは、ハプログループ分布頻度から構築されたPCAマップと一致しており、補足図S2

図3
図3

ハプログループ分布頻度から導出された正味の遺伝的距離に基づく21スリランカの亜集団の主成分分析(PCA)マッ (略号は補足表S1に記載されている)。 この図のフルカラー版は、Journal of Human Genetics journalオンラインで入手できます。

PCAは、インド亜大陸からの様々な他の民族集団を含むようにさらに拡張されています(補足表S2)図4。 図5に示す結果は、全変動の52.59%を占めました。 すべてのシンハラ語とタミル語のサブグループは、大きな遺伝的マトリックスを形成し、インド亜大陸の人口の大部分とよく混在しています。 しかし、インドのタミル人は、最初のPC軸でSU-BamとSL-Banを除いて、スリランカのサブグループの残りの部分から分離されました。 これは、インドのタミル人がスリランカの他の民族と遺伝的に区別されているという仮説をさらに強化している。 いくつかのVedda群(V A-Dal,V A-HenおよびV A-Dam)はこの遺伝的マトリックスの周辺に位置しているが、他のもの(V A-PolおよびV A-Rat)はマトリックスとの遠隔関係のみを確立した。

図4
図4

この研究で使用されたインドの人口。 (略号は補足表S1および補足表S2に記載されている)。 この図のフルカラー版は、Journal of Human Genetics journalオンラインで入手できます。

図5
図5

21の主成分分析(PCA)マップネット遺伝的距離に基づいてインドの人口とスリランカの亜集団。 (略号は補足表S1および補足表S2に記載されている)。 この図のフルカラー版は、Journal of Human Genetics journalオンラインで入手できます。

スリランカのMtDNAハプログループ

ミトコンドリアのコード領域は、ハプロタイプをハプログループに割り当てるのに有用ないくつかの系統学的に関連するサイトが含まれているが、対照領域は、推定ハプログループ所属にも有望である。28、29Hvs-1およびHvs-2配列の一部に基づくハプログループ割り当てに従って、Mitotool(http://www.mitotool.org)17およびHaplogrep1515を使用し、phylotree build15(http://www.phylotree.org)16(補足表S3)で再び手動で再確認した(補足表S3)、全体的なハプログループ分析は、研究されたすべての集団からの個人のほぼ50%は、ハプログループm系統(ハプログループm、DおよびGを含む)に属し、続いて約25%のr系統(ハプログループr、pおよびtを含む)および20%のu系統に属した。 他のより頻度の低い系統は、R0のほぼ4%(ハプログループHVおよびHを含む)およびN系統のほぼ2%(NおよびWを含む)であった(表2)。

表2スリランカの人口におけるハプログループ頻度

ハプログループMは、主にサブハプログループM5A(14.03)によって貢献されたインドのタミル語(70.18%)で最も一般的なハプログループであった。%)とM2a(12.28%)。 これらのサブハプログループは、他の集団ではほとんど見られなかった。 彼らは異なるサブハプログループの周波数を持っていたが、アップ国シンハラ語、低国シンハラ語とスリランカのタミル語は、ハプログループM(41.67-43.59%)の同様の頻度を示した。 これは、後に述べたことを示しているかもしれません,特にアップ国シンハラ語と低国シンハラ語は、インドからの既知の移行の歴史を持っているインド 一方、ヴェッダの人々はハプログループM(17.33%)の最も低い頻度を持っていた。 南インドの部族集団(70-80%)や南インドのカースト集団(65%)と比較して、ヴェッダの人口におけるMハプログループのような低い頻度を見ることは非常に驚くべきことである。30これはおそらく、ヴェッダのより小さな集団における遺伝的ドリフトの影響によるものである。 これは、Veddaの人々のサブグループ間の個体群内の多様性の減少の他の観察によって支持されている。

一方、Veddaの人々と低国シンハラ語は、ハプログループRの比較的高い頻度を示した(45。主にサブハプログループR30B(38.67および20%)によって寄与された。 ハプログループは、アップカントリーのシンハラ語、スリランカのタミル語、インドのタミル語ではあまり頻繁ではなかった。 ハプログループUは主にVedda(29.33%)とUp-country Sinhalese(23.33%)で発見され、サブハプログループU1A’c(それぞれ12と5%)とU7A(それぞれ13.33と11.67%)からの貢献が最も高かった。

各サイトからのVeddaの人々のハプログループ頻度は、補足表S7に示されています。 Mハプログループの低頻度とRおよびUハプログループの高頻度がVeddaのユニークな特性であることが分かった。 しかし,これらのハプログループの頻度は異なる部位からのVedda間で変化した。 二つのVedda群(V A-DamとV A-Hen)は,アップカントリー-シンハラ語,ローカントリー-シンハラ語,スリランカ-タミル語のそれに近いMハプログループの頻度を保有しており,これら二つのVedda群と他の三つの集団の間の遺伝的混和を示している。 Veddaサブグループは、比較的高い頻度でハプログループR30B/R8A1A3を共有し、島の他の民族集団のサブグループには見られない特徴は、Vedda集団の共通の共有起源を示唆した。 Hvs-1とhvs-2配列の一部の中央結合ネットワークは、ハプログループR(62個体、21ハプロタイプ)とu(52個体、25ハプロタイプ)五スリランカ集団から構築された(補足図S3)。 一般に,ネットワークはmtdnaハプログループ分析と一致した。 両ハプログループの頻度は少ないが,これらのハプログループに属するハプロタイプは,他の四つのスリランカ集団のハプロタイプよりも多様であった。 インドの集団からのハプログループRおよびU24、25のHVS-1およびHVS-2配列の一部のデータを組み込んだ中央結合ネットワークも実施した(補足図S4)。 中央結合ネットワークマップは、ハプログループRとUの遺伝的分化のためのVeddaの配列の基礎的な状態を明らかにしていません。 これらの2つのハプログループは、ヴェッダで特に流行していることが判明し、インド亜大陸の祖先に由来している可能性が高い。

三つのハプログループ、M2、U2I(U2A、U2BおよびU2C)とR5は、約50 000-70 000年の同じように深い合体年齢を保有するインド固有のmtDNAクレードのパッ 研究されたすべての民族集団は、アップ国シンハラ語で観察された最も高い頻度(10%)とR5を持っています。 ハプログループU2は、そのマークされた高い頻度ですべての研究集団で発見された(10。25%)スリランカのタミル語で観察された。 興味深いことに、veddaの人々のハプログループのすべてのタイプは、サブハプログループM36DとM73’79を除いて、他の民族グループにも提示されています。

スリランカの民族集団には、HV、W、T、U1、U5、U7系統に属するいくつかの西ユーラシアのハプログループがあります(表2)。 スリランカの母体遺伝子プールへの西ユーラシアの寄与は約19.94%であり、これは以前の報告と一致している。30.28.19,2533、25および20%はスリランカのTamils、Veddaの人々、Up-country SinhaleseおよびLow-country Sinhaleseでそれぞれ検出されたが、1.75%だけ貢献はインドのTamilsで明白だった。 これは、インドのタミル人と比較した場合、二つのシンハラ人グループとスリランカのタミル人の間の密接な遺伝的関係を再び反映していた。 ハプログループU1AとU7Aは、ヴェッダ人で観察された唯一の西ユーラシア系統であった。 ハプログループTは低国シンハラ語(5%)とスリランカタミル語(2.56%)の二つの集団に存在していたが、ハプログループWはアップ国シンハラ語(3.33%)にのみ存在していた。

東アジアのハプログループ(M12およびG)では、西ユーラシアのハプログループよりも低い頻度が観察され、これは全変動の5.91%を占めた。

スリランカ集団の遺伝的構造

異なる基準によるスリランカ集団のグループ化を行い、分子分散の分析を用いて統計的に試験し、自然集団の分化を表す最良のモデルを明らかにした。 この研究を通じてすべて採用された民族基準のほかに、人口は言語的、地理的および推定される人種的基準に従ってグループに分類された。 結果を表3に示す。 このグループは、人口内のサブグループ間の最小分散(87.85,P<0.001)と人口間の最大分散(8.15,p<0を与えた。001)、母集団分化のための最良のモデルを表す。 集団分化のこのモデルは、各集団内のサブグループ間よりもVeddaと非Vedda集団間の遺伝的発散の深いルートと互換性があります。P>

スリランカの人口の分子分散(AMOVA)の表3分析