言語系統をハプログループ(Y染色体・ミトコンドリアDNA)で辿る|語族と遺伝子の関係

124
  • HOME
  • 言語別
  • Multilingual
  • 言語系統をハプログループ(Y染色体・ミトコンドリアDNA)で辿る|語族と遺伝子の関係

タイトル画像:Haplogroup R (Y-DNA).PNG
この記事は執筆中です。

どんな言葉を・どんな人が話しているか。
言語や語学に興味があるひとであれば、誰もが持つ素朴な疑問でしょう。

あるいは、もっとマニアックに(笑)、
ドイツ語やフランス語のルーツは印欧祖語だけど、印欧祖語のルーツは?
古代漢語は印欧祖語に似ているらしいけど、古代漢語を話していたのはどんなひとたち?

など、「いろいろな言語のルーツや系統」について、知りたい方も多いでしょう。

言語のルーツ・系統を探るのは「比較言語学」の役目で、文字情報が豊富な印欧語族の祖語(印欧祖語)再構において、さらには、文献資料のないオーストロネシア語族においても、多くの成果をあげています。

一方で、遺伝子の分析テクノロジーが近年、飛躍的に進歩し、人類の「遺伝子系統」がどんどん明らかになってきています。

そして、「言語(語族)と遺伝子」にかなりの相関関係があることも分かってきたのです。

将来的には(考古学とも協働しつつ)、「印欧祖語のルーツや古代漢語との関係」、さらには、「シュメール語や日本語の起源」、などの解明も進んでいくのではないでしょうか。。。

そんなことも願いつつ、今回は、「言語と遺伝子」の関係について、紹介していきます!

遺伝子とDNA

「言語(語族)と遺伝子」の関係について理解するには、遺伝子、さらに、DNA、染色体、ミトコンドリアについて、基礎的なことを知っておく必要があります。

下図は、「典型的な動物細胞の模式図」です。
①核小体(仁)、②細胞核、③リボソーム、④小胞、⑤粗面小胞体、⑥ゴルジ体、⑦微小管、⑧滑面小胞体、⑨ミトコンドリア、⑩液胞、⑪細胞質基質、⑫リソソーム、⑬中心体

本記事で重要なのは、
細胞核(厳密には、この中にある染色体)、⑨ミトコンドリア の2つです。
「染色体」「ミトコンドリア」の中に、「DNA」があり、DNAのうちの一部が「遺伝子」です。

ここから先は、『新版 日本人になった祖先たち―DNAが解明する多元的構造』(篠田謙一著、2019年、NHKブックス)という本に、とても分かりやすい(!)説明があるので、これを参考に紹介していきます。(引用は、2007年発行の旧版『日本人になった祖先たち―DNAから解明するその多元的構造』によります)

遺伝子は、私たちの体を構成しているさまざまなタンパク質の構造やそれが作られるタイミングを記述している設計図です。[中略]
私たちの体を作るために2万~3万個の遺伝子があることがわかっています。(p15)

この設計図を書いている「文字」にあたるものがDNAです。
DNAはデオキシリボ核酸という化学物質の略号ですが、その文字は全部で4種類しかありません。(p15)

この4種類の文字は総称して「塩基」という特別の名称で呼ばれます。
さらにDNAは、複製を作るために2本の鎖状の構造を取っていて、特定の塩基がペアになって存在するので、通常はそのペアのことを「塩基対」という言葉を用いて表現します。(p15)

塩基対を単位として考えると、ヒトの持つDNA全体は、それが約30億も連なった長大なものになります。[中略]
私たちのDNA配列には意味のない部分が大量にあります。約95%は、今のところ何の意味もない文字の羅列でできていると考えられているのです。(p15-p16)

遺伝子、DNA、塩基対の関係は、下記「ゲノムの構造図」の下半分をご覧ください。

DNAを「らせん階段」に例えるなら、塩基対は「段(ステップ)」に相当します。

下図は、塩基対の構造を示した模式図です。

塩基対は、4種類ある塩基物質(Aアデニン、Gグアニン、Cシトシン、Tチミン)のペアで、常に A と T、G と C が対になります。

上図の左側を上から読むと TCAGT、右側を上から読むと AGTCA になります。

塩基対をタテに配列したもの(この例では、TCAGT, AGTCA)を「塩基配列」といいます。
※「DNA配列」「遺伝子配列」とも呼ばれます。

ちなみに、TCAGT = AGTCA です。
なぜなら、左が T であれば右は A、左が C であれば右は G … に一意的に決まるからです。
これを、「塩基の相補性」といいます。

ひとつのDNAを構成する塩基配列は、じっさいには膨大な長さをもつのですが、タンパク質の形成に関わる「コーディング領域」(とびとびに現れ、合計で約5%)と、それ以外の「ノンコーディング領域」(約95%)があります。

おおざっぱに言うと、タンパク質の形成に関わる部分、つまり、「塩基配列のコーディング領域」が「遺伝子」です。

遺伝子は20種類の「アミノ酸」でできており、それぞれのアミノ酸は、塩基対が3つ配列したユニットに対応します。(下記「DNAの遺伝暗号(コドン)表」参照)

たとえば、・・・・GAA・・・・CAA・・・・という塩基配列があったとして、その途中に「GAA」があればその部分は「グルタミン酸」、「AGG」があればその部分は「アルギニン」というアミノ酸に該当する、というわけです。

染色体

つづいて、「染色体」の話題に移りましょう。
ふたたび『日本人になった祖先たち』に戻ります。

染色体というのは、簡単に言うと遺伝子をまとめて収納する入れものです。(p187)[中略]

総数で2万~3万個あると言われる遺伝子は、バラバラになって核のなかに入っているわけではなく、染色体のなかにグループになって収納されているのです。
大きい染色体では3000個くらい、小さいものでも数百個の遺伝子をまとめて収納しています。(p187)

遺伝子が染色体に収納されているイメージは、前出「ゲノムの構造図」をご覧ください。

ヒトには全部で23種類の染色体があるのですが、実際には両親から1セットずつを受け取っているので、1つの細胞のなかにその2倍の46本の染色体が存在しています。(p187-p188)

このうち22種類までは男女で同じものを持っています。[中略]
しかし残りの1組は男性と女性で構成が異なっています。
女性はX染色体をペアで持っているのですが、男性はX染色体とY染色体という形の違う染色体を持っています。(p188)

男女で同じである22種類の染色体を「常染色体」、残り1種類の染色体を「性染色体」といいます。

下図のように、生殖時(受精時)に母親から受け継ぐのはX染色体しかあり得ません。
一方、父親からX染色体を受け継いだ子供は女性(XX)に、Y染色体を受け継いだ子供は男性(XY)になります。

さて、Y染色体は、遺伝子の変化を起こさずにそのまま子孫に伝えられます。
したがって、Y染色体の系統をたどっていくと、父方のルーツが分かるということになります。

ハプロタイプ

 

塩基配列の中で、ある特定の一箇所の塩基だけが異なるような現象を、SNP(Single Nucleotide Polymorphism / 一塩基多型)と呼びます。

たとえば下図の場合、普通の配列(野生型)のなかで、1箇所だけ A が G に変異しています。
この状態を「SNP」と呼ぶわけです。

Y染色体の系統

まず、Y染色体の系統図をご覧ください。(Wikipedia > Y染色体ハプログループ より)
アルファベットが A から R まで、18文字使われていますね。
それぞれは、Y染色体の大分類に対応しています。

つまり、Y染色体は大きく18分類となっており、これは、2002年に世界の学者が集まった共同研究機関で取り決められたものです。

じっさいには、アルファベットを複数合わせたもの(BT、CT、DEなど)や、数字と小文字を組み合わせたサブグループ(A1b1など)もあり、分類数は膨大なものになっています。

遺伝子(Y染色体)と語族

先ほどの「Y染色体の系統図」を踏まえ、「Y染色体と語族の対応表」を作成したので、ご覧ください。

それぞれについて、詳細に見ていきます。

Y-D

まずは、「ハプログループDの分布図」です。

D1a2a(旧Y-D2):日琉語族・アイヌ語族

つぎに、ハプログループD1a2aについて見てみましょう。
ハプログループDの移動想定経路 (Haber et al. 2019)」をご覧ください。

Y-E

ハプログループEの分布」をご覧ください。

E1b1a:ニジェール・コンゴ語族

ハプログループE1b1aの分布」です。Wikipedia フランス語版 にありました。

E1b1b:アフロ・アジア語族

ハプログループE1b1bの分布」です。Wikipedia フランス語版 より。

Y-C

ハプログループCの拡散経路」をご覧ください。(Wikipedia 日本語・英語版など より)
データは、崎谷満(2009)『DNA・考古・言語の学際研究が示す新・日本列島史 日本人集団・日本語の成立史』勉誠出版 に基づいているようです。
つづいて、「ハプログループCの起源と拡散経路」(2017年作成)をご覧ください。(Wikipedia スペイン語・ロシア語版 より)

Wikipedia ロシア語版 には、「ハプログループCの東南アジアにおける拡散経路」(2013年作成)がありましたので掲載します。

C2(旧Y-C3):ツングース語族、モンゴル語族

ハプログループC2の分布図」をご覧ください。

Y-J

ハプログループJの分布」をご覧ください。(Wikipedia ドイツ語版 より)

J1:アフロ・アジア語族>セム語派>アラビア語

ハプログループJ1の分布」をご覧ください。(Wikipedia スペイン語版 より)

参考まで、「ハプログループJ2の分布」も掲載します。(Wikipedia スペイン語版 より)

Y-N:ウラル語族

ハプログループNの分布」をご覧ください。

つぎに、「ハプログループNの移動経路(青色)」(2017年作成)です。
データは、崎谷満(2009)『DNA・考古・言語の学際研究が示す新・日本列島史 日本人集団・日本語の成立史』勉誠出版 に拠るようです。
つづいて、「ハプログループN、Oに関連する東アジアの民族移動」(2017年作成)です。
崎谷満『DNA・考古・言語の学際研究が示す新・日本列島史 日本人集団・日本語の成立史』(勉誠出版 2009年)その他の資料をもとに作成されたものです。

N1a1:フィン・ウゴル語派

 

N1a2:サモエード語派

Y-O

ハプログループOの分布」です。

O1a(旧Y-O1):オーストロネシア語族

 

O1b1(旧Y-O2a):オーストロアジア語族

 

O1b2(旧Y-O2b):弥生人の言語

弥生人に連なる東アジアのY染色体ハプログループと民族移動」(2017年作成)を掲載します。
崎谷満『DNA・考古・言語の学際研究が示す新・日本列島史 日本人集団・日本語の成立史』(勉誠出版 2009年)などをもとに作成されています。

O2(旧Y-O3):シナ・チベット語族

ハプログループO2-M122の分布」です。

Y-Q:エニセイ語族、ナ・デネ語族、古代中国語

ハプログループQの分布」をご覧ください。

Y-R:印欧語族

ハプログループRの分布」をご覧ください。

R1a:サテム語

ヨーロッパにおけるハプログループR1aの分布頻度」をご覧ください。

R1a の下位系統を、Wikipedia より引用します。

系統はY-DNA Haplogroup R and its Subclades – 2015による。関連言語文化を付記する。

  • R1a L146/M420/PF6229, L62/M513/PF6200, L63/M511/PF6203, L145/M449/PF6175

R1b:ケントゥム語

ハプログループR1bの分布図」です。

R1b の系統樹を、Wikipedia より転載します。

コメント

  1. この記事へのコメントはありません。