言語系統をハプログループ（Ｙ染色体･ミトコンドリアDNA）で辿る｜語族と遺伝子の関係

タイトル画像：Haplogroup R (Y-DNA).PNG
この記事は執筆中です。

どんな言葉を・どんな人が話しているか。
言語や語学に興味があるひとであれば、誰もが持つ素朴な疑問でしょう。

あるいは、もっとマニアックに（笑）、
ドイツ語やフランス語のルーツは印欧祖語だけど、印欧祖語のルーツは？
古代漢語は印欧祖語に似ているらしいけど、古代漢語を話していたのはどんなひとたち？

など、「いろいろな言語のルーツや系統」について、知りたい方も多いでしょう。

言語のルーツ・系統を探るのは「比較言語学」の役目で、文字情報が豊富な印欧語族の祖語（印欧祖語）再構において、さらには、文献資料のないオーストロネシア語族においても、多くの成果をあげています。

一方で、遺伝子の分析テクノロジーが近年、飛躍的に進歩し、人類の「遺伝子系統」がどんどん明らかになってきています。

そして、「言語（語族）と遺伝子」にかなりの相関関係があることも分かってきたのです。

将来的には（考古学とも協働しつつ）、「印欧祖語のルーツや古代漢語との関係」、さらには、「シュメール語や日本語の起源」、などの解明も進んでいくのではないでしょうか。。。

そんなことも願いつつ、今回は、「言語と遺伝子」の関係について、紹介していきます！

遺伝子とDNA

「言語（語族）と遺伝子」の関係について理解するには、遺伝子、さらに、DNA、染色体、ミトコンドリアについて、基礎的なことを知っておく必要があります。

下図は、「典型的な動物細胞の模式図」です。
①核小体（仁）、②細胞核、③リボソーム、④小胞、⑤粗面小胞体、⑥ゴルジ体、⑦微小管、⑧滑面小胞体、⑨ミトコンドリア、⑩液胞、⑪細胞質基質、⑫リソソーム、⑬中心体

本記事で重要なのは、
②細胞核（厳密には、この中にある染色体）、⑨ミトコンドリア　の２つです。
「染色体」「ミトコンドリア」の中に、「DNA」があり、DNAのうちの一部が「遺伝子」です。

ここから先は、『新版日本人になった祖先たち―DNAが解明する多元的構造』（篠田謙一著、2019年、NHKブックス）という本に、とても分かりやすい（！）説明があるので、これを参考に紹介していきます。（引用は、2007年発行の旧版『日本人になった祖先たち―DNAから解明するその多元的構造』によります）

遺伝子は、私たちの体を構成しているさまざまなタンパク質の構造やそれが作られるタイミングを記述している設計図です。［中略］
私たちの体を作るために２万～３万個の遺伝子があることがわかっています。（p15）

この設計図を書いている「文字」にあたるものがDNAです。
DNAはデオキシリボ核酸という化学物質の略号ですが、その文字は全部で４種類しかありません。（p15）

この４種類の文字は総称して「塩基」という特別の名称で呼ばれます。
さらにDNAは、複製を作るために２本の鎖状の構造を取っていて、特定の塩基がペアになって存在するので、通常はそのペアのことを「塩基対」という言葉を用いて表現します。（p15）

塩基対を単位として考えると、ヒトの持つDNA全体は、それが約30億も連なった長大なものになります。［中略］
私たちのDNA配列には意味のない部分が大量にあります。約95%は、今のところ何の意味もない文字の羅列でできていると考えられているのです。（p15-p16）

遺伝子、DNA、塩基対の関係は、下記「ゲノムの構造図」の下半分をご覧ください。

DNAを「らせん階段」に例えるなら、塩基対は「段（ステップ）」に相当します。

下図は、塩基対の構造を示した模式図です。

塩基対は、４種類ある塩基物質（Aアデニン、Gグアニン、Cシトシン、Tチミン）のペアで、常に A と T、G と C が対になります。

上図の左側を上から読むと TCAGT、右側を上から読むと AGTCA になります。

塩基対をタテに配列したもの（この例では、TCAGT, AGTCA）を「塩基配列」といいます。
※「DNA配列」「遺伝子配列」とも呼ばれます。

ちなみに、TCAGT = AGTCA です。
なぜなら、左が T であれば右は A、左が C であれば右は G …　に一意的に決まるからです。
これを、「塩基の相補性」といいます。

ひとつのDNAを構成する塩基配列は、じっさいには膨大な長さをもつのですが、タンパク質の形成に関わる「コーディング領域」（とびとびに現れ、合計で約5%）と、それ以外の「ノンコーディング領域」（約95%）があります。

おおざっぱに言うと、タンパク質の形成に関わる部分、つまり、「塩基配列のコーディング領域」が「遺伝子」です。

遺伝子は20種類の「アミノ酸」でできており、それぞれのアミノ酸は、塩基対が３つ配列したユニットに対応します。（下記「DNAの遺伝暗号（コドン）表」参照）

たとえば、・・・・GAA・・・・CAA・・・・という塩基配列があったとして、その途中に「GAA」があればその部分は「グルタミン酸」、「AGG」があればその部分は「アルギニン」というアミノ酸に該当する、というわけです。

染色体

つづいて、「染色体」の話題に移りましょう。
ふたたび『日本人になった祖先たち』に戻ります。

染色体というのは、簡単に言うと遺伝子をまとめて収納する入れものです。（p187）［中略］

総数で２万~３万個あると言われる遺伝子は、バラバラになって核のなかに入っているわけではなく、染色体のなかにグループになって収納されているのです。
大きい染色体では3000個くらい、小さいものでも数百個の遺伝子をまとめて収納しています。（p187）

遺伝子が染色体に収納されているイメージは、前出「ゲノムの構造図」をご覧ください。

ヒトには全部で23種類の染色体があるのですが、実際には両親から１セットずつを受け取っているので、１つの細胞のなかにその２倍の46本の染色体が存在しています。（p187-p188）

このうち22種類までは男女で同じものを持っています。［中略］
しかし残りの１組は男性と女性で構成が異なっています。
女性はX染色体をペアで持っているのですが、男性はX染色体とY染色体という形の違う染色体を持っています。（p188）

男女で同じである22種類の染色体を「常染色体」、残り１種類の染色体を「性染色体」といいます。

下図のように、生殖時（受精時）に母親から受け継ぐのはX染色体しかあり得ません。
一方、父親からX染色体を受け継いだ子供は女性（XX）に、Y染色体を受け継いだ子供は男性（XY）になります。

さて、Y染色体は、遺伝子の変化を起こさずにそのまま子孫に伝えられます。
したがって、Y染色体の系統をたどっていくと、父方のルーツが分かるということになります。

ハプロタイプ

塩基配列の中で、ある特定の一箇所の塩基だけが異なるような現象を、SNP（Single Nucleotide Polymorphism / 一塩基多型）と呼びます。

たとえば下図の場合、普通の配列（野生型）のなかで、１箇所だけ A が G に変異しています。
この状態を「SNP」と呼ぶわけです。

Y染色体の系統

まず、Y染色体の系統図をご覧ください。（Wikipedia > Y染色体ハプログループより）
アルファベットが A から R まで、18文字使われていますね。
それぞれは、Y染色体の大分類に対応しています。

つまり、Y染色体は大きく18分類となっており、これは、2002年に世界の学者が集まった共同研究機関で取り決められたものです。

じっさいには、アルファベットを複数合わせたもの（BT、CT、DEなど）や、数字と小文字を組み合わせたサブグループ（A1b1など）もあり、分類数は膨大なものになっています。

遺伝子（Y染色体）と語族

先ほどの「Y染色体の系統図」を踏まえ、「Y染色体と語族の対応表」を作成したので、ご覧ください。

それぞれについて、詳細に見ていきます。

Y-D

まずは、「ハプログループDの分布図」です。

D1a2a（旧Y-D2）：日琉語族･アイヌ語族

つぎに、ハプログループD1a2aについて見てみましょう。
「ハプログループDの移動想定経路 (Haber et al. 2019)」をご覧ください。

Y-E

「ハプログループEの分布」をご覧ください。

E1b1a：ニジェール･コンゴ語族

「ハプログループE1b1aの分布」です。Wikipedia フランス語版にありました。

E1b1b：アフロ･アジア語族

「ハプログループE1b1bの分布」です。Wikipedia フランス語版より。

Y-C

「ハプログループCの拡散経路」をご覧ください。（Wikipedia 日本語･英語版などより）
データは、崎谷満（2009）『DNA・考古・言語の学際研究が示す新・日本列島史日本人集団・日本語の成立史』勉誠出版　に基づいているようです。
つづいて、「ハプログループCの起源と拡散経路」（2017年作成）をご覧ください。（Wikipedia スペイン語･ロシア語版より）

Wikipedia ロシア語版には、「ハプログループCの東南アジアにおける拡散経路」（2013年作成）がありましたので掲載します。

C2（旧Y-C3）：ツングース語族､モンゴル語族

「ハプログループC2の分布図」をご覧ください。

Y-J

「ハプログループJの分布」をご覧ください。（Wikipedia ドイツ語版より）

J1：アフロ･アジア語族>セム語派>アラビア語

「ハプログループJ1の分布」をご覧ください。（Wikipedia スペイン語版より）

参考まで、「ハプログループJ2の分布」も掲載します。（Wikipedia スペイン語版より）

Y-N：ウラル語族

「ハプログループNの分布」をご覧ください。

つぎに、「ハプログループNの移動経路（青色）」（2017年作成）です。
データは、崎谷満（2009）『DNA・考古・言語の学際研究が示す新・日本列島史日本人集団・日本語の成立史』勉誠出版　に拠るようです。
つづいて、「ハプログループN、Oに関連する東アジアの民族移動」（2017年作成）です。
崎谷満『DNA・考古・言語の学際研究が示す新・日本列島史日本人集団・日本語の成立史』（勉誠出版　2009年）その他の資料をもとに作成されたものです。

N1a1：フィン･ウゴル語派

N1a2：サモエード語派

Y-O

「ハプログループOの分布」です。

O1a（旧Y-O1）：オーストロネシア語族

O1b1（旧Y-O2a）：オーストロアジア語族

O1b2（旧Y-O2b）：弥生人の言語

「弥生人に連なる東アジアのY染色体ハプログループと民族移動」（2017年作成）を掲載します。
崎谷満『DNA・考古・言語の学際研究が示す新・日本列島史日本人集団・日本語の成立史』（勉誠出版　2009年）などをもとに作成されています。

R1a の下位系統を、Wikipedia より引用します。

系統はY-DNA Haplogroup R and its Subclades – 2015による。関連言語、文化を付記する。

R1a L146/M420/PF6229, L62/M513/PF6200, L63/M511/PF6203, L145/M449/PF6175

R1a* –

R1a1 M459/PF6235, L120/M516/PF6236, L122/M448/PF6237, Page65.2/PF6234/SRY1532.2/SRY10831.2

R1a1* –

R1a1a M512/PF6239, L168, L449/PF6223, M17, M198/PF6238, M514/PF6240, M515

R1a1a* –

R1a1a1 M417, Page7

R1a1a1* –

R1a1a1a CTS7083/L664/S298

R1a1a1b S224/Z645, S441/Z647　縄目文土器文化

R1a1a1b* –

R1a1a1b1 PF6217/S339/Z283

R1a1a1b1* –

R1a1a1b1a S198/Z282　バルト・スラブ語派

R1a1a1b1a* –

R1a1a1b1a1 M458/PF6241

R1a1a1b1a2 S466/Z280, S204/Z91

R1a1a1b1a3 S221/Z284, S443/Z289　ゲルマン語派の基層

R1a1a1b2 F992/S202/Z93　インド・イラン語派　 en:Sintashta culture

R1a1a1b2a F3105/S340/Z94, L342.2/S278.2　アンドロノヴォ文化

R1a1a1b2a* –

R1a1a1b2a1 L657/S347　インド語群

R1b：ケントゥム語

「ハプログループR1bの分布図」です。

R1b の系統樹を、Wikipedia より転載します。

Multilingual
コメント: 26757

コメント ( 0 )
トラックバック ( 26757 )

この記事へのコメントはありません。

遺伝子とDNA

染色体

ハプロタイプ

Y染色体の系統

遺伝子（Y染色体）と語族

Y-D

D1a2a（旧Y-D2）：日琉語族･アイヌ語族

Y-E

E1b1a：ニジェール･コンゴ語族

E1b1b：アフロ･アジア語族

Y-C

C2（旧Y-C3）：ツングース語族､モンゴル語族

Y-J

J1：アフロ･アジア語族>セム語派>アラビア語

Y-N：ウラル語族

N1a1：フィン･ウゴル語派

N1a2：サモエード語派

Y-O

O1a（旧Y-O1）：オーストロネシア語族

O1b1（旧Y-O2a）：オーストロアジア語族

O1b2（旧Y-O2b）：弥生人の言語

O2（旧Y-O3）：シナ･チベット語族

Y-Q：エニセイ語族､ナ･デネ語族､古代中国語

Y-R：印欧語族

R1a：サテム語

R1b：ケントゥム語

コメント

言語系統をハプログループ（Ｙ染色体･ミトコンドリアDNA）で辿る｜語族と遺伝子の関係

印欧語族の拡散｜古代ユーラシア･３つの波と中国への影響

古代漢語と印欧祖語の関係｜古代中国語の意外な姿！

前置詞･接頭辞･副詞をまとめて覚える理由｜オリジナルはいずれも印欧祖語･語根！

前置詞をマッピングで覚える｜ギリシャ･ラテン･印欧祖語･英語 前置詞19種

スペイン語「無料・オンライン辞書」のおススメはコレ！

英語の難所「句動詞」は、語源で覚えればカンタン！

op･posite = 反対に･置かれた｜接頭辞 op-, ob- の単語リスト

super･structure = 上部･構造｜接頭辞 super- の単語リスト

sub･way = 下から上へ･載せて運ぶ｜接頭辞 sub- の単語リスト

前置詞をマッピングで覚える｜ギリシャ･ラテン･印欧祖語･英語前置詞19種