ヒトのゲノム

ゲノムとは何だろう

「遺伝子」が、個々の表現形質に対応する原因となる因子を表わすのに対して、「ゲノム」という概念は、ある生物種の個体全体を完全な状態に保つために必要な遺伝的情報の1セットとして考えられたものです。したがって、ヒトならヒト、ネコならネコといったように、生物種ごとに固有のゲノムが存在します。ウイルスや細菌についてもファージゲノムや細菌ゲノムとよび、細胞小器官でも自分自身のDNAをもつミトコンドリアや葉緑体については、ミトコンドリアゲノム、葉緑体ゲノムという呼び方をすることがあります。遺伝情報そのものは DNAの塩基配列として保存されています。ゲノムの実体は細胞核のDNAであるといってもいいでしょう。ゲノムDNAの大きさは生物種ごとにずいぶん違います。仮に大腸菌ゲノムの大きさをJR山手線一周の長さとすると、ヒトゲノムの全長はほぼ地球の半周に相当するほどになります。(図1)

ヒトのゲノムヒトのゲノム

細胞分裂をさかんに行なっている組織をオルセインなどの塩基性色素で染色して顕微鏡で観察すると、棒状のよく染まる構造物が見えることがあります。これが染色体で、ゲノムDNAはこの中に含まれています。染色体の数と形は生物種ごとに決まっていますが、とくに共通のルールがあるわけではありません。ヒトの場合は、44本の常染色体とXYまたはXXの性染色体の計46本です。(図2)

ヒトのゲノム

高等な生物では、ゲノムDNAの全領域がタンパク質のアミノ酸配列に関する情報をもつわけではありません。ヒトゲノムの場合、直接、アミノ酸に翻訳される部分は全体の数パーセントと見積もられており、残りの部分には、イントロン領域、発現調節領域、染色体の分配に必要なセントロメア部分に多量に含まれるαサテライトとよばれる反復配列、染色体の末端部分に存在するテロメアといわれる反復配列などが含まれています。(図3)

染色体の基本構造

藤山 秋佐夫

ゲノムを調べる

以前は、一部のウイルスや細胞内器官のゲノムについてしか全構造がわかっていませんでした。それでもそこから得られた情報により、たとえばウイルスのライフサイクルや感染と増殖の機構などについて、ずいぶんたくさんのことがわかったのです。今後、もっと高等で複雑な体制をもつ生物のゲノムの全構造が決められ、その中に含まれるすべての遺伝子と遺伝子産物に関する情報があらゆる生物種について次々と明らかにされる事が予想されます。 まずゲノム全体を対象に全遺伝情報を調べあげ、そこから個別的な研究を始めるというアプローチです。このような研究を「ゲノム生物学」ともよぶようになりました。

私たちがゲノム情報を読みとる能力が向上すれば、ゲノムDNAの複製や分配といったゲノム全体を調和よく維持するための機構や、遺伝子の発現調節の機構などに関する、より詳細な情報が得られるはずです。また、さまざまな生命現象のうちで、何が、どの程度までゲノムに書き込まれた情報に依存しているか、ということも格段にはっきりとしてくるでしょう。ある問題がゲノムの情報だけでは解決できないということが明らかになれば、逆に、そのような視点に立った新しい生命科学の研究の方法論が生み出されてくるにちがいありません。あらかじめ、ゲノムの全構造がわかり、全遺伝情報を理解したうえで出発する研究は、必然的に遺伝子間、遺伝子産物間、細胞間…の相互作用ネットワークの解析へと展開することが予想されます。

藤山 秋佐夫

全ゲノム配列が発表・公開された生物(from JGI GOLD

バクテリアを中心に、ゲノムの全配列が次々と報告されています。21世紀に入るとヒトゲノムの全配列が明らかとなります。

生物種ゲノム ゲノムサイズ 遺伝子総数
Mycoplasma genitalium(マイコプラズマ感染症) 580Kb 467
Mycoplasma pneumoniae(肺炎の病原体) 816Kb 677
Borrelia burgdorferi B31(ライム病の病原スピロヘータ) 910Kb 1256
Chlamydia trachomatis(トラコーマ病原体) 1.04Mb 894
Rickettsia prowazekii(発疹チフス病原体) 1.11Mb 834
Treponema pallidum(梅毒トレポネマ) 1.14Mb 1031
Chlamydia pneumoniae(クラミジア) 1.23Mb -
Aquifex aeolicus(超好熱性細菌) 1.55Mb 1522
Helicobacter pylori J99(ピロリ菌) 1.64Mb 1495
Methanococcus jannaschii(メタン細菌) 1.66Mb 1770
Helicobacter pylori 26695(胃炎や胃潰瘍の病原菌ピロリ菌) 1.67Mb 1566
Pyrococcus horikoshii OT3(超好熱性古細菌) 1.74Mb 1979
Methanobacterium thermoautotrophicum deltaH(メタン細菌) 1.75Mb 1869
Haemophilus influenzae Rd(インフルエンザ菌) 1.83Mb 1717
Archaeoglobus fulgidus(好熱性硫黄細菌) 2.18Mb 2407
Synecocystis sp.PCC6803(ラン藻類) 3.57Mb 3166
Bacillus subtilis(枯草菌) 4.21Mb 4100
Mycobacterium tuberculosis H37Rv(結核菌) 4.41Mb 3918
Escherichia coli(大腸菌) 4.64Mb 4289
Saccharomyces cerevisiae(出芽酵母) 12Mb 6286
Caenorhabditis elegans(線虫) 97Mb 約19000
Kb:1,000文字(塩基対) Mb:1,000,000文字(塩基対)
ヒトゲノム計画

ヒトはさまざまな行動をしたり、病気になったりします。まったくの偶然から起きる事故のようなものから、感染症のような外因性のもの、高血圧や糖尿病のように多くの原因が考えられているもの、遺伝性のものなどさまざまです。ある種のがんや病気のように、ひとつの特定の遺伝子の変調によってがんや特有の症状が発生する確率が高くなる場合もあれば、高血圧や糖尿病など、食生活などの外因を含めたさまざまな因子が関与している場合もあります。また、体重とか体長といった量的な形質についても、栄養状態などの外因に加えて、複数の遺伝子が関与することが予想されていますが、それらの遺伝子を特定することなど、現時点では不可能なようにも思えます。

そこに、ヒトゲノム計画が提唱され、実行に移された重要なポイントがあるのです。ひとつひとつの表現形質に着目し、そこから個々の遺伝子にまで個別的にたどりつく方式ではなく、まず、ヒトゲノムに書かれている遺伝情報のすべてを知ることに全力を注ぎ、次に、各遺伝子産物の機能やそれらの相互作用の結果として現われる生理機能を明らかにしようという研究戦略です。

ヒトゲノム計画がつくりだすのは、大規模な装置や設備ではありません。私たちが近い将来に手にするのは、生命現象の基本プログラムの詳細な姿を明らかにするための基礎となる「情報」です。それらは、ゲノムの構造と密接に関連した生物情報知識ベースとしてコンピュータ化され、以後のバイオサイエンス研究の基盤情報としてオンラインで広く使われていくことが予想されます。別の言葉でいえば、近い将来にライフサイエンス研究の構造改革につながるような研究インフラストラクチャーの整備をめざすといってもいいでしょう。そのときには、ライフサイエンス研究者も実験科学と情報科学の両方を駆使するようになり、現在とはかなり変わったものになるかもしれません。

藤山 秋佐夫

ヒトゲノムの「ヒト」とは誰のこと?

世界中の研究者が自分の手に入る資料を使って遺伝情報の解析を進めています。それぞれの研究グループが、それぞれ手近なヒトの細胞を用いてヒトゲノムの解析を行っているのです。そして、その解析結果をつなぎあわせ、平均的なヒトゲノムを作り上げようとしています。もともとヒトはすべて雑種であり、代々遺伝子が混ざり合い、組み替えられているのですから、寄せ木細工のようなヒトゲノムでも大変役に立つのです。そのうえで、病気に関わるところや、人類集団の中で特に多様性があって興味を引くところなどを対象に、さらに詳しく調べていくことになります。要するに、何か標準的なヒトの細胞があって、それをすべての研究者が解析しているというわけではないのです。

藤山 秋佐夫

社会とゲノム研究の接点

ゲノム研究の成果と社会

ヒト・ゲノム計画が世界的規模で始められたとき、研究の進展と共にその成果の利用が社会的に問題となる場合がいろいろと予測されました。「研究の中間段階で不治の病の診断だけができるようになったが、治療法はまだ確立しない時」にはどうすれば良い、将来個人情報がどんどん得られるようになった時、どのような注意が必要か、ヒトの遺伝子は特許の対象となるか等がその一部です。実際にこのような問題が起きる可能性が高まったときに社会が適正な対応をするためには、まず第一に正確な情報を持っていることと、問題を把握し、判断するために必要な能力を多くの人が持つことが必要です。そのためには、ヒト・ゲノム計画に対して、プロジェクト研究として「すぐに役立つ成果」あるいは 「科学にとって重要な成果」を期待する以外に、社会全体にこうした問題に対処するために必要な情報を提供することが重要です。そのために、各国ともにゲノム研究と社会との関係に関する研究や活動を積極的に進めているところです。

藤山 秋佐夫

ゲノム研究に関連した代表的なデータベース
データベース名 作成地 内容
Medline National Library of Medicine (米国) 医学関連文献
OMIM Johns Hopkins University (米国) ヒト遺伝病
GDB Johns Hopkins University (米国) ヒト遺伝子地図
GenBank National Center for Biotechnology Information (米国) DNA/RNA塩基配列
EMBL European Bioinformatics Institute (英国)
DDBJ 国立遺伝学研究所 (日本)
PIR National Biomedical Research Foundation (米国) タンパク質アミノ酸配列
SWISS-PROT European Bioinformatics Institute (米国)
PRF 蛋白質研究奨励会 (日本)
PDB Brookhaven National Laboratory (米国) タンパク質等立体構造
PROSITE University of Geneva (スイス) タンパク質配列モチーフ
LIGAND 京都大学化学研究所 (日本) 酵素反応と代謝化合物
PATHWAY 京都大学化学研究所 (日本) 代謝パスウェイ
CAS Chemical Abstracts Service (米国) 化学関連文献と化合物

page top