遺伝暗号（コドン）使用の種による多様性｜遺伝学とは

遺伝暗号（コドン）使用とコドン使用データベース：遺伝子工学やゲノム解析との係り

はじめに

タンパク質分子のアミノ酸配列を規定する遺伝情報はDNA上に塩基配列として書かれており、コドンと呼ばれる連続した3塩基が単位となって1個のアミノ酸を指定します。それぞれのコドンがどのアミノ酸に対応するかという関係は、図1の遺伝暗号表に示されます。大部分の生物種のゲノムに当てはまる対応表であり普遍遺伝暗号表と呼ばれますが、この暗号表から若干ずれている例も知られています。ずれているゲノムとしては、ミトコンドリアが有名ですが、他にもマイコプラズマのような原核生物の例も知られています（1）。

20種類のアミノ酸が64種類のコドン（終止コドンを含む）によって指定され、普遍遺伝暗号表においても、メチオニン（Met）とトリプトファン（Trp）を除く18種のアミノ酸には複数個のコドンが対応しています。同一のアミノ酸を指定する複数個のコドンは同義コドン（synonymous codon）と呼ばれます。遺伝子DNA上でどの同義コドンが用いられても同じアミノ酸として翻訳されるわけで、でき上がったタンパク質分子は同一です。この理由で、同義コドン間の選択（コドン選択と略す）は生物的意味に乏しいと考えられる傾向にありました。しかし広範囲の生物種の多数の遺伝子の塩基配列が判明するにつれ、予想外の規則性や特徴がコドン選択に見い出されるようになり、遺伝子やゲノムの様々な未知の性質を知る手掛かりとなっています。同義コドン選択に着目して、遺伝子塩基配列に潜んでいる未知の機能や性質を見い出そうとする研究が、コドン選択の研究と言えます。コドン選択を研究する際に有用な基礎となる、コドン（遺伝暗号）使用データベースから解説を始めましょう。

原図、資料：池村淑道

コドン（遺伝暗号）使用データベース「CUTG」について

コドン使用データベースにおいては、各生物種のコドン使用の特徴を知る目的で、各タンパク質遺伝子から算出されるコドン使用の回数を生物種ごとに集計し、千分率で表示しています。このデータベースは遺伝研の進化遺伝研究部門の池村淑道と生命情報センターの五條堀孝が開発を行い、かずさDNA研究所の中村保一が中心となって構築と運営を行っています（2-8）。
http://www.kazusa.or.jp/codon/を選択するとこのデータベースに入れます。リンクがはってありますので、DDBJからも入ることができます。各生物種の名称については、ラテン語の学術名で入力する必要があります。大腸菌の場合はEsherichia coliと入力する必要があり、人の場合はHomo sapiensです。専門家でない方は不便に感じられると思いますが、正確さを期すためには最善の方法です。但し、A～Zのアルファベットの索引が用意されており、人の場合にはHを選べばHで始まる生物種のリストが表示されます。正確な綴りがわからなくても容易に検索が可能です。同様に、大腸菌の場合にはEの項目を選べば正確な学術名を知ることができ、対応の部分をクリックすることで大腸菌のコドン選択の特徴を知ることが可能になります。図2で大腸菌（Escherichia coli）を、図3で酵母（Saccharomyces cerevisiae）の例を示します。現在では、約1万の生物種のコドン使用を知ることが出来ます。これらの生物種の計40万件の遺伝子の解析から得られた結果であり、世界的に利用されているデータベースです。国外からの利用の度合が高いことから、マニュアル等が英文で書かれています。但し、ここに書かれた解説に従えば、容易に各生物種のコドン使用の特徴を知ることが出来ます。このデータベースがどのような目的に利用されているのか、コドン使用に関する我々の研究と合わせて以下に解説を行います。

原図、資料：池村淑道

単細胞微生物のコドン選択の生物種による方言

微生物のゲノムの塩基組成は、生物種により大きく異なっており、ゲノムのG+C%は、各生物種を特徴づける基本的な指標として使われてきました。図1の遺伝暗号表で明らかなように、コドン選択は主としてコドンの3文字目の選択に対応しています。ロイシン（Leu）とアルギニン（Arg）とセリン（Ser）については1文字目にも選択の余地がありますが、コドン2文字目の変化は必ずアミノ酸の変化をもたらします。従って、ゲノムのG+C%は、コドン1・2文字目に比べて、3文字目で最も顕著に観察されています。コドン選択は、ゲノムG+C%以外にも、遺伝子やゲノムの様々な性質を反映していることが明らかになっています。我々の研究グループは、コドン使用の生物種による特徴を、「コドン使用の方言（Dialectal codon choice）」と呼んできました。

図4に大腸菌（E.coli）ならびに酵母（S.cerevisiae）に関して、各々の数例の遺伝子について、コドン使用の例を示しています。加えて、コドン（遺伝暗号）使用データベースから得られた大腸菌とサルモネラ菌（Salmonella typhimurium）ならびに酵母（S.cerevisiae）に関するコドン使用の集計値を千分率で表示した値も示しました。大腸菌とサルモネラ菌は近縁の腸内細菌で、それらのゲノムGC%は約50%であり、塩基組成はGCにもATにも偏っていません。酵母（S.cerevisiae）の場合、ゲノムGC%は40%でややATに偏っていますが、極端なものではありません。このようにゲノムのG+C%の偏りが顕著でない微生物類の場合でも、同義コドンは均等に使われてはいません。同義コドンの使用に関して、以下のような一般的な性質が知られています（9-19）。
a）大部分の遺伝子について、同義コドンが明瞭に不均等に使用されています。
b）同一生物種の遺伝子類のコドン選択パターンは、相互に似た特徴を持っています。図4の例でも明らかなように、大腸菌の遺伝子類は相互に似た特徴を持っており、その特徴は集計値でも成立しています。酵母の場合でも、遺伝子の種類に関係せずに似た特徴を持っていますが、興味深いことに、その特徴は大腸菌のものとは大きく異なっています。
c）同一生物種の遺伝子間を比較した場合、多量にタンパク質を生産する遺伝子ほど方言がきつく、生産量が下がるにつれて、同質の方言を用いながらも、その方言の程度が緩くなります。図4では、生物ごとに、タンパク質生産量の高い遺伝子を左側に配置してあります。大腸菌のtufAB（ポリペプチド鎖延長因子）、ompC（外膜タンパク質）は多量にタンパク質を生産する遺伝子の例であり、trpやthrはアミノ酸合成系の遺伝子で、通常条件下では中程度ないしは少量のタンパク質しか生産していません。酵母のG3PDHやenolaseは解糖系の酵素で、最も多量に生産されるタンパク質であり、TRPやCYCは中程度ないしは比較的少量しか生産されない例に属します。生産量の高い遺伝子ほどコドン選択の偏りが顕著で（方言がきつい）、生産量の低い遺伝子では偏りの程度が緩くなります。この傾向は広範囲の遺伝子で成立することが判明しています。
d）近縁関係にある大腸菌とサルモネラ菌はほぼ同一の方言を用いています。系統上近縁関係にある生物種は似た方言を持ち、系統上遠くなるにつれて方言も異質になることが知られています。言い換えれば、コドン選択の方言は進化の過程で比較的安定に保持される性質と言えます。
e）図4には示していませんが、プラスミド･トランスポソン･ウイルス遺伝子等の外来性的な遺伝子の場合、必ずしも宿主の方言とは同化していません。これらの遺伝子の場合、遺伝子DNAのコピー数を増大させたり、強いプロモーターを用いたり、宿主の遺伝子発現を止めたりして、多量にタンパク質を生産することが知られています。

原図、資料：池村淑道

コドン使用とtRNA量との関係、遺伝子工学との係り

タンパク質生産量の高い遺伝子ほどコドン選択の方言がきつく、生産量が下がるにつれて、同質の方言を用いながらも、方言の程度が緩くなることを指摘しました。この事実は、分子進化学として興味深いだけでなく、遺伝子工学の分野からも注目を受けています。進化遺伝研究部門の池村らは、大腸菌（E.coli）・サルモネラ菌（S.typhimurium）・枯草菌（Bacillus subtilis）・酵母（S.cerevisiae）の細胞内tRNA量を定量し、これらのコドン選択の方言がtRNAの相対量分布と関係することを明らかにしてきました（9-20）。tRNAはアミノ酸ごとに異なっており、多くの場合、1つのアミノ酸について複数種のtRNA分子（isoaccepting tRNA）が対応しています。Crickのwobble説から明らかなように、1種類のtRNAが複数種類の同義コドンを解読するのが通例ですので、tRNAの種類はコドンの種類よりは少数です。細胞内tRNA量を基礎にし、タンパク質合成効率と関係する以下の3規則を総合することで、コドン選択の方言（特徴）の大部分が説明できます（9-20）。

規則1）1種類のアミノ酸にアンチコドンの異なる複数種類のisoaccepting tRNAが存在する場合、最大量tRNAの解読するコドンが好まれる。
規則2）アンチコドンに修飾塩基が存在する場合、コドンとの対合の性質を変化させ、コドン選択性に影響を与えます。具体例としては、アンチコドンの1文字目（コドンの3文字目と対合する）にthiolated Uが存在すると、3文字目がAであるコドンの方がGであるコドンよりも好まれます。アンチコドンの1文字目がI（inosine）の場合には、3文字目がTとCとAのコドンを解読可能ですが、TやCである方がAよりも好まれます。
規則3）コドンの1文字目も2文字目もAかTであり、3文字目のTとCが単一のtRNAで解読される場合、コドンの3文字目はTよりもCが好まれます。理由は、リボソーム上でコドンとアンチコドンが対合する際に、1文字目も2文字目もアンチコドンと弱いWatson-Crick対合（A-U対合）しか形成できない上記コドン類の場合、3文字目はさらに弱いG-U wobble対合よりは、強いG-C対合が好まれる傾向にあります。この規則は規則1・2よりは弱い効果しか持たず、生産量の高い遺伝子には当てはまりますが、生産量の低い遺伝子になるにしたがって不明瞭になります（酵母の生産量の低い遺伝子では、AT圧の方が勝ってしまい、TがCよりも好まれる傾向にある）。

以上の規則が大腸菌と酵母の大半の遺伝子に良く当てはまり、これらの規則を総合することで大腸菌と酵母の方言の大部分が説明できます。この点については、既に数編の論文と総説類（9-19）で解説をおこなっていますので、ここでは結論のみを紹介します。我々のグループは、規則1-3を総合して導かれる翻訳能率を最適化すると推定されるコドンを、適合コドン（optimal codon）と呼んでいます。大腸菌とサルモネラ菌ならびに酵母のtRNA量を基礎にした適合コドンについては、図4で生物種別に*印を付しています（*印のないアミノ酸種がありますが、これらはisoaccepting tRNAの定量の完了していないものに対応します）。*印の分布と各生物種のコドンの好みに良い一致が見られます。適合コドン（*印）とコドン選択の好みとが、良く一致する理由は、コドンがタンパク質合成能率に充分に配慮して選択されていることの反映です。タンパク質合成は他の細胞内諸反応過程と比べて、格段に多量なエネルギーを消費することが知られています。この過程を極力能率的に行おうとする方策が、コドン選択の方言として顕れており、細胞内tRNA量に適合したコドンが選択されていると考えられます。

現在では、上記の3規則が広範囲の単細胞微生物で成立することが判明しています（20）。ゲノムG+C%の偏りの顕著な生物種については、その効果を組み入れることも重要で、微生物の全体を考えた場合、ゲノムG+C%とtRNA量とがコドン選択のパターンを決める主要因として知られています。現存の各生物種のコドン選択パターンは、それらの要因が相互に関係しながら、共進化をした結果と考えられます。

遺伝子工学においては、ヒト等の高等生物の遺伝子を単細胞微生物に導入し、有用タンパク質を多量に生産させることが一般的です。その際、それら高等生物の遺伝子のコドン選択パターンと宿主菌のコドン選択の方言とに差が生じていることが予想されます。この問題について、遺伝子工学の実験的な研究から、以下のような観察事項が指摘されています。1）コドン選択パターンはタンパク質生産量と関係する一つの重要な因子である。2）rare codon（その生物種が低頻度でしか使用していないコドン）を連続して用いると、生産量の低下を引き起こす傾向が見られる。3）遺伝子の先頭部分でrare codonを連続して用いる遺伝子があるが、なんらかの制御機構と関係している可能性が高い。4）コドン選択パターンはタンパク質生産量のみでなく、翻訳過程の正確度とも関係する。これらの観察事項を考えた場合、有用なタンパク質を純度高く多量に生産させる遺伝子工学においては、宿主細胞で多用される同義コドンを用いることが好ましいと予想されます。遺伝子を化学合成する際には、宿主菌のコドン使用の特徴を十分に理解して、遺伝子を合成する必要があります。この場合に、上記のコドン使用データーベースが活用されています。上でも解説したように、大量に生産する遺伝子ほど方言がきついことが知られています。遺伝子工学では大量生産が目的となりますので、きつい方言を選ぶほうが良いと考えられます。言い換えれば、各アミノ酸でもっとも多用されるコドンのみを用いて遺伝子を合成する方法がとられます（11-12）。勿論、実際のタンパク質の生産量については、mRNAの高次構造や安定性等の効果の予測が難しい要因も関係しており、タンパク質の多量生産には試行錯誤的なアプローチも必要になります。化学合成をせずに遺伝子をクローン化して他種生物の細胞内でタンパク質を生産させる際にも、宿主生物でまれにしか使用されないコドン（rare codon）が連続して頻度高く出現するような場合には、その部分の改変を試みることが有効な手段と考えられます。

コドンデーターベースを用いて実際に合成遺伝子のデザインを行う場合には、次の点も考慮に入れておくほうが安全と思われます。コドンデーターベースで得られる生物種の特徴は、少量しか生産しない遺伝子の例も合算しており、方言がゆるくなっています。もちろん、大半の遺伝子は同質の方言ですので、各アミノ酸で最も多用されるコドンを選べば、タンパク質合成能に適合したコドンとなるはずであり、目的に合致すると考えられます。しかし、その点を確認する必要を感じられる際には、各生物種のリボソ－ムタンパク質（ribosomal protein：多量に合成されるタンパク質の代表例）のみを抽出し、その集計値を参考にすることをお勧めします。この種の検索もコドン使用データーベースを利用することで可能になります。生物種名を選択した後に、Codon usage for each CDSを選択することで、その生物種の各遺伝子ごとのコドン使用回数をftpで取り出すことができます。あとは、各自の持たれているワープロソフトで、ribosomalやribosome（またはribosom）等を選べます。勿論Excelのような表計算ソフトに取り込めば、より応用範囲が広まります。各生物種のタンパク合成効率を最適化するコドンを確認することができます。各生物種のコドン選択の特徴を知ることは、遺伝子クローニングの際のプローブの作成やPCRのプライマー作成の際にも、重要な指針となっています。

原図、資料：池村淑道

コドン使用とゲノム解析との係り

コドンデータベースはゲノム解析計画で得られる大量塩基配列情報からタンパク質遺伝子を特定する際にも、重要な役割を果たしています。遺伝子のコーディング領域を推定する際には、ORF（open reading frame) を抽出後に、本物のタンパク質遺伝子に対応するのか、たまたま得られたORFなのかを特定することが重要になります。本物のタンパク質遺伝子のORFであれば、コドン使用パターンはその生物種のコドン選択の方言に合致するはずです。一方、遺伝子に対応しないORFであれば、形式的に算出されたコドン使用がtRNA量に適合しているとは考えられず、コドン選択の方言とは無関係になるはずです。この原理は、ゲノム計画で決定された配列からタンパク質遺伝子を特定する際に有効な手段となっています。例えば、世界的に広く利用されている遺伝子を検出するためのプログラム類には、各生物種のコドン使用の特徴に基づく判定が組み込まれています。我々のグループも、独自に多変量解析を用いた方法を開発してきました（20、21）。単細胞微生物の場合、各遺伝子のコドン使用パターンが、そのタンパク質の細胞内存在量、すなわち生産量と関係しています。各遺伝子がどの程度にtRNA量に適合した同義コドンを使用しているのかを定量化することで、タンパク質生産量を推定することが可能になっています（11-16、20、21）。タンパク質の細胞内における存在量は、その機能を推定する上で重要な知見であり、ゲノム解析においてこの面でも重要な貢献が期待できます。

原図、資料：池村淑道

高等多細胞生物のコドン選択

単細胞微生物のコドン選択の場合、プラスミド･トランスポソン･ウイルス遺伝子等の外来性的な遺伝子類は別ですが、その生物の本来の遺伝子類の場合は、遺伝子の種類にはよらずに同質の方言を用います（方言のきつさには差がありますが）。しかしながら、高等多細胞生物の場合、特に温血脊椎動物の遺伝子類の場合には、同一生物種の核遺伝子間でも顕著に異なるコドン選択パターンを持っています（14-15、22-27）。言い換えれば、生物種による共通的な特徴（方言）を見い出すのが困難であり、むしろ同一生物種遺伝子間に顕著な多様性が存在すると表現できます。図5にヒト遺伝子のコドン使用の具体例を示します。左側の6つの欄はコドン3文字目がGCに富む遺伝子の例を、右側の6欄には3文字目がATに富む例を示してあります（各遺伝子について最も多用される同義コドンの使用回数に下線を付してあります）。同義コドン使用パターンが2つのグループで全く異なっています。同一生物種の本来の遺伝子間に見られるこのような顕著な多様性は、原核生物や下等真核生物ならびに無脊椎動物等には見られず、主に温血脊椎動物で特徴的に観察される性質です。コドン選択のこの多様性を生む要因が、染色体のバンド領域（R、T、G/Qバンド）と関係することが判明してきています（22-29）。Rバンドのサブグループで熱変性に対して安定なTバンド上に存在する遺伝子類の場合、コドン3文字目は顕著にGとCに富む傾向を示します（例えば80% G+C以上）。一方、Gバンド上の遺伝子類は中程度のGC含量かATに富む傾向を示し、通常のRバンド遺伝子はそれらの中間的性質を持つ傾向にあります。その生物学ならびに進化学上の意味については、我々の原著論文や総説で解説しています（22-29）。遺伝子数については、R（ならびにT）バンド上に存在する遺伝子の方がGバンド上に存在する遺伝子よりもはるかに多いことが知られています。従って各生物種ごとに集計を行うと、RやTバンド上の遺伝子の特徴を主として反映することとなり、3文字目がGとCに富んでいます（図6）。しかし3文字目がATに富む遺伝子もその絶対数は少くなく、特定の時期に限定された組織で発現を行う遺伝子にこの例が多く見られます。高等多細胞生物のコドン選択を考える場合、コドン選択の多様性は忘れてはならない重要な性質です。高等動物の染色体バンド領域は、DNA複製や遺伝子発現の制御機構と関係することが明かになってきています（30-35）。コドン選択パターンはこれらの問題を解析するための興味深い知見を与えており、分子進化学的にも着目されています。染色体バンド構造が出来上って来た染色体進化を研究する上でも重要な知見を与えると考えられます。実用段階を迎えた遺伝子工学においても、考慮しておかなければならない問題です。高等動物のコドン選択パターンは遺伝子発現様式と関係をしているために、遺伝子治療等で有効となる遺伝子ターゲッティングにおいても注意をはらう必要が出て来る可能性があります。

原図、資料：池村淑道

文献

S.Osawa, T. H. Jukes, K. Watanabe, A. Muto. Microbiological Reviews, 56, 229, 1992.
Y. Nakamura, T. Gojobori, and T. Ikemura. Codon usage tabulated from the international DNA sequence databases. Nucl. Acids Res. 26 334 1998.
Y. Nakamura, K. Wada, Y. Wada, H. Doi, S. Kanaya, T. Gojobori, and T. Ikemura. Codon usage tabulated from international DNA sequence databases. Nucl. Acids Res., 24, 214-215, 1996.
T. Ikemura. CODON USAGE. Plant Molecular Biology LABFAX, Croy R.R.D. ed., 37-48, Blackwell Scientific Publications, UK, 1993.
K. Wada, Y. Wada, F. Ishibashi, T. Gojobori, and T. Ikemura. Codon usage tabulated from the GenBank genetic sequence data. Nucl. Acids Res., 20, Supplement, 2111-2118, 1992.
K. Wada, Y. Wada, H. Doi, F. Ishibashi, T. Gojobori, and T. Ikemura. Codon usage tabulated from the GenBank genetic sequence data. Nucl. Acids Res., 19, Supplement, 1981-1986, 1991.
K. Wada, S. Aota, R. Tsuchiya, F. Ishibashi, T. Gojobori, and T. Ikemura. Codon usage tabulated from the GenBank genetic sequence data. Nucl. Acids Res., 18, Supplement 2367-2411, 1990.
T. Maruyama, T. Gojobori, S. Aota, and T. Ikemura. Codon usage tabulated from the GenBank genetic sequence data. Nucl. Acids Res., 14, r151-197, 1986.
池村淑道. コドンの使用頻度. “分子進化学入門”, 木村資生（編）, p.91-115、培風館（1984）.
池村淑道. “分子進化実験法”,日本生化学会(編), ゲノムGC含量の進化, p.217-230; 遺伝暗号使用頻度, p.444-466, 培風館 (1984).
池村淑道. コドン使用とtRNA. 細胞工学, 5, 212-221 (1986).
池村淑道. 遺伝子工学との係わり. 細胞工学, 2, 1541-1553 (1983).
池村淑道. コドン使用. "シリーズ分子生物学の進歩1: DNAの構造と動態"(大沢省三ら編), p.217-244, 丸善 (1988).
T. Ikemura. Correlation between codon usage and tRNA content in microorganisms. Transfer RNA in Protein Synthesis, eds. Hatfield, D. L. et al., CRC Press, 87-111, 1992.
T. Ikemura. Codon usage and transfer RNA content in unicellular and multicellular organisms. Mol. Biol. Evol., 2, 13-34, 1985.
T. Ikemura. Codon usage and transfer RNA contents; organism-specific codon-choice patterns in reference to the isoacceptor. Cold Spring Harbor Symp. Quant. Biol., 47, 1087-1097, 1982.
T. Ikemura. Correlation between the abundance of yeast transfer RNAs and the occurrence of the respective codons in its protein genes: Differences in synonymous codon choice patterns of yeast and Escherichia coli with reference to the abundance of isoaccepting transfer RNAs. J. Mol. Biol., 158, 573-597, 1982.
T. Ikemura. Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes: a proposal for a synonymous codon choice that is optimal for the E.coli translational system. J. Mol. Biol., 151, 389-409, 1981.
T. Ikemura. Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes. J. Mol. Biol., 146, 1-21, 1981.
S. Kanaya, Y. Yamada, Y. Kudo, and T. Ikemura. Studies of codon usage and tRNA genes of 18 unicellular organisms and quantification of Bacillus subtilis tRNAs: Gene expression level and species-specific diversity of codon usage based on multivariate analysis. Gene, in press, 1999.
S. Kanaya, Y. Kudo, Y. Nakamura, and T.Ikemura. Detection of genes in Escherichia coli sequences determined by genome projects and prediction of protein production levels, based on multivariate diversity in codon usage. CABIOS, 12, 213-225,1996.
池村淑道. “RNAの世界”大沢省三、志村令郎（編）, ゲノム編成と遺伝暗号, p.205-232; 世界に構築されている分子生物学関係のデータベース, p233-253, 講談社サイエンテイフィク（1990）.
池村淑道. ヒト染色体バンド構造と遺伝子塩基配列. 生体の科学, 40, 586-591（1989）.
池村淑道、石橋芙美恵、青田伸一. 高等脊椎動物染色体のバンド構造と遺伝子塩基配列. 蛋核酵, 32, 1220-1233 (1987).
池村淑道、青田伸一. 高等脊椎動物遺伝子の故貪コドン選択パターンと染色体のバンド構造. 生物物理, 27, 135-139 (1987).
T. Ikemura and K. Wada. Evident diversity of codon usage patterns of human genes with respect to chromosome banding patterns and chromosome numbers; relation between nucleotide sequence data and cytogenetic data. Nucl. Acids Res., 19, 4333-4339, 1991.
T. Ikemura, K. Wada, and S. Aota. Giant G+C% mosaic structures of the human genome found by arrangement of GenBank human DNA sequences according to genetic positions. Genomics, 8, 207-216, 1990.
T. Ikemura, S. Aota, Global variation in G+C content along vertebrate genome DNA: Possible correlation with chromosome band structures, J. Mol. Biol., 203, 1-13, 1988.
S. Aota and T. Ikemura. Diversity in G+C content at the third position of codons in vertebrate genes and its cause, Nucl. Acids Res., 14, 6345-6355 and 8702, 1986.
T. Tenzen, T. Yamagata, T. Fukagawa, K. Sugaya, A. Ando, H. Inoko, T. Gojobori, A. Fujiyama, K. Okumura, and T. Ikemura. Precise switching of DNA replication timing in the GC content transition area in the human major histocompatibility complex. Mol. Cell. Biol., 17, 4043-4050, 1997.
T. Fukagawa, K. Sugaya, K. Matsumoto, K. Okumura, A. Ando, H. Inoko, and T. Ikemura. A boundary of long-range G+C% mosaic domains in the human MHC locus; Pseudoautosomal boundary - like sequence exists near the boundary. Genomics, 25, 184-191, 1995.
深川龍郎、大野みずき、池村淑道. ヒト染色体バンドの意味するもの.蛋核酵, 41, 2277-2287 (1996).
深川竜郎、菅谷公彦、中村保一, 池村淑道. DNAと染色体バンドレベルの進化の総合的理解. 蛋核酵, 39, 2490-3501 (1994).
深川竜郎、中村保一、池村淑道. GC%の巨大区分構造が語るものーゲノム進化の視点から. 実験医学, 13, 147-152 (1995).
金谷重彦、池村淑道. ゲノムと塩基組成. "ゲノム情報を読む", ネオ生物学シリーズ 2, 共立出版, p18-35 (1997).

原図、資料：池村淑道