氏名: 群馬大学大学院工学研究科 准教授 宮澤三造 (みやざわ さんぞう) 居室: 2号館 3階 305-2号室 電話: 0277-40-2555 E-mail: miyazawa@smlab.cs.gunma-u.ac.jp プロフィール: 1948年生まれ、 1970年東京都立大学物理学科卒、 1975年名古屋大学大学院物理学専攻満期退学, 1975-79年九州大学生物専攻研究生、 1979-85年米国国立衛生研究所(NIH)外国人研究員, 1986-91年国立遺伝学研究所助教授, 1991年群馬大学工学部助教授. 米国生物物理学会、日本生物物理学会、他会員. 理学博士. 題目: 生物情報学: 生物学と情報学の出会い 生物学と情報学、読者の方にとってこの2つの分野は互いにもっとも縁遠い分野と映る のではないでしょうか? ところが、現在、分子レベルでの生物/医学研究は、大規模計算 を必要とする分野の一つあり、また情報学的手法は、化学/物理学的手法に加え、第3の 手法として活躍しています。では、なぜ生物の解析/研究において情報学が必要とされる ようになったのでしょうか? ここ4半世紀における生物学分野における分子レベルでの解析技術の進歩は著しく/、各 種生物の遺伝情報の解析が以前とは桁違いに容易になりました。生物の遺伝情報は、 A,T,C,Gの 4種類の塩基が鎖状に結合したDNAという分子における塩基の結合順序に暗号 化されています。DNAは、類似の分子である 1本鎖RNAに転写され、順に、RNAは3つの塩 基の並びで一種類のアミノ酸を指定する形で、その塩基配列からアミノ酸配列(蛋白質) が合成され、DNAにコードされている遺伝情報が発現されます。蛋白質は生体の重要な 構成成分の一つであり、生体に必要な物質の合成、不必要になった高分子の分解等の化 学反応を触媒する高分子ですから、その意味で、アミノ酸配列を指令する塩基配列は、 生物の設計図そのものと言えるでしょう。 さて、 (生殖)細胞に含まれる遺伝子の総体をゲノムと言いますが、ヒトのゲノムの塩 基配列がすべて解析されたことをご存知でしょうか? ヒトだけでなくチンパンジー、マ ウスをはじめ数多くの生物種のゲノム塩基配列がすでに解析されています(図-1 参照)。 現在までに解析された全ての生物種におけるDNAの総塩基長は, 約30億塩基からなるヒト のDNAの約 30倍、約 1000億塩基にも上ります。このような生物情報の爆発的増加が、 その管理に情報学的手法を必要とする原因となりました。現在では、管理だけでなく 解析においても情報学が必須となっています。ヒトのゲノムを例にとると 30億塩基から なる配列上に蛋白質をコードしている約5万の遺伝子が散在して分布しています。遺伝子 配列は、総塩基数の 4%程度にすぎません。遺伝子の発現を調節している配列部位の同定 、遺伝子位置の予測に塩基配列の統計的特長に基づく情報学的手法が用いられています。 では遺伝子の機能は理論的に予測可能でしょうか? これまでに、進化的に類縁な塩基 /アミノ酸配列は、その配列順序が類似していることが判明しています。よって、類似な 配列を塩基/アミノ酸配列データベース上で検索し、もし類似配列が発見されれば、その 類似配列と同じ機能を所持していると考えられます。また、配列間の類似性に基づき DNA塩基配列と生物種間に生じた進化の道筋を明らかにすることが可能です(図-2 参 照)。類似配列のデータベース検索、類似性に基づく分子系統樹作成は、生物情報学の基 盤を形成する解析手法です。 さて、アミノ酸が鎖状に結合した高分子である蛋白質は、生理的条件下では、各々の 蛋白質に固有の立体構造に折り畳まれます。蛋白質は、小分子や他の蛋白質と結合し て機能しますのでその固有な立体構造と機能は不可分な関係です。幸いなことに地球上 の生物種に含まれる蛋白質の構造の基本型は数千であることが予想されています。そこで 全ての基本型を明らかにすべく解析が世界中で進行中で、最近では 1日あたり20程度の 蛋白質構造が報告されています。 しかし、配列解析に比較すると時間と費用 がかかりますので、構造予測が期待されています。蛋白質は、温度の上下により、可逆的 に立体構造の崩壊と折り畳みが生じますので、アミノ酸の配列順序が物理化学法則の下、 立体構造を指令していることは明らかです。それ故、配列からの構造予測が、半世紀前 より研究されてきましたが、最近、既知の立体構造データの解析に基づく帰納的方法に より、かなりの精度で予測可能になりつつあります。 蛋白質はDNA(遺伝子)と相互作用することで遺伝子発現を制御し、また互いに相互作用 し生体反応を制御しています。相互作用ネットワークの理解に基づく生体の計算機 上でのシュミレーションは、今後期待されている分野です。このように、生物情報学は 各種の情報を統合化してシステムとして生物を理解する方向へと発展しつつあります。 私の研究室で研究しているのはこのような分野です。 図の説明: (pdf ファイルの順番) 図 1. 各年までに解析された塩基配列の総塩基数とこれまでにゲノム解析が終了した生物種 (http://www,ncbi.nlm.nih.gov/). 図 2. 血液中で酸素を運搬するグロビン蛋白質族の各蛋白質配列の類似度から計算されたに 分子系統樹。ミオグロビン、ヘモグロビン Alpha, Beta は遺伝子重複により分岐し、 各グロビン内の分岐は生物種の分岐による。描かれている各蛋白質の骨格構造を見ると、 互いに類似していることがわかる. 図のヘモグロビン Alpha の系統樹では誤差により 新の種分岐系統樹とは異なる部分がある。 (Alpha, beta はギリシャ文字で印字すること)