「反応ネットワークによるゲノムとケミストリーの融合」
(Integration of Genomics and Chemistry by Reaction Networks)

京都大学化学研究所
バイオインフォマティクスセンター
生命知識システム
金久 實

 ヒトゲノム解読に続くポストゲノム研究においては、広い意味でのゲノム情報、すなわち遺伝子発現情報、多型情報、プロテオーム情報なども含め、ゲノムにコードされた分子情報が系統的に解析されている。高等生物から微生物までゲノム解読がルーチン化され、地球上の生命がもつゲノムのレパートリー(これをゲノム空間と呼ぶことにする)がしだいに明らかになりつつある。これに対して、自然界の一部としての生命に関与する化学物質のレパートリー(これをケミカル空間と呼ぶことにする)については、まだ全体像がよく見えない状況にある。本研究ではこのようなケミカル空間を明らかにすること、とくに反応系としてのケミカル空間をゲノム空間との関連で明らかにすることにより、創薬等の応用研究に適用することを目指した。具体的には、生体内物質を合成経路を通してゲノム情報と関連づけること、生体外物質を分解経路を通してゲノム情報と関連づけることを行った。

(1) ゲノムから生体内物質の化学構造へ
 KEGG [1] ではパスウェイ上で同一の場所、あるいはBRITE機能階層で同一の場所にマップされる遺伝子をオーソログ(KO - KEGG Orthology)として定義している。KEGGのゲノムアノテーションとは、ゲノム中の各遺伝子にKO識別子(K番号)を割り当てて遺伝子機能のアノテーション行うこと、さらにパスウェイマッピングとBRITEマッピングを通して高次機能のアノテーションを行うことである(図の(1)と(2)の部分)。この方法を拡張しゲノムの情報から生体内物質の化学構造を予測する方法を開発した(図の(3)の部分)。
遺伝情報を担うDNA、RNA、タンパク質は遺伝コードとテンプレート(鋳型)に基づく複製・転写・翻訳で合成される。これに対し糖鎖、脂質、テルペノイドなどの二次代謝物質の化学構造はテンプレートに書かれているのではなく、生合成反応経路に書かれている。そこでまず単糖をユニットとして合成される糖鎖について、糖転移反応に関する知識を集積し、糖転移酵素ファミリーを基質特異性で細分化したKO分類を行い、ゲノムまたはトランスクリプトーム中の糖転移酵素遺伝子群から糖鎖構造を予測する方法を開発した [2,3]。つぎにカルボン酸やアミノ酸をユニットとして合成されるポリケチドや非リボソームペプチドについて、ゲノムから化学構造の予測、さらには既知構造との比較による機能予測を行った [4]。現在は不飽和脂肪酸やテルペノイドについて類似の解析を行っている。

(2) 生体外物質の化学構造からゲノムへ
 ユニットを単位として合成される上記のような高分子に対して、生体内の低分子化合物については特定の酵素ファミリーに着目した手法は使えない。そこで既知の酵素反応すべてを対象とし、生体内化学反応に伴う化学構造変化のモチーフをRDMパターンと呼ぶ分類体系で知識ベース化した。これにより反応の前後での化合物の化学構造ペアから、どのような酵素が触媒し得るかを予測する方法論を開発し、酵素のEC番号づけの自動化を試みた [5]。つぎにKEGG代謝パスウェイマップの11のカテゴリーごとにRDMパターンの出現頻度を調べてみると、それぞれのカテゴリーに特徴的なパターンが見つかり、とくに非生体物質分解経路のカテゴリーでその特徴が顕著であった。これを用いて生体外の環境物質を微生物が分解する経路の予測を行った [6]。このような代謝運命を予測することは、化合物の化学構造から生物的意味を抽出することであるので、我々はケミカルアノテーションと呼んでいる(図の(4)の部分)。現在は分解経路を予測すると同時に関与する遺伝子を予測するために、類似反応における化合物の構造多様性と酵素遺伝子の配列多様性の関連解析を行っている。

  環境物質は微生物にとっては栄養源であっても、ヒトにとっては毒性をもつ物質となり得る。生体内反応を受ける代謝化合物に対して、それ以外の様々な相互作用をする低分子化合物を制御化合物と呼ぶことにすると、制御化合物のケミカルアノテーションは次のステップである。本研究ではその準備段階として、相互作用の知識をKEGG BRITEデータベースに集約することを行った。とくにレセプターやチャネルなどタンパク質ファミリーのKO階層とリガンドの階層との関連づけをKEGG BRITEデータベースの一部として行っている。薬とターゲットの関連も階層間の関連として、またパスウェイとの関連で解析できるように体系化を行っている。これらはケミカルゲノミクスの大量データ解析において、知識のレファレンスとして役立つと考えている。

 薬学研究科と連携したこの21COEプログラムは我々にとってKEGGデータベースを大きく発展させる契機ともなった。ゲノムからケミカルゲノムへという流れは本プログラムの基本テーマであり、またKEGGの新たな展開のテーマでもあった(文献 [1] はThompson社のFast Breaking Paperで、2007年8月末のISI引用数は106、Google ScholarではChemical genomicsのトップヒットで、引用数は175)。 KEGG GLYCANおよび糖鎖に関する情報技術開発は当初メンバーの川嵜教授との共同研究で開始したものであり、米国糖鎖コンソーシアム(Consortium for Functional Glycomics)との連携に発展した。KEGG DRUGには米国と日本で認可されたすべての医薬品の化学構造、ターゲット、薬効その他の情報が蓄積され、藤井教授と金子教授を通して日本医薬情報センター(JAPIC)の添付文書情報との統合へつながった。

参考文献
1. Kanehisa, M., Goto, S., Hattori, M., Aoki-Kinoshita, K.F., Itoh, M., Kawashima, S., Katayama, T., Araki, M., and Hirakawa, M.; From genomics to chemical genomics: new developments in KEGG. Nucleic Acids Res. 34, D354-357 (2006).
2. Hashimoto, K., Goto, S., Kawano, S., Aoki-Kinoshita, K.F., Ueda, N., Hamajima, M., Kawasaki, T., and Kanehisa, M.; KEGG as a glycome informatics resource. Glycobiology 16, 63R-70R (2006).
3. Kawano, S., Hashimoto, K., Miyama, T., Goto, S., and Kanehisa, M.; Prediction of glycan structures from gene expression data based on glycosyltransferase reactions. Bioinformatics 21, 3976-3982 (2005).
4. Minowa, Y., Araki, M., and Kanehisa, M.; Comprehensive analysis of distinctive polyketide and nonribosomal peptide structural motifs encoded in microbial genomes. J. Mol. Biol. 368, 1500-1517 (2007).
5. Kotera, M., Okuno, Y., Hattori, M., Goto, S., and Kanehisa, M.; Computational assignment of the EC numbers for genomic-scale analysis of enzymatic reactions. J. Am. Chem. Soc. 126, 16487-16498 (2004).
6. Oh, M., Yamada, T., Hattori, M., Goto, S., and Kanehisa, M.; Systematic analysis of enzyme-catalyzed reaction patterns and prediction of microbial biodegradation pathways. J. Chem. Inf. Model. 47, 1702-1712 (2007).