PDFAMS BaseはPDFAMSシリーズを用いて、未だ実験的に構造が決定されていない128生物種、18万種類以上の遺伝子について、61万個のタンパク質立体構造モデルを構築し、それをデータベース化した製品です。このデータベースには、4,374個のヒトのタンパク質モデルをはじめ、15,764個のマウスのモデルなど、多数の有効な情報を含んでいます(2003年6月4日現在)。
これまで、一般に実験(Wet実験)によって得られたタンパク質立体構造は、21,027個(2003年5月20日現在)であり、このデータベースは従来の約30倍ものタンパク質立体構造の予測データを含有しています。なお、2003年6月4日よりJBICのWebサイトにおいてオンラインで利用できるFAMSBASEの提供を開始しております。 (日本SGI株式会社からのプレスリリースはこちら)
同サービスにおいては2003年7月18日よりGPCRのデータベース、8月14日より微生物データベース、10月2日よりNEWGPCRデータベースも利用可能になりました。NEWGPCRデータベースは不活性型GPCRデータおよび活性型GPCRデータを含有するもので、これを利用することにより、GPCRを標的とする創薬の開発を効率よく進めることが可能となります。
詳細についてはJBIC FAMSBASEサービスWeb
http://www.pdfams.jbic.or.jp/
をご覧ください。登録データ数(2003年10月29日現在)
■128生物種に対応したFAMSBASEの構築方法NEWGPCRデータベース
対象遺伝子数:10,652
予測構造数(活性型):25,078
予測構造数(不活性型):25,078微生物データベース
登録生物種:94
対象遺伝子数:123,017
予測構造数:506,319GPCRデータベース
対象遺伝子数:6,408
予測構造数:10,852128生物種データベース
(ヒトおよびマウスのP450関連データを含む)
登録生物種:128
対象遺伝子数:185,819
予測構造数:612,880
格納データリストはこちら(PDFデータ)
御質問、お問い合わせはお問い合わせフォームからお願いします。
- ゲノム配列が完全解読された生物種に対するアミノ酸配列を入手。(ただし、GPCRは除く)
- 上記で得られたアミノ酸配列を質問配列として、PDBデータベースに対して配列アライメントを行う。
- 配列アライメントの結果、E-value<0.001であるPDBデータのエントリーを最大5つ選択。
- 各アライメントの結果を元にモデリングを行い、タンパク質の立体構造を予測。
- 予測した構造をPDBフォーマットにて出力。