富士通がウェブベースのバイオ研究環境構築ツール

ウェブインテリジェンス導入、複数サイトにまたがる処理を自動化

 2002.09.19−富士通は18日、インターネットベースでのバイオ研究を大幅に効率化するためのインフォマティクス環境構築ツールとして「KSA/WI」(商品名)を開発、販売を開始したと発表した。知的情報処理技術を用いてウェブ利用形態をインテリジェント化する“ウェブインテリジェンス”の概念を導入したもので、複数のウェブサイトとの面倒なやり取りを自動化できる。同社のバイオインフォマティクスソリューション体系のインフラストラクチャーを形成するミドルウエア技術に位置づけられており、ソフト価格は1サーバー当たり300万円。3年間で200本の販売を見込んでいる。

 バイオ分野においては、遺伝子データベース(DB)や遺伝子配列解析サービスを提供している公共のインターネットサイトにアクセスしながら研究を行うのが一般的だが、各サイトは分断されていてサービスが連携していないため、具体的に利用しようとすると全体の効率が悪かった。

 例えば、DNAチップ/マイクロアレイでの発現解析のあとに、実際に発現した遺伝子の情報を文献で調べようと思う場合、マイクロアレイ上には遺伝子コードの情報しかないため、そのままではPubMedなどの文献DBで検索できない。そこで、まず遺伝子コードで検索できるUniGeneのDBにアクセスし、その遺伝子から生成されるたん白質の情報を検索し、そのたん白質IDをもとにProteinのDBで関連文献をみつける。そこでPubMedにリンクしているIDを取得して、ようやく目的の遺伝子に関連した文献情報が入手できるということになる。

 別の例はBLASTサーチである。まずDDBJにアクセスし、検索用番号に対するアミノ酸配列情報を取得する。次にDDBJに対しBLAST解析のリクエストを出す。さらにSWISS-PROTとPDBに対してもそれぞれBLAST解析のリクエストを出す。そして、解析結果をマージさせるコマンドを実行したあと、最終的な結果を表示させるという手順になる。

 このように、バイオ研究ではインターネットを利用した定型的な操作が多く発生しており、逆にこのことが研究全体のスピードアップを阻むボトルネックになっているのだという。

 今回のKSA/WIは、それぞれの研究者がウェブサイトを利用する手順をあらかじめスクリプトとして記述しておくためのツールキットであり、具体的には共通ライブラリーという形でバイオインフォマティクスに特有のタグが提供される。このタグには、ゲノムDBとしてのEMBLやGenBank、DDBJ、たん白質DBとしてのPDB、PIR、SWISS-PROT、解析プログラムとしてのFASTAやBLAST、ClustalW、DBエンジンとしてのオラクルやBizSearch(富士通製)、標準プログラムインターフェースとしてのSOAP、Bean、XSLT、JavaMailなどを利用する機能が含まれており、ユーザーはこのタグを使ってスクリプトを書くだけで面倒な作業を自動化することができる。

 同社では、利用できるタグやひな形を順次増やして使い勝手を向上させるとともに、コンサルティングなどの付加的なサービスを提供して個々の研究者をサポートしていく。XMLやSOAPへの対応など、今後増加するとみられるバイオインフォ系のウェブサービスの活用も視野に入れているようだ。

 KSA/WIは、研究者の個人的な生産性向上に役立てることを目的に開発されており、研究室やグループ単位でのバイオ研究インフラとして利用するのが最適。ライセンスはサーバー単位で、ユーザー数に制限はない。プラットホームはSOLARIS7以降、WindowsNT/2000/XPに対応している。なお、この製品は開発コード名EIDOSと呼ばれていたもので、徳島大学ゲノム機能研究センターや理化学研究所など4機関をベータサイトとして開発が進められた。