遺伝研と富士通が世界最高速のバイオDB共同開発へ

XMLベースで次世代標準の地位を狙う、年内にプロトタイプ公開

 2004.07.09−国立遺伝学研究所と富士通は7日、XML技術を利用して世界最高速の次世代バイオデータベースを共同開発すると発表した。バイオ分野では、蓄積される情報量が急速に拡大し続けているため、研究を円滑に進めるためにも検索速度の高速化が求められている。すでに開発したプロトタイプは、現行システムの100倍以上の検索速度を達成しているとしており、さらなる開発を通して同分野のデファクトスタンダード技術になることを目指していく。

 今回のシステムには、富士通のXML型データベースエンジン「Interstage Shunsaku Data Manager Enterprise Edition」(インターステージ・シュンサク、参照:http://interstage.fujitsu.com/jp/v6/shunsaku/)を基盤技術として採用している。もともとは、通常の文書検索の超高速処理を目指して開発されたもの。バイオ分野のデータベースはフラットファイル形式がメインで、必ずしも検索に適していないため、XML形式への転換が次世代の主流になると目されている。今回の遺伝研と富士通の共同研究も、そうした動きをにらんだものとみられる。

 遺伝研が運営する日本DNAデータバンク(DDBJ)には、現在3,500万件/398億塩基のDNAデータが登録されており、年率2倍のペースで登録件数が増加している。利用者数は1日1万人を越えており、利用者側・運営側ともにデータベース検索の高速化へのニーズが強い。

 共同研究の狙いは、Shunsakuを利用することにより、大規模なデータ量、大量の検索要求に対しても世界最高速のレスポンスを実現することで、ひいては健康・医療ユビキタス社会の到来をいっそう加速することにつながるという。つまり、個体−器官−組織−細胞−分子レベルに分かれた現在の研究を円滑に推進させるとともに、医療の最前線で各疾患をキーとした最新研究成果に基づくテーラーメード医療の実施、新薬開発期間の画期的な短縮などの効果がもたらされるとしている。

 なお、プロトタイプシステムについては、年内にDDBJを通じて全世界へ向けて一般公開される予定。