NECが理研・ゲノム科学総合研究センターに大規模PCクラスター納入

232ノードのIA/Linuxサーバーで構成、BLASTを最適化

 2001.07.07−NECは、遺伝子解析研究用の大規模PCクラスターシステムを、理化学研究所横浜研究所のゲノム科学総合研究センター(GSC)に納入した。ホモロジー検索ツールの定番であるBLASTをチューニングし、大規模並列化による高速処理を実現したのが特徴。GSCと協力して今後さらに最適化を進めるほか、他のバイオ解析ツールの移植も行い、バイオインフォマティクス領域におけるクラスターシステムの適用範囲を広げていくことにしている。

 今回、NECがGSCに納入したのはLinuxを搭載したIA(インテルアーキテクチャー)サーバー「Express5800シリーズ」が116台(232プロセッサー)で構成されたシステム。具体的には、130プロセッサー構成(65台)と66プロセッサー構成(33台)、18プロセッサー構成(9台)、18プロセッサー構成(9台)の4系統のクラスターが連結されており、新情報処理開発機構(経済産業省のリアルワールドコンピューティングプロジェクトを推進している研究組合)が開発したクラスターソフト「SCore」を用いて構築した。

 アプリケーションとしては、ホモロジー検索ツール「BLAST」が中心になる。NECでは、メッセージパッシングインターフェース(MPI)を用いたプログラムの並列化手法を駆使して、BLASTが最大の性能を発揮できるようにチューニングを施した。とくに、DNA塩基配列の相同性を探る「Blastn」と、たん白質のアミノ酸配列を対象にした「PSIBlast」の両方を最適化することで、単なるハードウエアの販売だけではなく、バイオ研究支援ソリューションとして提供することができた。

 最近、バイオインフォマティクス分野では、パソコンクラスのIAサーバーを利用したクラスターシステムが注目を集めている。コストパフォーマンスが魅力だが、クラスターを構成するノード数が少なくとも数100と大きくなるため、システム全体の運用管理が難しく、アプリケーションの最適化も簡単ではないなどの問題がある。今回のシステムは、大規模クラスターを成功させた国内の導入事例としても興味深い。