2015年夏CCS特集:科学技術振興機構

日化辞ハブにDB統合、ウェブに適合した標準採用

 2015.06.25−科学技術振興機構(JST)は、バイオサイエンスデータベースセンター(NBDC)のデータベース統合推進事業の一環として、国内最大の化合物データベースである「日本化学物質辞書」(日化辞)をハブに、ライフサイエンス系データベースの化学物質情報を統合するための基盤整備を進めている。日米欧のデータベースがリンクし合って、研究者の利便性を高めることにつながる動きであるため、計画の前途が注目されている。

 JSTでは、「日化辞Web」として有機低分子化合物を中心に約340万件のデータを無償公開している。今回、NBDCは日化辞のデータをインターネットに適合したデータ記述モデルである“RDF”を使ってリンクトデータに変換。欧州のChEMBLや米国のPubChemと共通の基盤技術を用いてデータをオープン化しているため、将来的には日米欧に分散したリンクトデータを、あたかも同じデータベース内にあるかのように検索することなどが可能になる。

 NBDCの当面の目的は、国内で整備中の各種ライフサイエンス系データベースを横断的に利用できるようにする仕組みとして、日化辞の化学物質情報をキーにしてそれらデータベース内の項目を相互に連結・統合化すること。このための「日化辞RDFデータ」は、科学技術情報を一元的に検索・提供する新サービス「J-GLOBALナレッジ」の第1弾として5月末から公開されている。

 データのライセンスは、オープンなクリエイティブ・コモンズ・ライセンス(CCライセンス)で、改変や営利目的を含む二次利用も自由。 J-GLOBALのアカウントを作成すれば、だれでも無償で一括ダウンロードすることができる。RDF用の問い合わせ言語であるSPARQLを使用することが可能で、APIを利用すれば自作のアプリケーションに組み込んだりすることも簡単に行える。


ニュースファイルのトップに戻る