東北化学薬品・生命システム情報研究所がバイオ文献マイニング事業に進出

日本IBMのMedTAKMIを導入、全国規模で6月からサービス開始

 2005.03.31−東北化学薬品(本社・青森県弘前市、東康夫社長)の生命システム情報研究所(岩手県盛岡市)は、日本IBMが開発したバイオインフォマティクス専用テキストマイニングツール「MedTAKMI」を導入し、遺伝子に関する情報を約100万件の学術文献の中から調べるテキストマイニングサービスを6月から新たに開始する。すでに提供中のDNAチップ/マイクロアレイを利用した遺伝子発現解析およびデータマイニングサービスを補完する位置づけのもので、発現した遺伝子群の機能や関係などを掘り起こし、知識を深めることができる。今回の事業に関しては、東北地方の枠を越え、全国展開で事業を推進していく。

 同社は、2003年7月に生命システム情報研究所を設立し、化学工業薬品と臨床検査試薬に次ぐ第3の柱とするべく、バイオ関連事業に乗り出した。この研究所はいわゆる完全なドライラボで、バイオインフォマティクス技術を駆使した解析サービスを特徴としている。

 現在、主に提供しているのは、DNAチップ/マイクロアレイを用いた遺伝子発現解析サービス。実験で得られたデータをさまざまな統計的手法を用いてノーマライズし、生物学的に意味のある変動遺伝子を抽出する。また、生物学的パスウェイに照らし合わせて、抽出した遺伝子をその機能から検証することも可能。

 マイクロアレイ解析の結果として、発現遺伝子群のリストが得られるわけだが、それだけではあまり意味がない。他の遺伝子との関係やたん白質との相互作用、特定の疾病や創薬ターゲットとの関係など、文献調査によって対象の遺伝子に関する幅広い情報を集めてくる必要がある。

 今回の新サービスは、この作業を代行するもので、顧客から遺伝子のリストを提供してもらい、膨大な学術文献の中からテキストマイニングを行う。このため、日本IBMのMedTAKMIを導入した。MEDLINEに収録されている文献の中から過去10年分/100万件の情報をインデックス化して収めており、遺伝子間の直接関係(遺伝子AとBの間が動詞でつながっている)、間接関係(AとBの直接関係を持つ文献およびBとCの直接関係を持つ文献の存在からAとCの関係を想定する)、共起関係(同一文献内にAとBの両方が出現する)を精度良く抽出することが可能。

 特定キーワードを含む文献がいくつあるかをランキング表示できる内容分析機能や、どの疾病とどのたん白質の関係が深いかを浮き彫りにする二次元マップ機能、あるテーマについての文献が時系列的にどのように変化してきているかを調べる時系列分析機能、過去のいつごろにどのような特許が申請されたかなどを知るためのトピック抽出機能など、バイオ文献マイニングに必要な基本分析機能が標準装備されている。

 バイオ向けのテキストマイニングツールはいくつかの製品があるが、それを用いてサービス事業を行うという前提では、MedTAKMIのライセンス条件が最も有利だったということだ。同社は、MedTAKMIの国内で5番目のユーザーに当たるが、MedTAKMIによる文献マイニングをサービスとして提供できるのはいまのところ同社だけということになる。

 化学工業薬品販売などの同社の主力事業は東北地方を中心にしたものだが、遺伝子発現解析事業では関東、中部・東海、関西方面でも受注実績があり、今回のテキストマイニングも全国展開を積極的に進めていく。