2021年冬CCS特集:化学情報協会

科学技術用語辞書を提供、AI応用で活用シーン拡大

 2021.12.01−化学情報協会は、化学・ライフサイエンスを中心にした科学技術用語のシソーラス付き日英/英日辞書「JAICIサイエンスディクショナリー」(JSD)を使った新サービスを今年からスタートさせた。人工知能(AI)の活用がブームになる中で、テキストからの知識の抽出に信頼性の高い辞書を使いたいというニーズが高まったため。ほかにはこのような辞書がないことから、問い合わせが急増しているということだ。

 JSDは、約85万語を収載した専門用語辞書で、国内外の論文や特許文書から用語を集めているため、学名が充実しており、二命名法に沿った表記や階級名に沿った生物分類が多く収載されている。とくに、専門用語をその意味に応じて階層的に整理したシソーラスを英語の対訳とひも付けており、「上位語(より広い概念を持つ語)」「下位語(より狭い概念を持つ語)」「同義語」「関連語」などを簡単に調べることができる。

 今年10月から提供開始した有償版の「JSD Pro」は中国語の同義語辞書を搭載。利用者から要望が多かった機能で、中国語で表記された化合物名などを和訳と英訳で的確にチェックできる。例えば、中国特許を全文検索した場合、英語の化合物名では1万件しかヒットしなかったのが、中国語名で検索すると17万件もヒットしたケースがあったという。調査の網羅性が格段に向上する。日本語や英語の文書を検索する場合でも、シソーラスを活用して同義語をフォローすれば、網羅性は大きく変わってくるという。

 とりわけ、最近の問い合わせで目立つのが、AI利用と関連させたニーズ。まず、社内文書をAI学習用の教師データにしたいが、文書が用語統制されていないため、うまく検索・抽出できない場合だ。これは、検索語の同義語を利用すれば解決する。また、日本語の揺らぎ(促音、撥音、拗音、長音等)に対応して、検索精度を高めたいという場合にも有効。さらに、日本語と英語文書の双方をAIツールで解析したい場合でも、どちらかの言語を機械翻訳して専門用語を統一しておけば、解析は容易になる。

 具体的なサービスとしては、ウェブブラウザーで利用できる「JSD Pro」と、社内システムに組み込んで呼び出せる「JSD Web API」(中国語同義語は現時点で非対応)の2種類がある。AI分析と自動的に連携させる目的にはAPIが適しているだろう。そのほか、化学情報協会には、機械翻訳サービス「JAICI AutoTrans」や「JAICI ProTranslator」もあり、これらと組み合わせることも有効である。


ニュースファイルのトップに戻る