【日本】日本語の意味を理解するコンピュータが実現へ

日本の株式会社ワークスアプリケーションズは、自然言語処理の重要な資源の一つである単語ベクトルにおいて、大学共同利用機関法人 人間文化研究機構 国立国語研究所と、共同研究協定を締結した。単位ベクトルとは、単語の特徴を数値化したものであり、コンピュータが単語の類似性・関連性を捉えるために必要なものだ。

シリーズ
Sudachi

株式会社ワークスアプリケーションズと国立国語研究所が実施する共同研究では、100億語規模の日本語データベース “国語研日本語ウェブコーパス” と、形態素解析器 “Sudachi” を用いて、より実用的な単語ベクトルを構築する。単語ベクトルを活用することで、高精度な検索や翻訳、自動会話の実現、さらには日本語教育への応用発展などが考えられる。

また、本研究に利用される “Sudachi” は、既存の形態素解析器に不足していた、柔軟性や精度を兼ね備えたオープンソースの形態素解析器だ。“Sudachi” は既に、画像に記載された文字列の読み取りや、チャットボットなど、様々な解析における基礎的な処理に活用されている。

そして、本研究で構築される単語ベクトルについても、無償で商用利用可能なオープンデータとして公開される予定だ。株式会社ワークスアプリケーションズは、大手企業向けERPパッケージソフト “HUE” 及び、“COMPANY” の開発・販売を行っている企業。

【企業サイト】株式会社ワークスアプリケーションズ

広告 

PAGE TOP