Total Environment for Text Data Mining †
テキストデータマイニングのための統合環境
5年以内に実現でき、我々の社会に役立つチャレンジ・テーマとして,人工知能学会全国大会で選抜された近未来チャレンジの課題です.
2015年度の人工知能学会全国大会において,本チャレンジは卒業しました.NEW!! †
- これまで,本チャレンジを支えていただきましたみなさまには,厚くお礼申し上げます.
本チャレンジの背景 †
- テキストマイニングのシステムやツールは,各研究者が独自に構築することが多く,ユーザが複数の技術を併用するためには,それらのシステムを各方面から個別に入手する必要がある
- ユーザが複数のシステムやツール間で,データの受け渡しや結果の比較を行うためには,手作業でフォーマットを整えたり,新たなインタフェースを独力で構築する必要がある
- 研究者が作成するシステムやツールは,論文用の試験的なシステムとなることが多く,実際に世の中で使われるのはごく一部の技術のみとなっている
本チャレンジの目的 †
多様なテキストマイニング技術を柔軟に組み合わせることができ、それらを連動させて使える環境の構築と提供
- チャレンジ1:幅広い利用者と開発者の参入
100万人以上の利用者,1000以上のモジュール化されたツールを集められる環境とする
- チャレンジ2:モジュール間での相互インタラクションの実現
異なるモジュール間で対応するデータが明示され,互いに別のモジュールを操作可能にする
- チャレンジ3:知識創発のための基盤環境の構築
頻度が低くても価値の高いデータ,パターンや知識を発見できる環境を構築する
本チャレンジの意義 †
- 複数の技術を用いたいユーザの環境が整えられるため,ユーザはニーズに応じたツールを選択でき,分析作業に集中することができる
- 試験的なものを含む多くのシステムやツールが集められるため,多くの技術の実用化や再利用が見込まれる
- 各研究者が研究成果として作成するツールを一つの統合環境内のモジュールとして配付することを意識できるため,研究の高いモチベーションの維持につながる
- 関連技術を容易に収集することができるため,開発技術と関連技術との比較検討や機能拡張が容易になる
本チャレンジの計画 †
- 1年目(2010年度):統合環境の仕様の策定
- 2年目(2011年度):モジュール(環境内で動作するツール)の基本仕様の策定
- 3年目(2012年度):モジュール間インタラクションの仕様の策定、ダウンロードサイトの立ち上げ
- 4年目(2013年度):モジュール開発者支援
- 5年目(2014年度):知識創発に向けた利用者支援