Total Environment for Text Data Mining †
テキストデータマイニングのための統合環境
5年以内に実現でき、我々の社会に役立つチャレンジ・テーマとして,人工知能学会全国大会で選抜された近未来チャレンジの課題です.
- 2014年度の人工知能学会全国大会の論文募集を公開致しました.NEW!!
- 2013年度の人工知能学会全国大会において,本チャレンジはサバイバルしました.
- 2012年度の人工知能学会全国大会において,本チャレンジはサバイバルしました.
- 2011年度の人工知能学会全国大会において,本チャレンジはサバイバルしました.
- 2010年度の人工知能学会全国大会において,本チャレンジが採択されました.
テトリーヌ by えむたこ
TETDMとは †
Total Environment for Text Data Mining (テキストデータマイニングのための統合環境)では,世の中に分散しているデータマイニングツールを画一的に扱え,分析に没入して新たな発想を得られる環境の構築を目指しています.
- 現在バージョン0.52(β最新版)(2013/8/9更新)を公開中です.NEW!!
- 現在バージョン0.51(β安定版)(2013/6/27更新 8/7修正)を公開中です.NEW!!
- 形態素解析器のインストールが不要です!
- ダウンロード件数の合計が1000件を突破しました!
- 統合環境をご利用,ならびに統合環境で動作するツールをご作成頂けます.
- 人工知能学会全国大会,ならびに人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会で活動しています.
本チャレンジの背景 †
- テキストマイニングのシステムやツールは,各研究者が独自に構築することが多く,ユーザが複数の技術を併用するためには,それらのシステムを各方面から個別に入手する必要がある
- ユーザが複数のシステムやツール間で,データの受け渡しや結果の比較を行うためには,手作業でフォーマットを整えたり,新たなインタフェースを独力で構築する必要がある
- 研究者が作成するシステムやツールは,論文用の試験的なシステムとなることが多く,実際に世の中で使われるのはごく一部の技術のみとなっている
本チャレンジの目的 †
多様なテキストマイニング技術を柔軟に組み合わせることができ、それらを連動させて使える環境の構築と提供
- チャレンジ1:幅広い利用者と開発者の参入
100万人以上の利用者,1000以上のモジュール化されたツールを集められる環境とする
- チャレンジ2:モジュール間での相互インタラクションの実現
異なるモジュール間で対応するデータが明示され,互いに別のモジュールを操作可能にする
- チャレンジ3:知識創発のための基盤環境の構築
頻度が低くても価値の高いデータ,パターンや知識を発見できる環境を構築する
本チャレンジの意義 †
- 複数の技術を用いたいユーザの環境が整えられるため,ユーザはニーズに応じたツールを選択でき,分析作業に集中することができる
- 試験的なものを含む多くのシステムやツールが集められるため,多くの技術の実用化や再利用が見込まれる
- 各研究者が研究成果として作成するツールを一つの統合環境内のモジュールとして配付することを意識できるため,研究の高いモチベーションの維持につながる
- 関連技術を容易に収集することができるため,開発技術と関連技術との比較検討や機能拡張が容易になる
本チャレンジの計画 †
- 1年目(2010年度):統合環境の仕様の策定
- 2年目(2011年度):モジュール(環境内で動作するツール)の基本仕様の策定
- 3年目(2012年度):モジュール間インタラクションの仕様の策定、ダウンロードサイトの立ち上げ
- 4年目(2013年度):モジュール開発者支援
- 5年目(2014年度):知識創発に向けた利用者支援
2014年度人工知能学会全国大会論文募集 †
2014年度人工知能学会全国大会(第28回)におきまして,本チャレンジのセッションがございます.
本チャレンジの存続に関わりますため,皆様方の発表,ならびにご聴講を,何卒よろしくお願い申し上げます.
2014年度全国大会のホームページ
<日時> †
2014年に行われます,人工知能学会全国大会(2014年5月12日(月)から5月15日(木))の中で,本チャレンジのセッションが開催されます
<募集テーマ> †
- 下記に,テーマ例を挙げておりますが,「テキストマイニング」「データマイニング」や「可視化インタフェース」に,
広い意味で関連する,ソフトウェア,分析・応用事例,話題であれば,何でも構いません.
- 統合環境の仕様策定に際しまして,積極的に組み入れることを検討すべきツール,使用が想定される場面,必要な機能などにつきまして,
皆様方から,幅広いご意見を頂きたいと考えております.
- テキストマイニング技術の研究・開発
- テキストマイニング技術を用いたデータ分析環境・データ分析事例
- 複数のテキストマイニング技術を組合せたシステムの研究・開発・応用事例
- データ視覚化・可視化技術の研究・開発
- データ視覚化・可視化技術を用いたデータ分析環境・データ分析事例
- 単純で直感的な操作を実現するインタフェースの研究・開発事例
- テキストマイニングのツール開発支援
- テキストマイニングのスキル獲得支援
- テキストマイニングによる知識創発支援
関連する研究トピック例 †
- 情報アクセスに基づくテキスト処理
- サイト内ウェブページの分析
- 電子掲示板の要約
- twitterのつぶやきの分析
- 単語,文,段落,テキスト情報の視覚化・可視化
- 単語,文,段落,テキスト間の関係の視覚化・可視化
- 単語,文,段落,テキスト間の関係の(時系列)変化の視覚化・可視化
- データ視覚化・可視化技術
- 単純・直感的操作を可能にするインタフェース技術
- 複数テキスト処理
- テキスト分類
- テキストクラスタリング
- 複数テキスト要約
- テキスト間の相対的評価(ex.独自性,具体抽象)
- 情報視覚化・可視化・インタフェース
- 単一テキスト処理
- キーワード抽出
- トピック抽出
- テキスト自動要約(指示的要約,報知的要約)
- テキスト分割
- 品詞タグづけ
- 係り受け解析
- テキストの絶対的評価(ex.レポート採点,ポジティブ/ネガティブ,情報の信頼性)
- テキストからの情報抽出(ex.専門用語,体験談,意見)
- ツール開発支援
- 既存ツールとの組合せによるツール開発
- 開発意欲を与えるツール開発環境
- スキル獲得支援
- 系統的な経験の積み重ねによるスキル獲得
- 操作意欲を与えるツールによるスキル獲得
- 知識創発支援
- データ間の相違の提示と解釈による知識創発
- データやツールの組合せの柔軟さに基づく創造意欲の付与
<発表申し込み> †
- (「【JSAI2014】近未来チャレンジセッションのお申し込み」→「NFC (サバイバル)Total Environment for Text Data Mining」)
- 発表申し込み期間:2013年12月17日(火)から12月27日(金) 14:00
- 論文原稿提出期間:2014年3月5日(水)から3月11日(火) 14:00 (A4 2段組み 2ページから4ページ)
- 2014年度の大会では,登壇者としての発表は大会全体で1件のみとなります.ご注意ください.
コアメンバー †
- 砂山渡(広島市立大学 大学院情報科学研究科)
- 高間康史(首都大学東京 システムデザイン学部)
- 西原陽子(立命館大学 情報理工学部)
- 徳永秀和(香川高等専門学校)
- 串間宗夫(宮崎大学 医学部附属病院医療情報部)
- 阿部秀尚(文教大学 情報学部)
- 梶並知記(神奈川工科大学 情報学部)
- 松下光範(関西大学 総合情報学部)
- Danushka Bollegala(ダヌシカ ボレガラ)(東京大学 大学院情報理工学系研究科)
- 佐賀亮介(大阪府立大学 大学院工学研究科)
- 河原吉伸(大阪大学 産業科学研究所)
- 川本佳代(広島市立大学 大学院情報科学研究科)
新メンバー募集中 †
本チャレンジのメンバーを随時募集しております.
未来のデファクトスタンダード(世の中の標準)環境の開発を目指しませんか?
- 環境や環境内で動作するモジュールの構築に関わって頂ける方
- 本環境を用いて,その使い勝手などのご意見をいただける方
- 本環境内で動作するモジュールについて,使用目的に応じたモジュールの組合せ提案,モジュールごとの意見交換支援やコミュニティ支援の方法の提案や実装に関わっていただける方
いずれかにご興味を持たれました方は,本ページ末尾のお問い合わせ先までお気軽にご相談ください.
TETDMに関するお知らせとお問い合わせ †
お知らせ †
お問い合わせ先 †
- ご意見,お問い合わせは,砂山渡(広島市立大学)sunayama[at]hiroshima-cu.ac.jp までお願い致します.
- 2013年7月9日 10000アクセスを突破しました!!
総アクセス数:170124
今日:16
オンライン:14