TETDMセッションの様子 †
2013年6月6日に富山市で開催された JSAI2013 における、TETDMのサバイバルセッションの様子を報告します。当日は9件の発表があり、2名の評者、40名以上の聴講者を交えて、活発な議論が繰り広げられました。
各発表の様子 †
- 一部,表現や内容が適切となるように修正を行っています.
統合環境TETDMを用いたテキストマイニング初心者のためのツール選択支援 †
(発表者:広島市大 中垣内 李菜さん) †
- Q. タスク達成の為の手段が単一だと,複数のパネルにまとめてツールをセットできるツール選択パネルの効果が出ないのはなぜか?
- A. タスクが明確な場合,ツールの選択に試行錯誤の余地が少ないからと考えられる。
- コメント: 提案するツール選択パネルの効果が出やすいタスクを明確にするとよい。
- Q. 円状のツール配置や,処理ツールと可視化ツールを同時に表示するなど,今回のインタフェースを選択された理由は?
- A. 組み合わせ可能なツール間にリンクを表示するための配置とした。組み合わせ可能なツールの表示があった方が,ツールを選択しやすくなると考えた。
TETDMモジュール構成に基づくテキストマイニングメソッドの概念化に関する一考察 †
(文教大学 阿部 秀尚さん) †
- Q. 入出力に用いられる int[]などのデータ型と,そのデータが表す意味をつなぐ概念が必要なのではないか?
- A. 希望する出力から,使用するデータ型を提案できるような切り分けは必要と考えている。
- コメント: テキストマイニングで出てくる用語に対してデータ型からの位置づけが必要ではないか。入出力だけでなく,処理の内容からの分類もできるのではないか。
- A. 統合環境では複数のパネルを横に並べることができるので、その対応を今後検討したい。
ユーザの観点に基づく電子掲示板からのコミュニケーション抽出 †
(広島市大 里中 晴日さん) †
- Q. レス数ベースの要約率はどのくらいか?
- A. 入力したキーワードによるが,今回に実験に用いたスレッドの主題との関係が明確なキーワードの場合,2,3割程度となる。
- Q. TETDM上に実装したことによるメリットは?
- A. 実験の際に,比較システムとインタフェースを共通化しやすかった。また,今後のスレッドの選択支援などに向け,システムの拡張がしやすくなると考えた。
トップダウン・ボトムアップな文章構造作成のための推敲支援システム †
(広島市大 山手 砂都美さん) †
- Q. 段落間の条件付き確率とは何の確率?
- A. 段落Aから段落Bへの条件付き確率の場合,段落Aが含むすべての単語を段落Bが含んでいれば1となるため,段落Aの内容を段落Bが引き継いでいる確率を表している。
- Q. システムが出力する木構造と,人間が考える係り受け構造との相関は?
- A. 本研究では,係り受け構造を正確に表現することではなく,単語の使われ方によって関係が強い段落間の関係を明示することを目的としている。
その上で,筆者が考える係り受け構造とは異なる構造が表示がされている場合,単語の使われ方によって読者が段落間のつながりを誤解する可能性があることを踏まえて,筆者が文章の修正を行う。
TETDMを利用した情報系専門教育の実践例 †
(神奈川工科大 梶並 知記さん) †
- Q. TETDMを使ったマイニングの学習において,どこまで学生に行わせるべきか?
- A. マイニングの学習の際に,可視化ツールの実装まで学生に行わせることは大変かもしれないので,処理ツールのみを作成させるのが良いと考えている。
- Q. 複数モジュールの組み合わせによる発想を促せるのがよいのでは?
- A. 既存ツールの内容や動作を参考に,発想を得て改造を進められる点が良いと考えている。
テキストデータマイニング統合環境を利用した看護記録からの専門用語辞書作成支援ツールの提案 †
(首都大 高間 康史さん) †
- Q. 複数のドメインが混ざったものでも,使用可能か?
- A. 可能です.他のドメインであっても,その担当者を連れてくれば可能です.現時点では,フォーマットにあわせた処理を組み込んでいますが,それを無くして汎用的にすれば,複数ドメインでも実行可能です.
- Q. 計算時間はどの様になっているか?
- A. まだ,大規模なデータでの実行を行っていないので分かりません.
- コメント: 接続頻度,キャッシュを見れば分かる可能性がある.
Rによるテキストマイニング用TETDMモジュール開発 †
(香川高専 徳永 秀和さん) †
- Q. Rの各モジュールによる統計関数は,戻り値がバラバラである.枠組みとして,先にRのクラスタ分析を読み込む処理が必要があるのではないか.先に,関数を作る事が必要ではないか.
- A. 関数ごとにメソッドを作る事が最初の段階だと考えている.Rのリストデータがあるので,それに手を加えてテキストマイニング用に整理できたらと考えている.TETDMを作る者が,テキストマイニングに適したデータを提案する必要もあると考えられる.
- Q. TETDMのインタフェースで樹形図はあるのか? クラスタリングできるようなのがあればいいのではないか?
- A. 公開はしていないがある.新しく作ることも可能.
FACT-GraphとTETDMの融合の可能性 †
(大阪府大 佐賀 亮介さん) †
- Q. TETDMは可視化,FACTグラフは可視化という印象を受けました.クリスマスの例ですが,南半球の人は夏がクリスマスで北半球の人は逆ですが,両方の人たちの文章を読み込んでしまうと傾向がなくなってしまうのではないかなと思ったのですが? TETDMで比較すると分かりやすいというアイデアはあり得るのでしょうか?
- A. 南半球と北半球では情報源が異なると考える事ができます.一つの事象を表すのに,情報源ごとに書き方が異なると考えられます.その事を踏まえて,ユーザが切り替えを行える様な表現方法を次の研究テーマとしています.また,TETDMに組み合わせる事で,うまくいくのではないかとも考えています.
- コメント:2次元におさめるのではなくて,TETDMと併用して複数グラフにできるのではないか.新しい次元はどうするのかという疑問があります.いろんなパラメータをいじるということに,インタラクティブにみせる可能性を感じる.実現できたら,可視化モジュール,処理モジュールとの関係が見えてくる気がしました.
- Q. 1次元だとまだ何とかなっているが,複雑なものになると,どの次元でも次元を落とすとなかなか表現できないのではないか?
- A. 周期的なもの,バーストするもの,成長するもの,時間変化をある程度パターン化してリンクにマークをつけるとか,何らかの形でマッピングをして表現を考えている.
テキストデータマイニングのための統合環境TETDMの活用と実践 †
(広島市大 砂山 渡さん) †
- Q. ライセンスはどうなっていますか?商業利用は可能ですか?
- A. ライセンスに関しては,金儲けではなければ,無料利用できます.お金儲けに利用する場合は今後検討が必要です.
- Q. 教育向けコンテキストの印象を受けました.研究用にデータの数値が見れる,セントラリティ,経済分析に使われる様な改良が必要では?
- A. TETDMはさまざまなツールが動作する枠組みを提供するもので,ツール自体はユーザや.ユーザに依頼を受けた開発者が用意する必要がある.
- Q. 今後1年の目標や方針は?
- A. 最終目標は,モジュールの開発者支援と知識創発に向けた利用者支援です.特に創発に向けては,より柔軟なモジュールの組合せを可能にすることと,絞り込んだ複数データ間の比較を行えるようにすることを計画しています.