第4章 TETDMによるデータ分析

&ref(): File not found: "4-1TextInfoApplicaiton.png" at page "データ分析本のカラーの図(4章)";
図 4.1 テキスト評価アプリケーション
4-2hindo.png
図 4.2 処理ツール「単語情報まとめ」による単語の頻度情報
4-3keshiki.png
図 4.3 処理ツール「フォーカスまとめ」を用いた単語「景色」を含むテキストのハイライト(画面下部の「複数行表示」ボタンを押したとき)
4-4set1.png
図 4.4 ツールセット「まとめとエディタ」の出力
4-5set2.png
図 4.5 ツールセット「単語情報」の出力
4-6set3.png
図 4.6 ツールセット「文・セグメント情報」の出力
4-7set4.png
図 4.7 ツールセット「文章要約」の出力
4-8set5.png
図 4.8 ツールセット「主題関連文」の出力
4-9set6.png
図 4.9 ツールセット「主題関連語」の出力 (川の拡大図は図 4.25 に示す)
4-10set7.png
図 4.10 ツールセット「主語なし文抽出」の出力
4-11MiningTools.png
図 4.11 TETDM の処理ツールの一覧(バージョン 4.30 時点,下線は可視化ツール)
4-12VisualizationTools.png
図 4.12 TETDM の可視化ツールの一覧(バージョン 4.30 時点)
4-13toolset1.png
図 4.13 ツール選択ウインドウ(通常モードでメニュー ウインドウの「名称」ボタンを押したとき)
4-14toolset2.png
図 4.14 ツール選択ウインドウ(拡張モードでパネル内の「名称」ボタンを押したとき)
4-15tfidfsample.png
図 4.15 TF-IDF による単語評価の例(五つの文書において TF-IDF による評価の高い単語は,それぞれ「運転」「駐車」「駐車」「購入」「運転」になる)
4-16tfidf.png
図 4.16 処理ツール「TFIDF」による浦島太郎の TF-IDF 値の計算例(文をセグメントに整形して計算している)
4-17commonfreq.png
図 4.17 五つの文書における単語の共起頻度の例 (「自動車」,「運転」の出現文書頻度は 4,「自動車」と「運転」の共起頻度は 3)
4-18wordcos.png
図 4.18 処理ツール「単語間関連度」の cos 類似度による「浦島太郎」の文章の単語配置(出現頻度 2 以上の単語。関連度が高い単語が近くに配置される)
4-19heatercluster.png
図 4.19 処理ツール「テキスト分類」による「ヒーター」のレビュー集合の分類
4-20graph.png
図 4.20 可視化ツール「折れ線グラフ」による表示例
4-21hyou.png
図 4.21 可視化ツール「表形式表示」による「浦島太郎」における単語の頻度情報の表示例
4-22network.png
図 4.22 可視化ツール「段落間ネットワーク(ばねモデル)」による「浦島太郎」における単語ネットワークの表示例
4-23urashimaonly.png
図 4.23 可視化ツール「テキスト表示(カラー)」による「浦島太郎」における「浦島」に関連する文のハイライト表示例
4-24fujisan.png
図 4.24 可視化ツール「キーワード表示(展望台)」による表示例
4-25kawakudari.png
図 4.25 可視化ツール「主題関連語表示(川下り)」による表示例

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS