R言語とは

  • オープンソース,フリーソフトウェアの,統計解析向けのプログラミング言語です.
  • TETDM(Ver.3.50)では,これを利用した処理を呼び出して連携させ,平均,分散などの基本統計量の表示,相関行列の表示,相関ルールの表示を行うことができます.
    • その他,TETDMの処理ツールを作成すれば,Rの任意のパッケージを利用することができます.

準備

  • Rのインストール手順(準備1,準備2)については,以下のマニュアルを参考に準備してください.
    • fileWINDOWS用Rインストール.pdf
      • (注)環境によっては、4.のrJavaの環境設定で、jriフォルダや64bitOSでも32bit用のフォルダにパスを通す必要があるようです。
    • fileMAC用Rインストール.pdf
      • MAC版でバージョン3.4.4のRはインストールが難しくなります.バージョン3.4.0のRを利用してください。

準備1:Rのインストール

  • PCにRをインストールします。
    • ソフトウェアのインストール後,以下のライブラリ(パッケージ)を追加でインストールしてください。
      • rJava
      • arules

準備2:TETDMフォルダにR用ライブラリを追加

  • 添付ファイル等の手順を参考に、以下をTETDMフォルダにおいてください。
    • orgフォルダ : JRI.jarファイルを展開してできるフォルダ
    • libjri.jnilib : MAC版のみ。インストールしたRと同じバージョン用のファイルである必要があります。

準備3:R利用ツールのTETDMツールフォルダへのコピー

  • Rを利用するツールのフォルダを、TETDMフォルダ内の、moduleフォルダ内の、MiningModules内においてください。
    • 以下の処理ツールをダウンロード後,圧縮ファイルを展開してできるフォルダを,MiningModules内においてください。
    • fileRApplication.zip (数値とテキストの両方を分析するツールをセットするためのツールです)
    • fileDataMining.zip (数値データに対して統計処理を行います.現在,基本統計量相関行列相関ルールを実装しています)
    • fileRDataminingTableprocessing.zip (統計処理の結果を表示するためのツールです) (2018/4/10更新)
      • 準備1と準備2が終わっていない状態で,上記のフォルダをおくと、TETDMが起動しなかったり、ツールのセット時にエラーで操作不能になります。

テキストデータと数値データの入力

  1. 入力として与えるテキストファイルと,それに対応する数値データファイルを拡張子をcsvとして,同じフォルダ内に用意します.
    • 例えば,テキストファイル urashima.txt に対して,数値データファイル urashima.csv を用意します.(TETDMのtextフォルダ内にも,サンプルを用意しています)
      • fileurashima.txt:4段落構成(スナリバラフトは3つ)
      • fileurashima.csv:5行のcsvファイル(1行の項目名と4行の各段落に対応する数値データ)
    • csvファイルの形式は,以下の形式となっている必要があります.
      • 一行目は,数値データの項目名が並ぶ
      • 二行目以降は,各項目に対する数値データが,テキストデータのセグメント数(スナリバラフトの数+1)に一致する行数並んでいる.
      • 一列目は,データの名称が入ることを想定しています.文字列も使用できます.計算処理の対象外となります.
  2. TETDMをjarファイルのダブルクリックではなく,ターミナル経由による下記いずれかの方法で起動する.
    • Windowsであれば,TETDM.batファイルのダブルクリック
    • Macであれば,TETDM.commandファイルのダブルクリック
    • ターミナルからコマンド入力による起動
      • ターミナルを経由しないと,設定したRのパスの情報が反映されないため
  3. コマンドラインで入力テキスト(urashima.txt)を与えて起動,またはTETDMの起動後にメニュー「ファイル」から入力テキスト(urashima.txt)を指定して与える.
  4. 処理ツール「数値データマイニング」をセットした時に,自動的に数値データ(urashima.csv)が読み込まれます.
    • あるcsvファイルを読み込ませた後に、別のcsvファイルを読み込ませることはできません。異なるcsvファイルを読み込ませたい場合は、一度TETDMを終了させてください。

ツールのセット

  1. TETDMの「モード」を拡張モードにします.
  2. 処理ツール「R連動アプリケーション」,可視化ツール「テキスト表示(HTML)」をパネルにセットします.
  3. 処理ツール「R連動アプリケーション」内のボタンを押してツールをセットします.

添付ファイル: fileRDataminingTableprocessing.zip 22件 [詳細] fileWINDOWS用Rインストール.pdf 170件 [詳細] fileDataMining.zip 45件 [詳細] fileurashima.csv 49件 [詳細] fileurashima.txt 47件 [詳細] fileMAC用Rインストール.pdf 237件 [詳細] fileRApplication.zip 52件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2018-04-10 (火) 20:44:51 (102d)