R言語とは †
- オープンソース,フリーソフトウェアの,統計解析向けのプログラミング言語です.
- TETDM(Ver.3.50)では,これを利用した処理を呼び出して連携させ,平均,分散などの基本統計量の表示,相関行列の表示,相関ルールの表示を行うことができます.
- その他,TETDMの処理ツールを作成すれば,Rの任意のパッケージを利用することができます.
準備 †
- Rのインストール手順(準備1,準備2)については,以下のマニュアルを参考に準備してください.
準備1:Rのインストール †
- PCにRをインストールします。
- ソフトウェアのインストール後,以下のライブラリ(パッケージ)を追加でインストールしてください。
準備2:TETDMフォルダにR用ライブラリを追加 †
- 添付ファイル等の手順を参考に、以下をTETDMフォルダにおいてください。
- orgフォルダ : JRI.jarファイルを展開してできるフォルダ
- libjri.jnilib : MAC版のみ。インストールしたRと同じバージョン用のファイルである必要があります。
準備3:R利用ツールのTETDMツールフォルダへのコピー †
- Rを利用するツールのフォルダを、TETDMフォルダ内の、moduleフォルダ内の、MiningModules内においてください。
- 以下の処理ツールをダウンロード後,圧縮ファイルを展開してできるフォルダを,MiningModules内においてください。
- RApplication.zip (数値とテキストの両方を分析するツールをセットするためのツールです)
- DataMining.zip (数値データに対して統計処理を行います.現在,基本統計量,相関行列,相関ルールを実装しています)
- RDataminingTableprocessing.zip (統計処理の結果を表示するためのツールです) (2018/4/10更新)
- 準備1と準備2が終わっていない状態で,上記のフォルダをおくと、TETDMが起動しなかったり、ツールのセット時にエラーで操作不能になります。
テキストデータと数値データの入力 †
- 入力として与えるテキストファイルと,それに対応する数値データファイルを拡張子をcsvとして,同じフォルダ内に用意します.
- 例えば,テキストファイル urashima.txt に対して,数値データファイル urashima.csv を用意します.(TETDMのtextフォルダ内にも,サンプルを用意しています)
- csvファイルの形式は,以下の形式となっている必要があります.
- 一行目は,数値データの項目名が並ぶ
- 二行目以降は,各項目に対する数値データが,テキストデータのセグメント数(スナリバラフトの数+1)に一致する行数並んでいる.
- 一列目は,データの名称が入ることを想定しています.文字列も使用できます.計算処理の対象外となります.
- TETDMをjarファイルのダブルクリックではなく,ターミナル経由による下記いずれかの方法で起動する.
- Windowsであれば,TETDM.batファイルのダブルクリック
- Macであれば,TETDM.commandファイルのダブルクリック
- ターミナルからコマンド入力による起動
- ターミナルを経由しないと,設定したRのパスの情報が反映されないため
- コマンドラインで入力テキスト(urashima.txt)を与えて起動,またはTETDMの起動後にメニュー「ファイル」から入力テキスト(urashima.txt)を指定して与える.
- 処理ツール「数値データマイニング」をセットした時に,自動的に数値データ(urashima.csv)が読み込まれます.
- あるcsvファイルを読み込ませた後に、別のcsvファイルを読み込ませることはできません。異なるcsvファイルを読み込ませたい場合は、一度TETDMを終了させてください。
ツールのセット †
- TETDMの「モード」を拡張モードにします.
- 処理ツール「R連動アプリケーション」,可視化ツール「テキスト表示(HTML)」をパネルにセットします.
- 処理ツール「R連動アプリケーション」内のボタンを押してツールをセットします.