処理ツール作成１のバックアップの現在との差分(No.1)

バックアップ一覧
差分を表示
ソースを表示
バックアップを表示
処理ツール作成１へ行く。
- 1 (2013-04-26 (金) 00:50:28)
- 2 (2013-04-26 (金) 01:13:18)
- 3 (2014-04-21 (月) 18:54:04)
- 4 (2015-11-29 (日) 23:23:23)
- 5 (2017-06-08 (木) 13:23:19)
追加された行はこの色です。
削除された行はこの色です。
*チュートリアルで試せる内容 [#l6c213f1]

-[[マイニング処理モジュールの作り方(簡易版)]]
-[[マイニング処理ツールの作り方(簡易版)]]


*1)作成する処理モジュールの仕様を決めます [#t14a8681]
-[モジュール名] NounTop10（名詞TOP10）
*1)作成する処理ツールの仕様を決めます [#t14a8681]
-[ツール名] NounTop10（名詞TOP10）
-[入力] テキスト情報
-[処理] テキストに含まれる，名詞を頻度が高い順に10個抽出する
-[出力] 抽出した名詞をつなげたテキスト（ -> 可視化モジュールTextDisplayを利用して表示）
-[処理] テキストに含まれる名詞を，頻度が高い順に10個抽出する
-[出力] 抽出した名詞をつなげたテキスト（ -> 可視化ツールTextDisplayを利用して表示）

*2)雛形のSample1.java を利用して，モジュール作成の準備をします [#t86714a8]
*2)雛形のSample1.java を利用して，ツール作成の準備をします [#t86714a8]
-tetdmのフォルダ内の，moduleフォルダ内のMiningModuleフォルダ内にある，Sample1フォルダを，フォルダごとコピーします
-コピーしてできたフォルダの名前を，作成するモジュール名「NounTop10」に変更します
-コピーしてできたフォルダの名前を，作成するツール名「NounTop10」に変更します
-コピーして作成したフォルダ内のファイル名を変更します
--Sample1.java -> NounTop10.java
--Sample1.txt -> NounTop10.txt (テキストファイルの中身も「名詞TOP10」に変更します)
--必要に応じて，モジュール完成後にREADME.txtを修正します
--必要に応じて，ツール完成後にREADME.txtを修正します

*3)NounTop10.java を編集し，プログラム作成の準備をします [#dd99a11d]
-プログラム中の Sample1 と書かれている箇所をすべて NounTop10 に変更します（コメント内を含め5カ所）
---// NounTop10.java Version 0.30
---package module.MiningModules.NounTop10;
---public class NounTop10 extends MiningModule
---public NounTop10()
---System.out.println("writing ERROR in NounTop10");

**コンストラクタの記述の修正 [#c0008a68]

-モジュールのIDを決め，コンストラクタ内のメソッド setModuleID の引数として与えます
-配列 pairingVisualizationID を初期化して，ペアとなる可視化インタフェースモジュールのIDを指定します．
-ツールのIDを決め，コンストラクタ内のメソッド setModuleID の引数として与えます
-配列 pairingVisualizationID を初期化して，ペアとなる可視化インタフェースツールのIDを指定します．
---TextDisplay のIDの 1 を指定します．（今回はそのまま）[[可視化インタフェースツール一覧]]
---setToolType(2); [[ツールタイプ]]はプリミティブになります．（今回はそのまま）

	public NounTop10()
	{
		setModuleID(9911);	// Set your module ID after you have got it
		pairingVisualizationID = new int[1];
		pairingVisualizationID[0] = 1;	
		pairingVisualizationID = new int[]{1};
		setToolType(2);
	}

*4)一度コンパイルして，NounTop10モジュールの動作を確認します [#m7218747]
*4)一度コンパイルして，NounTop10ツールの動作を確認します [#m7218747]
-make または ant コマンドでコンパイルします
-コンパイル後TETDMプログラムを起動して，いずれかのテキストを読み込みます
-パネル上部の処理ツールを選ぶメニューの中から「名詞TOP10」を選択します
--（「名詞TOP10」が表示されない場合，右下の''環境設定''の「ツール設定」ボタンを押し，ピンクの処理ツール一覧に「名詞TOP10」があることを確認し，チェックボタンをチェックして，「チェックしたツールをメニューに追加」ボタンを押した後，「設定終了」ボタンを押して戻ると，メニューに現れます）
-パネル上部の「ツール選択」ボタンを押した後，左側の「名詞TOP10(Pr)」をダブルクリックして選択します
-入力テキストが，単語間にスペースが入った状態で表示されていることを確認します（Sample1.java の処理）

*5)プログラムの作成に使える入力情報を確認します [#z355228c]
-テキスト情報は，TextData型の変数 text に予め格納されているので，その中の単語情報に関するメンバー変数を確認します
-[[テキストデータ>http://www.sys.info.hiroshima-cu.ac.jp/people/sunayama/future/textdata.html]]
-[[テキストデータ]]
---KeywordData keyword[];
---int keywordNumber;
---String word; (KeywordDataクラス内)
---int frequency; (KeywordDataクラス内)
---int partOfSpeech;  (KeywordDataクラス内．値が1なら名詞)

*6)名詞の頻度上位10個を求めるプログラムを作成します [#md2ea89d]

-miningOperations メソッドの case 0: が自動的に実行されますので，そこから呼び出されるところに記述します．
-ソートには，source/Utilityフォルダ内のQsort.javaを利用することができます（// import source.Utility.*; のコメントアウトを外して利用します）

**String MyMethod()内に作成する場合 [#kb0acee7]

	String MyMethod()
	{	
		int nounID[] = new int[text.keywordNumber];
		int frequency[] = new int[text.keywordNumber];
		int count;
		
		count = 0;
		for(int i=0;i<text.keywordNumber;i++)
			if(text.keyword[i].partOfSpeech == 1)
			{
				frequency[i] = text.keyword[i].frequency;
				count++;
			}
			else
				frequency[i] = 0;
		
		Qsort.initializeIndex(nounID, text.keywordNumber);
		Qsort.quicksort(frequency, nounID, text.keywordNumber);
		
		StringWriter sw = new StringWriter();			//For words
		BufferedWriter bw = new BufferedWriter(sw);			
		
		try{
			for(int i=0;i<10 && i<count;i++)
				bw.write(text.keyword[nounID[i]].word+" ");
			
			bw.flush();
		}
		catch(Exception e){
			System.out.println("writing ERROR in NounTop10");
		}					
		return sw.toString();	
	}	


*7)出力を可視化モジュールに渡します [#fcc7ddc3]
-可視化モジュール TextDisplay がsetDataメソッドによって受け取ることができるデータを，README.txtファイルや，ソースプログラムを見て確認します
-TextDisplay は，String型（dataIDは任意）のデータを受け取って表示します
---setDataString(0,MyMethod());
*7)出力を可視化ツールに渡します [#fcc7ddc3]
-可視化ツール TextDisplay がsetDataメソッドによって受け取ることができるデータ型とデータ数を，README.txtファイルや，ソースプログラム（コンストラクタ内のdataNumbers[]）を見て確認します
-TextDisplay は，String型のデータを1つ(dataIDが0のデータのみ)受け取って表示します
---setDataString(MyMethod());
-可視化ツールにデータを渡す際に，下記のメソッドにより，dataIDを0に初期化できます．
---resetData();
---dataIDの値は，各データ型ごとに，setData***()メソッドを呼び出すごとに，1ずつ増加していきますので，データを送りなおす場合などに，このメソッドを呼び出す必要があります．

*8)コンパイルして動作を確認します [#uca07866]
-浦島太郎であれば「浦島 リュウグウ 乙姫 太郎 景色 子供 背中 不思議 綺麗 春の 」と出力されます
-出力結果は，処理ツール「マイニングなし」可視化ツール「表」を組合せた出力からも確認できます
-浦島太郎であれば「浦島 亀 リュウグウ 乙姫 太郎 景色 子供 背中 不思議 綺麗」と出力されます
-単語の頻度情報は，処理ツール「単語情報まとめ」可視化ツール「表形式表示」を組合せた出力からも確認できます
処理ツール作成１ のバックアップの現在との差分(No.1)

処理ツール作成１のバックアップの現在との差分(No.1)