処理モジュール作成１改(バージョン0.43まで) のバックアップ差分(No.1)

バックアップ一覧
現在との差分を表示
ソースを表示
バックアップを表示
処理モジュール作成１改(バージョン0.43まで) へ行く。
- 1 (2013-01-03 (木) 02:08:25)
- 2 (2013-01-03 (木) 02:14:05)
追加された行はこの色です。
削除された行はこの色です。
*チュートリアルで試せる内容 [#x79d8af3]

-[[マイニング処理モジュールの作り方(簡易版)]]
-&color(blue){複数の可視化インタフェースモジュールを選択的に出力に利用};
--&color(red){色付きの部分が「[[処理モジュール作成１(バージョン0.42まで)]]」との違いです};

*1)作成する処理モジュールの仕様を決めます [#ia5ed994]
-[モジュール名] NounTop10（名詞TOP10）
-[入力] テキスト情報
-[処理] テキストに含まれる，名詞を頻度が高い順に10個抽出する
-&color(red){[出力] 名詞の頻度上位10個の名詞を格納した配列，名詞の頻度上位10個の頻度を格納した配列};
--&color(blue){(a) 可視化モジュールTextDisplayを利用して，名詞の列を表示．可視化モジュールScoreDist で頻度の棒グラフを表示};


*2)雛形のSample1.java を利用して，モジュール作成の準備をします [#c65e82ca]
-tetdmのフォルダ内の，moduleフォルダ内のMiningModuleフォルダ内にある，Sample1フォルダを，フォルダごとコピーします
-コピーしてできたフォルダの名前を，作成するモジュール名「NounTop10」に変更します
-コピーして作成したフォルダ内のファイル名を変更します
--Sample1.java -> NounTop10.java
--Sample1.txt -> NounTop10.txt (テキストファイルの中身も「名詞TOP10」に変更します)
--必要に応じて，モジュール完成後にREADME.txtを修正します

*3)NounTop10.java を編集し，プログラム作成の準備をします [#c584745f]
-プログラム中の Sample1 と書かれている箇所をすべて NounTop10 に変更します（コメント内を含め5カ所）
---// NounTop10.java Version 0.30
---package module.MiningModules.NounTop10;
---public class NounTop10 extends MiningModule
---public NounTop10()
---System.out.println("writing ERROR in NounTop10");

**コンストラクタの記述の修正 [#zc55ba49]

-モジュールのIDを決め，コンストラクタ内のメソッド setModuleID の引数として与えます
-配列 pairingVisualizationID を初期化して，ペアとなる可視化インタフェースモジュールのIDを指定します．
---&color(blue){TextDisplay のIDの 1 と ScoreDist の 4 を指定します．};[[可視化インタフェースツール一覧]]

	public NounTop10()
	{
		setModuleID(9911);						// Set your module ID after you have got it
		pairingVisualizationID = new int[]{1,4};
	}

*4)一度コンパイルして，NounTop10モジュールの動作を確認します [#n340d7d8]
-make または ant コマンドでコンパイルします
-コンパイル後TETDMプログラムを起動して，いずれかのテキストを読み込みます
-パネル上部の処理ツールを選ぶメニューの中から「名詞TOP10」を選択します
--（「名詞TOP10」が表示されない場合，右下の「環境設定」ボタンを押し，ピンクの処理ツール一覧に「名詞TOP10」があることを確認し，チェックボタンをチェックして，再度「環境設定」ボタンを押して戻ります）
-入力テキストが，単語間にスペースが入った状態で表示されていることを確認します（Sample1.java の処理）

*5)プログラムの作成に使える入力情報を確認します [#q3f12a55]
-テキスト情報は，TextData型の変数 text に予め格納されているので，その中の単語情報に関するメンバー変数を確認します
-[[テキストデータ>http://www.sys.info.hiroshima-cu.ac.jp/people/sunayama/future/textdata.html]]
---KeywordData keyword[];
---int keywordNumber;
---String word; (KeywordDataクラス内)
---int frequency; (KeywordDataクラス内)
---int partOfSpeech;  (KeywordDataクラス内．値が1なら名詞)

*6)名詞の頻度上位10個を求めるプログラムを作成します [#oeee8f90]

-&color(blue){グローバル領域で，次の２つの変数を宣言します};

	String top10Words[];
	int top10frequency[];

-miningOperations メソッドの case 0: が自動的に実行されますので，そこから呼び出されるところに記述します．
-ソートには，source/Utilityフォルダ内のQsort.javaを利用することができます（// import source.Utility.*; のコメントアウトを外して利用します）

**&color(blue){void MyMethod()内に作成する場合}; [#t2807b6a]

	void MyMethod()
	{	
		int nounID[] = new int[text.keywordNumber];
		int frequency[] = new int[text.keywordNumber];
		int count;
		
		count = 0;
		for(int i=0;i<text.keywordNumber;i++)
			if(text.keyword[i].partOfSpeech == 1)
			{
				frequency[i] = text.keyword[i].frequency;
				count++;
			}
			else
				frequency[i] = 0;
		
		Qsort.initializeIndex(nounID, text.keywordNumber);
		Qsort.quicksort(frequency, nounID, text.keywordNumber);

		if(count > 10)
			count = 10;
	
		top10Words = new String[count];
		top10frequency = new int[count];			
		
		for(int i=0;i<count;i++)
		{
			top10Words[i] = text.keyword[nounID[i]].word;
			top10frequency[i] = frequency[i];
		}
	}



*7)出力を可視化モジュールに渡します [#gaec116e]
-可視化モジュール TextDisplay がsetDataメソッドによって受け取ることができるデータを，README.txtファイルや，ソースプログラムを見て確認します
-&color(blue){TextDisplay は，String型の配列を受け取って，dataIDが1のとき，改行区切りで表示します};
-&color(blue){ScoreDist は，int型の配列を受け取って，dataIDが2のとき，その棒グラフを表示します};

			case 0:
				MyMethod();
				setData(1,top10Words);
				setData(2,top10frequency);
				break;

*8)コンパイルして動作を確認します [#u050c7ed]
-&color(red){処理モジュール「名詞TOP10」が選択されているパネルで，パネル上部の「パネルセット」ボタンを押すと，TextDisplayとScoreDistが自動でセットされた状態になります};