*チュートリアルで試せる内容 [#hbde0d4c]

-[[マイニング処理モジュールの作り方(簡易版)]]
-&color(red){チュートリアル「[[可視化モジュール作成3]]」に必要な処理モジュールです};
--&color(red){色付きの部分が「[[処理モジュール作成1改]]」との違いです};
-[[マイニング処理ツールの作り方(簡易版)]]
-&color(red){チュートリアル「[[可視化ツール作成3]]」に必要な処理ツールです};
--&color(red){色付きの部分が「[[処理ツール作成1改]]」との違いです};

*1)作成する処理モジュールの仕様を決めます [#i153789b]
-[モジュール名] NounTop10(名詞TOP10)
*1)作成する処理ツールの仕様を決めます [#i153789b]
-[ツール名] NounTop10(名詞TOP10)
-[入力] テキスト情報
-[処理] テキストに含まれる,名詞を頻度が高い順に10個抽出する
-&color(red){[出力] 名詞の頻度上位10個の名詞を格納した配列,名詞の頻度上位10個の頻度を格納した配列};
--&color(blue){(b) チュートリアル「[[可視化モジュール作成3]]」で作成する BarGraph で,名詞とその頻度を合わせて表示};
--&color(blue){(b) チュートリアル「[[可視化ツール作成3]]」で作成する BarGraph で,名詞とその頻度を合わせて表示};

*2)雛形のSample1.java を利用して,モジュール作成の準備をします [#bcbb18f2]
*2)雛形のSample1.java を利用して,ツール作成の準備をします [#bcbb18f2]
-tetdmのフォルダ内の,moduleフォルダ内のMiningModuleフォルダ内にある,Sample1フォルダを,フォルダごとコピーします
-コピーしてできたフォルダの名前を,作成するモジュール名「NounTop10」に変更します
-コピーしてできたフォルダの名前を,作成するツール名「NounTop10」に変更します
-コピーして作成したフォルダ内のファイル名を変更します
--Sample1.java -> NounTop10.java
--Sample1.txt -> NounTop10.txt (テキストファイルの中身も「名詞TOP10」に変更します)
--必要に応じて,モジュール完成後にREADME.txtを修正します
--必要に応じて,ツール完成後にREADME.txtを修正します

*3)NounTop10.java を編集し,プログラム作成の準備をします [#a199f99a]
-プログラム中の Sample1 と書かれている箇所をすべて NounTop10 に変更します(コメント内を含め5カ所)
---// NounTop10.java Version 0.30
---package module.MiningModules.NounTop10;
---public class NounTop10 extends MiningModule
---public NounTop10()
---System.out.println("writing ERROR in NounTop10");

**コンストラクタの記述の修正 [#x172e315]

-モジュールのIDを決め,コンストラクタ内のメソッド setModuleID の引数として与えます
-配列 pairingVisualizationID を初期化して,ペアとなる可視化インタフェースモジュールのIDを指定します.
-ツールのIDを決め,コンストラクタ内のメソッド setModuleID の引数として与えます
-配列 pairingVisualizationID を初期化して,ペアとなる可視化インタフェースツールのIDを指定します.
---&color(blue){BarGraph の 9977 を指定します.};[[可視化インタフェースツール一覧]]
---&color(red){setToolType(3); [[ツールタイプ]]はセミプリミティブになります.};

	public NounTop10()
	{
		setModuleID(9911);	// Set your module ID after you have got it
		pairingVisualizationID = new int[]{9977};
		setToolType(3);
	}

*4)一度コンパイルして,NounTop10モジュールの動作を確認します [#f290a1a7]
*4)一度コンパイルして,NounTop10ツールの動作を確認します [#f290a1a7]
-make または ant コマンドでコンパイルします
-コンパイル後TETDMプログラムを起動して,いずれかのテキストを読み込みます
-パネル上部の「ツール選択」ボタンを押した後,左側の「名詞TOP10(sP)」をダブルクリックして選択します
-入力テキストが,単語間にスペースが入った状態で表示されていることを確認します(Sample1.java の処理)

*5)プログラムの作成に使える入力情報を確認します [#gc62f997]
-テキスト情報は,TextData型の変数 text に予め格納されているので,その中の単語情報に関するメンバー変数を確認します
-[[テキストデータ>http://www.sys.info.hiroshima-cu.ac.jp/people/sunayama/future/textdata.html]]
---KeywordData keyword[];
---int keywordNumber;
---String word; (KeywordDataクラス内)
---int frequency; (KeywordDataクラス内)
---int partOfSpeech;  (KeywordDataクラス内.値が1なら名詞)

*6)名詞の頻度上位10個を求めるプログラムを作成します [#xe3cf153]

-&color(blue){グローバル領域で,次の変数を宣言します};

	String top10Words[];
	int top10frequency[];

-miningOperations メソッドの case 0: が自動的に実行されますので,そこから呼び出されるところに記述します.
-ソートには,source/Utilityフォルダ内のQsort.javaを利用することができます(// import source.Utility.*; のコメントアウトを外して利用します)

**&color(blue){void MyMethod()内に作成する場合}; [#xa6c607f]

	void MyMethod()
	{	
		int nounID[] = new int[text.keywordNumber];
		int frequency[] = new int[text.keywordNumber];
		int count;
		
		count = 0;
		for(int i=0;i<text.keywordNumber;i++)
			if(text.keyword[i].partOfSpeech == 1)
			{
				frequency[i] = text.keyword[i].frequency;
				count++;
			}
			else
				frequency[i] = 0;
		
		Qsort.initializeIndex(nounID, text.keywordNumber);
		Qsort.quicksort(frequency, nounID, text.keywordNumber);

		if(count > 10)
			count = 10;
	
		top10Words = new String[count];
		top10frequency = new int[count];			
		
		for(int i=0;i<count;i++)
		{
			top10Words[i] = text.keyword[nounID[i]].word;
			top10frequency[i] = frequency[i];
		}
	}	


*7)出力を可視化モジュールに渡します [#f64b1b31]
*7)出力を可視化ツールに渡します [#f64b1b31]

-可視化モジュール &color(blue){BarGraph}; がsetDataメソッドによって受け取ることができるデータ型とデータ数を,README.txtファイルや,ソースプログラム(コンストラクタ内のdataNumbers[])を見て確認します
-可視化ツール &color(blue){BarGraph}; がsetDataメソッドによって受け取ることができるデータ型とデータ数を,README.txtファイルや,ソースプログラム(コンストラクタ内のdataNumbers[])を見て確認します

-&color(blue){BarGraph は,String型の配列を1つと,int型の配列を1つ(いずれもdataIDが0のデータ)を受け取って,その棒グラフを表示します};

	case 0:
                MyMethod();
                resetData();
                setDataStringArray(top10Words);
                setDataIntegerArray(top10frequency);
                break;

-可視化モジュールにデータを渡す際に,下記のメソッドにより,dataIDを0に初期化できます.
-可視化ツールにデータを渡す際に,下記のメソッドにより,dataIDを0に初期化できます.
---resetData();
---dataIDの値は,各データ型ごとに,setData***()メソッドを呼び出すごとに,1ずつ増加していきますので,データを送りなおす場合などに,このメソッドを呼び出す必要があります.

*8)コンパイルして動作を確認します [#qdbd04e7]
-&color(red){可視化モジュール「棒グラフ(BarGraph)」を作成してから,表示を確認して下さい};
-&color(red){可視化ツール「棒グラフ(BarGraph)」を作成してから,表示を確認して下さい};

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS