チュートリアルで試せる内容 †
1)作成する処理モジュールの仕様を決めます †
- [モジュール名] BarGraph(棒グラフ)
- [入力] String型配列,int型配列
- [処理] int型配列で与えられる数字による棒グラフを作成,各棒の名前にString配列で与えられる文字を利用して,棒グラフを作成
- [出力] 作成した棒グラフを表示
2)雛形のSampleDisplay2.java を利用して,モジュール作成の準備をします †
- tetdmのフォルダ内の,moduleフォルダ内のVisualizationModuleフォルダ内にある,SampleDisplay2フォルダを,フォルダごとコピーします
- コピーしてできたフォルダの名前を,作成するモジュール名「BarGraph」に変更します
- コピーして作成したフォルダ内のファイル名を変更します
- SampleDisplay2.java -> BarGraph.java
- SampleDisplay2.txt -> BarGraph.txt (テキストファイルの中身も「棒グラフ」に変更します)
- 必要に応じて,モジュール完成後にREADME.txtを修正します
3)BarGraph.java を編集し,プログラム作成の準備をします †
- プログラム中の SampleDisplay2 と書かれている箇所をすべて BarGraph に変更します(コメント内を含め4カ所)
- // BarGraph.java Version 0.30
- package module.VisualizationModules.BarGraph;
- public class BarGraph extends VisualizationModule
- public BarGraph()
コンストラクタの記述の修正 †
- モジュールのIDを決め,コンストラクタ内のメソッド setModuleID の引数として与えます(今回は9977とします)
public BarGraph()()
{
setModuleID(9977); // Set your module ID after you have got it
}
4)一度コンパイルして,BarGraphモジュールの動作を確認します †
- make または ant コマンドでコンパイルします
- コンパイル後TETDMプログラムを起動して,いずれかのテキストを読み込みます
- 右下の「環境設定」ボタンを押し,ピンクの処理ツール一覧に「名詞TOP10」があることを確認し,チェックボタンをチェックして,再度「環境設定」ボタンを押して戻ります
- パネル上部の処理ツールを選ぶメニューの中から「名詞TOP10」を選択します
- 入力テキストが,単語間にスペースが入った状態で表示されていることを確認します(Sample1.java の処理)
5)プログラムの作成に使える入力情報を確認します †
- テキスト情報は,TextData型の変数 text に予め格納されているので,その中の単語情報に関するメンバー変数を確認します
- テキストデータ
- KeywordData keyword[];
- int keywordNumber;
- String word; (KeywordDataクラス内)
- int frequency; (KeywordDataクラス内)
- int partOfSpeech; (KeywordDataクラス内.値が1なら名詞)
6)名詞の頻度上位10個を求めるプログラムを作成します †
- miningOperations メソッドの case 0: が自動的に実行されますので,そこから呼び出されるところに記述します.
- ソートには,source/Utilityフォルダ内のQsort.javaを利用することができます(// import source.Utility.*; のコメントアウトを外して利用します)
String MyMethod()内に作成する場合 †
String MyMethod()
{
int nounID[] = new int[text.keywordNumber];
int frequency[] = new int[text.keywordNumber];
int count;
count = 0;
for(int i=0;i<text.keywordNumber;i++)
if(text.keyword[i].partOfSpeech == 1)
{
frequency[i] = text.keyword[i].frequency;
count++;
}
else
frequency[i] = 0;
Qsort.initializeIndex(nounID, text.keywordNumber);
Qsort.quicksort(frequency, nounID, text.keywordNumber);
StringWriter sw = new StringWriter(); //For words
BufferedWriter bw = new BufferedWriter(sw);
try{
for(int i=0;i<10 && i<count;i++)
bw.write(text.keyword[nounID[i]].word+" ");
bw.flush();
}
catch(Exception e){
System.out.println("writing ERROR in NounTop10");
}
return sw.toString();
}
7)出力を可視化モジュールに渡します †
- 可視化モジュール TextDisplay がsetDataメソッドによって受け取ることができるデータを,README.txtファイルや,ソースプログラムを見て確認します
- TextDisplay は,String型(dataIDは任意)のデータを受け取って表示します
8)コンパイルして動作を確認します †
- 浦島太郎であれば「浦島 リュウグウ 乙姫 太郎 景色 子供 背中 不思議 綺麗 春の 」と出力されます
- 出力結果は,処理ツール「マイニングなし」可視化ツール「表」を組合せた出力からも確認できます