処理ツール作成1改
をテンプレートにして作成
開始行:
*チュートリアルで試せる内容 [#b3074936]
-[[マイニング処理ツールの作り方(簡易版)]]
--&color(red){色付きの部分が「[[処理ツール作成1]]」との...
*1)作成する処理ツールの仕様を決めます [#tbc32ff3]
-[ツール名] NounTop10(名詞TOP10)
-[入力] テキスト情報
-[処理] テキストに含まれる,名詞を頻度が高い順に10個抽出...
-&color(red){[出力] 名詞の頻度上位10個の頻度を格納した配...
--&color(blue){(a) 可視化ツールScoreDist で頻度の棒グラフ...
*2)雛形のSample1.java を利用して,ツール作成の準備をしま...
-tetdmのフォルダ内の,moduleフォルダ内のMiningModuleフォ...
-コピーしてできたフォルダの名前を,作成するツール名「Noun...
-コピーして作成したフォルダ内のファイル名を変更します
--Sample1.java -> NounTop10.java
--Sample1.txt -> NounTop10.txt (テキストファイルの中身も...
--必要に応じて,ツール完成後にREADME.txtを修正します
*3)NounTop10.java を編集し,プログラム作成の準備をします ...
-プログラム中の Sample1 と書かれている箇所をすべて NounTo...
---// NounTop10.java Version 0.30
---package module.MiningModules.NounTop10;
---public class NounTop10 extends MiningModule
---public NounTop10()
---System.out.println("writing ERROR in NounTop10");
**コンストラクタの記述の修正 [#xfa9f11b]
-ツールのIDを決め,コンストラクタ内のメソッド setModuleID...
-配列 pairingVisualizationID を初期化して,ペアとなる可視...
---&color(blue){ScoreDist の 4 を指定します.};[[可視化イ...
---setToolType(2); [[ツールタイプ]]はプリミティブになりま...
public NounTop10()
{
setModuleID(9911); // Set your module ID after you have...
pairingVisualizationID = new int[]{4};
setToolType(2);
}
*4)一度コンパイルして,NounTop10ツールの動作を確認します ...
-make または ant コマンドでコンパイルします
-コンパイル後TETDMプログラムを起動して,いずれかのテキス...
-パネル上部の「ツール選択」ボタンを押した後,左側の「名詞...
-入力テキストが,単語間にスペースが入った状態で表示されて...
*5)プログラムの作成に使える入力情報を確認します [#jf2dcfe5]
-テキスト情報は,TextData型の変数 text に予め格納されてい...
-[[テキストデータ>http://www.sys.info.hiroshima-cu.ac.jp/...
---KeywordData keyword[];
---int keywordNumber;
---String word; (KeywordDataクラス内)
---int frequency; (KeywordDataクラス内)
---int partOfSpeech; (KeywordDataクラス内.値が1なら名詞)
*6)名詞の頻度上位10個を求めるプログラムを作成します [#l80...
-&color(blue){グローバル領域で,次の変数を宣言します};
int top10frequency[];
-miningOperations メソッドの case 0: が自動的に実行されま...
-ソートには,source/Utilityフォルダ内のQsort.javaを利用す...
**&color(blue){void MyMethod()内に作成する場合}; [#n14374...
void MyMethod()
{
int nounID[] = new int[text.keywordNumber];
int frequency[] = new int[text.keywordNumber];
int count;
count = 0;
for(int i=0;i<text.keywordNumber;i++)
if(text.keyword[i].partOfSpeech == 1)
{
frequency[i] = text.keyword[i].frequency;
count++;
}
else
frequency[i] = 0;
Qsort.initializeIndex(nounID, text.keywordNumber);
Qsort.quicksort(frequency, nounID, text.keywordNumber);
if(count > 10)
count = 10;
top10frequency = new int[count];
for(int i=0;i<count;i++)
top10frequency[i] = frequency[i];
}
*7)出力を可視化ツールに渡します [#oca47ae1]
-可視化ツール &color(blue){ScoreDist}; がsetDataメソッド...
-&color(blue){ScoreDist は,int型の配列を1つ(dataIDが0の...
case 0:
MyMethod();
resetData();
setDataIntegerArray(top10frequency);
break;
-可視化ツールにデータを渡す際に,下記のメソッドにより,da...
---resetData();
---dataIDの値は,各データ型ごとに,setData***()メソッドを...
*8)コンパイルして動作を確認します [#e41e293e]
-&color(red){浦島太郎であれば「浦島 リュウグウ 乙姫 太郎 ...
終了行:
*チュートリアルで試せる内容 [#b3074936]
-[[マイニング処理ツールの作り方(簡易版)]]
--&color(red){色付きの部分が「[[処理ツール作成1]]」との...
*1)作成する処理ツールの仕様を決めます [#tbc32ff3]
-[ツール名] NounTop10(名詞TOP10)
-[入力] テキスト情報
-[処理] テキストに含まれる,名詞を頻度が高い順に10個抽出...
-&color(red){[出力] 名詞の頻度上位10個の頻度を格納した配...
--&color(blue){(a) 可視化ツールScoreDist で頻度の棒グラフ...
*2)雛形のSample1.java を利用して,ツール作成の準備をしま...
-tetdmのフォルダ内の,moduleフォルダ内のMiningModuleフォ...
-コピーしてできたフォルダの名前を,作成するツール名「Noun...
-コピーして作成したフォルダ内のファイル名を変更します
--Sample1.java -> NounTop10.java
--Sample1.txt -> NounTop10.txt (テキストファイルの中身も...
--必要に応じて,ツール完成後にREADME.txtを修正します
*3)NounTop10.java を編集し,プログラム作成の準備をします ...
-プログラム中の Sample1 と書かれている箇所をすべて NounTo...
---// NounTop10.java Version 0.30
---package module.MiningModules.NounTop10;
---public class NounTop10 extends MiningModule
---public NounTop10()
---System.out.println("writing ERROR in NounTop10");
**コンストラクタの記述の修正 [#xfa9f11b]
-ツールのIDを決め,コンストラクタ内のメソッド setModuleID...
-配列 pairingVisualizationID を初期化して,ペアとなる可視...
---&color(blue){ScoreDist の 4 を指定します.};[[可視化イ...
---setToolType(2); [[ツールタイプ]]はプリミティブになりま...
public NounTop10()
{
setModuleID(9911); // Set your module ID after you have...
pairingVisualizationID = new int[]{4};
setToolType(2);
}
*4)一度コンパイルして,NounTop10ツールの動作を確認します ...
-make または ant コマンドでコンパイルします
-コンパイル後TETDMプログラムを起動して,いずれかのテキス...
-パネル上部の「ツール選択」ボタンを押した後,左側の「名詞...
-入力テキストが,単語間にスペースが入った状態で表示されて...
*5)プログラムの作成に使える入力情報を確認します [#jf2dcfe5]
-テキスト情報は,TextData型の変数 text に予め格納されてい...
-[[テキストデータ>http://www.sys.info.hiroshima-cu.ac.jp/...
---KeywordData keyword[];
---int keywordNumber;
---String word; (KeywordDataクラス内)
---int frequency; (KeywordDataクラス内)
---int partOfSpeech; (KeywordDataクラス内.値が1なら名詞)
*6)名詞の頻度上位10個を求めるプログラムを作成します [#l80...
-&color(blue){グローバル領域で,次の変数を宣言します};
int top10frequency[];
-miningOperations メソッドの case 0: が自動的に実行されま...
-ソートには,source/Utilityフォルダ内のQsort.javaを利用す...
**&color(blue){void MyMethod()内に作成する場合}; [#n14374...
void MyMethod()
{
int nounID[] = new int[text.keywordNumber];
int frequency[] = new int[text.keywordNumber];
int count;
count = 0;
for(int i=0;i<text.keywordNumber;i++)
if(text.keyword[i].partOfSpeech == 1)
{
frequency[i] = text.keyword[i].frequency;
count++;
}
else
frequency[i] = 0;
Qsort.initializeIndex(nounID, text.keywordNumber);
Qsort.quicksort(frequency, nounID, text.keywordNumber);
if(count > 10)
count = 10;
top10frequency = new int[count];
for(int i=0;i<count;i++)
top10frequency[i] = frequency[i];
}
*7)出力を可視化ツールに渡します [#oca47ae1]
-可視化ツール &color(blue){ScoreDist}; がsetDataメソッド...
-&color(blue){ScoreDist は,int型の配列を1つ(dataIDが0の...
case 0:
MyMethod();
resetData();
setDataIntegerArray(top10frequency);
break;
-可視化ツールにデータを渡す際に,下記のメソッドにより,da...
---resetData();
---dataIDの値は,各データ型ごとに,setData***()メソッドを...
*8)コンパイルして動作を確認します [#e41e293e]
-&color(red){浦島太郎であれば「浦島 リュウグウ 乙姫 太郎 ...
ページ名: