更新予定(次回の更新に含められる予定の内容です) †
- バージョン0.45で、パネルの追加後、追加した直後のツール未選択パネル内の「削除」ボタンを押すとエラーが出るのを修正しました。
- キーワードとして扱える品詞に「連体詞」を追加しました.
2013年2月19日: バージョン0.45をアップロードしました †
- パネル選択ウインドウの起動時に,パネルにセットされている処理ツールが選択されている状態になるように変更しました.
- 各パネルごとに,部分テキスト(フォーカスされているセグメントや文)を対象として処理を実行する「段」「文」のボタンを,
各パネル上部に追加しました.
- 統合環境下部にあるボタンと機能は同じ(切り替わる範囲が異なります)で,ボタン同士は連動しています.
- 可視化ツール「セグメント選択」「文選択」などと組み合わせて,お使いください.
- 「段」「文」のボタンを押したときに,部分テキスト用のデータが生成されます.
- セグメントや文の選択後に,「段」「文」ボタンを押す必要があります
- TextDataクラスに、メソッド、String getSegmentTag()とString getSentenceTag()を追加しました。
- 文やセグメントの区切り記号を取得して、テキスト内に挿入することなどができます。
- ツールのREADME.txtが用意されていない場合に、エラーが出て起動しなかったのを修正しました。
- 処理ツール「twitter(TweetExtraction(ID=20))」において、検索したツイートの区切りが、セグメントの区切り記号となるように変更しました。
- 処理ツール「エディタ(EditModule(ID=1))」に以下の機能を追加しました.
- 改行があるところに、句点を挿入します。(空の文は作成しません)
- 空行があるところに、セグメントの区切り記号を挿入します。(空のセグメントは作成しません)
- セグメントの区切り記号を消去します。
- 可視化ツール「セグメント選択(SegmentSelect(ID=1100))」「文選択(SentenceSelect(ID=1101))」「キーワード選択(KeywordSelect(ID=1102))」の表示内容,機能を更新しました.
- いずれも処理ツールから値を受け取ることで,表示順を変更することが出来ます.
- キーワード選択は, IDを9から1102に変更しました.
- 旧バージョンの環境設定ファイル(tetdm.conf)を使用すると不具合が生じる可能性がありますのでご注意ください.
2013年2月6日: バージョン0.44をアップロードしました †
- 各パネルでのツール選択のために「ツール選択」ボタンを追加しました。
- 従来の、ツール選択用メニューを廃止しました。
- 環境設定の「ツール設定」ボタンを廃止しました。
- ツール選択ウインドウ内で,各ツールの説明を一行で表示するようにしました。
- 処理ツール「ソース表示(SourceRead(ID=99999))」の以下の内容を修正しました.
- READMEの冒頭に,20-50字の説明を入れるように促すコメントを追加しました.
2013年1月8日: バージョン0.43をアップロードしました †
- 各ツールの使い方を表示する「説明」ボタンを,各パネルの上部に追加しました.
- 各パネル内で用いられている処理ツールと可視化ツールのReadme.txtの内容を表示するようにしました.
- Readme.txtのフォーマットを改訂し,すべてのツールのReadme.txtの内容を修正しました.
- Readme.txtの作成には、処理ツール「ソース表示(SourceRead(ID=99999))」を用いてください.
- 入力テキストの文字コードが,環境によらず,Shift-JIS, EUC のいずれでも入力可能になりました.
- 現在もutf-8は使えません.文字コードをShift-JIS, EUC のいずれかに変換してから入力してください.
- WindowsではShift-JIS版、それ以外ではEUC版のChaSenがインストールされていることが動作条件となります.
- 処理ツール側のsetDataメソッドを、以下の引数の型に応じたメソッド名に変更しました.
- public final void setDataBoolean(int dataID, boolean data)
- public final void setDataInteger(int dataID, int data)
- public final void setDataDouble(int dataID, double data)
- public final void setDataString(int dataID, String data)
- public final void setDataBooleanArray(int dataID, boolean data[])
- public final void setDataIntegerArray(int dataID, int data[])
- public final void setDataDoubleArray(int dataID, double data[])
- public final void setDataStringArray(int dataID, String data[])
- public final void setDataBooleanArray2(int dataID, boolean data[][])
- public final void setDataIntegerArray2(int dataID, int data[][])
- public final void setDataDoubleArray2(int dataID, double data[][])
- 可視化ツール側のsetDataメソッドは、そのままです。
- 関連する処理ツールのソースを修正しました.
- 処理ツール間の連携の際に用いられるメソッド getDataBooleanNew などの getData***Newメソッドの名称を,getNewDataBoolean など getNewData***に変更しました.
- 処理ツール「ソース表示(SourceRead(ID=99999))」の以下の内容を修正しました.
- README作成用に表示内容を更新
- 処理ツール側のsetDataメソッド名の変更に伴う修正
- メソッド抽出用の文字列にスペルミスがあったのを修正
- 抽出対象メソッドの追加
- メソッド名 getData***New を getNewData*** に変更したことに伴う修正
- 「環境設定」を「キーワード設定」と「ツール設定」の二つに分け,「環境設定」ボタンを削除,「キーワード設定」と「ツール設定」ボタンを追加しました.
- それぞれのボタンを押した際に,設定画面が別ウインドウで立ち上がるようにしました.
- 統合環境の画面で確認しながら設定変更ができるようになりました.
- 統合環境内のボタンのレイアウトと表示を変更しました.
- 処理ツール「主題語含有率(TopicDistribution)(ID=23)」を追加しました.
- 処理ツール RadarChartTest(レーダーチャートテスト, ID=10111)を削除しました.
2012年12月5日: バージョン0.42をアップロードしました †
- フォーカス連動用の変数,mainFocusString, subFocusString, mainFocusDouble, subFocusDouble, mainFocusInteger, subFocusInteger の6つが,TextDataの再読み込み時に初期化されるようになっていたのを修正しました.
- 上記修正に伴って,処理モジュール Twitter で,twitterからテキストを取得して再処理の後,Checkボタンで検索語がハイライトされなかったのが修正されました.
- 統合環境の出力全体を画像として保存する「画像保存」ボタンを追加しました.
- 処理ツール RadarChartTest(レーダーチャートテスト, ID=10111)を追加しました.
- 可視化ツール RaderChart(レーダーチャート, ID=16)を追加しました.
2012年11月5日: バージョン0.41をアップロードしました †
- 複数のパネルを利用する際、各パネルごとの横幅を保存できるようにしました。
- 統合環境下部の「組合せ保存」ボタンを押したときに保存されます。
- この変更に伴い設定ファイルのフォーマットを変更したため、バージョン0.40以前の設定ファイルは使えません。
- すべてのパネルの横幅を同じにする「均等化」ボタンを、統合環境下部に追加しました。
- セグメント数が0の時に、可視化モジュール FlowPanel, 処理モジュール MakeLight でエラーが出ていたのを修正しました。
- 「.」全角ピリオドが数字の後にあった場合などで,形態素解析の結果が「句点」ではなく「名詞」と判定される場合,そのテキストが入力できない可能性があったのを修正しました.
2012年10月5日: バージョン0.40をアップロードしました †
- SegmentDataに変数segmentIDを追加しました(元テキストの0から始まるセグメント番号)
- SentenceDataに変数sentenceIDを追加しました(元テキストの0から始まる文番号)
- TextData,処理モジュール RelationCheck, FocusCheck,可視化モジュール FocusDisplay,において,セグメント番号や文番号を表示する際に,segmentID と sentenceIDを用いるように修正しました.
- 処理モジュール TextInfo のデータ連動の方法を一部修正しました.
- 処理モジュール MakeLabel の,テキスト中にない単語の処理を一部修正しました.
- 可視化モジュール セグメント選択(SegmentSelect,ID=1100),文選択(SentenceSelect,ID=1101)を追加しました.
- 任意の処理モジュールと組み合わせ可能です.
- セグメントや文を簡単に絞り込むために用いられます.
- 環境設定でチェックが入っていないモジュールを「パネルセット」によってセットした後,「パネル組合せ保存」しても、再起動後に組み合わせが反映されない不具合を修正しました.
- 文のデータ(sentenceText ならびに文内の単語リスト)において、句点の次に改行がある場合、その改行までを一文として扱うように変更しました.
- 「セグメント絞り込み」ボタンと、「文絞り込み」ボタンをパネル上部から、統合環境の下部に移動し、全パネル同時に切り替わるように変更しました.
- 「追加テキスト読込」ボタンを、統合環境下部から削除しました。
- これらに伴い、統合環境下部のボタンレイアウトを変更しました。
- 一部,主語抽出が適切に行えていなかったバグを修正しました.
- 主語抽出の際に,「未知語」も主語の対象に加えるようにしました.
- 処理モジュール Panoramic, 可視化インタフェース DrawOriginal の細かいバグを修正しました.
2012年9月26日: バージョン0.39をアップロードしました †
- フォーカス情報の初期化用のメソッドを,TextData内に設定し,公開しました.
- void clear(); フォーカス情報の全初期化
- 文の主語に関する情報を扱う変数を用意しました.詳細は->テキストデータ.
- 文の主語を可視化するための処理モジュール「主語抽出」を追加しました.
- 処理モジュール「テキスト分析」の表示内容を更新しました.
- テキストデータの一部のセグメントや一部の文のみを対象に,ツールを利用するためのデータ構造をTextData内に追加しました.
- void setSegmentPartialTextData(); セグメント絞り込み(Focus型のfocusSegments[]で,trueにセットされたセグメント)によるテキストデータの作成
- void setSentencePartialTextData(); 文絞り込み(Focus型のfocusSentences[]で,trueにセットされた文)によるテキストデータの作成
- セグメント絞り込みによるテキストデータを用いた処理結果との切り替えを行う「セグメント絞り込み」ボタン,
ならびに文絞り込みによる結果との切り替えを行う「文絞り込み」ボタンをパネル上部に追加しました.
- TextDataに、変数textIDを追加しました
- 処理結果のデータベースにtextIDを追加しました
- データ連動においてtextIDを確認する処理を追加しました
2012年8月23日: バージョン0.38をアップロードしました †
- 各パネルの出力内容を画像ファイルとして保存できる「画像保存」ボタンを追加しました.
- バージョン0.38でメニューを英語にしたときにバグが発生するのを修正しました(2012/8/27更新)
2012年7月24日: バージョン0.37をアップロードしました †
- 「セット」等のボタンのアイコンを変更し,パネルの上部に移動しました.
- 「セット」ボタンを押した際に,そのまま残して欲しいパネルを指定する「キープ」ボタンを追加しました.
- モジュールの組合せの指定?方法を変更しました.
- 変更に伴い,スーパークラス内に,additionalPanelSet()メソッド,ならびに関連するオプション連動用の以下のメソッドを追加しました.
- executeModule( int moduleID, int optionNumber )
- executeModuleFirst( int moduleID, int optionNumber )
- 変更に伴って,以下のメソッドを廃止ししました.
- insideOfActionPerformed(e)
- insideOfActionPerformedShort(e)
- これらの変更に伴って,関連するモジュールの記述を修正しました.
- 特殊処理ツール SourceRead(ソース表示)を追加しました.(入力テキストがない状態でも利用できます)
- 各モジュールのソースコードを表示,モジュールの実装に必要なメソッドの抽出表示,README.txt作成のための必要情報の自動抽出などの機能があります.
- 処理ツール FocusCheck のハイライト方法を変更し,ハイライト表示がなされないのを修正しました.
- 処理ツール Panoramic 要約(展望台) で,報知的要約,結論文抽出の機能を実装しました.
- 可視化ツール KeywordSelect(キーワード選択)を追加しました.(処理ツール MakeLight(光と影)で使用しています)
- 処理ツール MakeScore(スコア計算)を追加しました.
- 可視化ツール ScoreNetwork (スコアネットワーク)を追加しました.
2012年7月6日: バージョン0.36をアップロードしました †
- Macで使用する際,ChaSenをMacPortsからインストールした際のパス/opt/local/bin/chasenが,パスの設定なしで利用可能になりました.(環境設定に書かれたパスにコマンドが存在しないことが条件.環境設定でパスの設定をした場合,設定したパスが優先))
- モジュール間のデータの受け渡しについて,int 型 および double 型 の2次元配列を含めました.
- モジュール間のデータの受け渡しについて,boolean 型.boolean 型の1次元配列 および 2次元配列を含めました.
- MiningModule クラスに追加された,以下のメソッドを利用してデータの受け渡しを行えます.
- setData(int dataID, int data[][])
- setData(int dataID, double data[][])
- int[][] getDataIntegerArray2(int getModuleID, int dataID)
- double[][] getDataDoubleArray2(int getModuleID, int dataID)
- int[][] getDataIntegerArray2New(int getModuleID, int dataID)
- double[][] getDataDoubleArray2New(int getModuleID, int dataID)
- setData(int dataID, boolean data)
- setData(int dataID, boolean data[])
- setData(int dataID, boolean data[][])
- boolean getDataBoolean(int getModuleID, int dataID)
- boolean[] getDataBooleanArray(int getModuleID, int dataID)
- boolean[][] getDataBooleanArray2(int getModuleID, int dataID)
- boolean getDataBooleanNew(int getModuleID, int dataID)
- boolean[] getDataBooleanArrayNew(int getModuleID, int dataID)
- boolean[][] getDataBooleanArray2New(int getModuleID, int dataID)
- データを受け取る可視化モジュールでは,VisualizationModule クラスの以下のメソッドをオーバーライドして使用して下さい.
- setData(int dataID, int data[][])
- setData(int dataID, double data[][])
- setData(int dataID, boolean data)
- setData(int dataID, boolean data[])
- setData(int dataID, boolean data[][])
- 入力テキストの再読み込みをする text.fileLoad() メソッドを,TextDataクラスに追加しました.
- 処理ツール EditModule(エディタ)の「元テキスト」ボタンで入力テキストの再読み込みをするように変更しました.
- 可視化ツール TextDisplay で,文字型配列を受け取って表示できるように変更しました.
- 可視化ツール ScoreDist で,整数型配列を受け取れるように変更しました
- source/Utility内の,ユーティリティプログラムQsort.java に整数用のquicksortを追加しました.
2012年6月8日: バージョン0.35をアップロードしました †
- 統合環境の細かい表示の変更を行いました
- 可視化ツール FileDisplay(ID=5)を追加しました(処理ツールが指定したファイルの内容を表示する)
- 処理ツール WordExtraction, WordReplace が FileDisplay を利用して,文字列の抽出と置換が可能になりました.
- 可視化ツール TextHtmlDisplay: cssを利用してフォントをゴシック体に変更.統合環境のフォントサイズ変更にも対応するようになりました.
- 可視化ツール FlowPanel:統合環境のフォントサイズ変更にも対応するようになりました.
- 処理ツール PaperCheck, RelationCheck: 文字をハイライトする際の表示方法を変更しました.
2012年5月14日: バージョン0.34をアップロードしました †
- 入力ファイルなしでも空テキスト(textフォルダ以内のempty.txt)を読み込んで起動するように,仕様を変更しました.
- これに伴って,入力ファイルなしで起動したときに表示されていたガイダンスパネルを廃止しました.
- ツール選択ボタンを廃止しました.かわりに,ツール選択用のメニューをパネルの上部に追加しました.
- フォーカス連動用の変数,mainFocusString, subFocusString, mainFocusDouble, subFocusDouble, mainFocusInteger, subFocusInteger の6つを,TextDataクラスから統合環境内のクラスに移動し,これら変数へのアクセスはTextDataクラス内のメソッドを利用する方法に変更しました.
- これに伴って,これらを利用していた処理ツール,Dictionary, TweetExtraction, を更新しました.
- これにより,mainFocusString, subFocusString などの変数の値は、 TextDataが更新されても統合環境内に情報が残ります.
- TextDataクラスの,fileSaveメソッドを,テキストの保存と同時に統合環境内で選択中のパネルの表示を更新するように仕様を変更 しました.
- 関連して,処理ツール TweetExtractionでは,検索と同時に検索結果を入力テキストとして保存して、統合環境内で選択中のパネルの表示を更新するようになりました.
- (バージョン0.34では,起動後右のパネルにセットされており,下部の検索フォームに適当な単語を入力してリターンキーで検索して動作させることができます)
- 文の数またはキーワード数が0の場合に,統合環境や下記モジュールがエラーを出力していた箇所を修正しました.
- 空のテキストを入力した場合,セグメント数1,文の数0,キーワード数0となります.
- 統合環境内の TextData クラスを修正しました.
- 可視化ツールの ScoreDist, DrawNode2, DrawOriginal, DrawTree を修正しました.
- ツール作成時のチェック用に,第1セグメント,および第2セグメントの先頭の文が空の浦島太郎のテキスト,TESTurashimaeuc.txt, TESTurashimasjis.txt を textフォルダに追加しました.
- 最初の入力テキストと異なる入力テキストを読み込んだ場合,即座にパネル上部のファイル名が正しく表示されなかったのを修正しました.
- パネル数を追加したときに表示される「ツール未選択パネル」にパネル削除用のボタンを追加しました.
2012年3月27日: バージョン0.33をアップロードしました †
- フォーカス連動(処理連動)の仕様において,連動時に実行される内容を,miningOperations の case 0: から,Touchの場合 case 4501: に, Clickの場合 case 4502: とするように変更しました
- フォーカス連動(可視化連動)の仕様において,連動時に実行される内容を,displayOperations の case 0: から Touchの場合 case 4501: に, Clickの場合 case 4502: とするように変更しました
- フォーカス連動(可視化連動)の仕様において,実行フラグ focusTouchDisplay および focusClickDisplay を廃止しました
- 自動実行メソッドの名前を変更しました.
- マイニング処理モジュール: initializeOperationPanel() -> initializePanel()
- マイニング処理モジュール: selectedFirstTime() -> initializeData()
- 可視化インタフェースモジュール: setVisualizationPanel() -> initializePanel()
- これら上記の仕様変更に伴って,すべてのモジュールの記述を修正しました
2012年3月13日: バージョン0.32をアップロードしました † †
- 廃止したsetDisplay()メソッドが,統合環境や,モジュール内で使われていたのを修正しました.
- 拡張子 csv の,カンマ区切りデータを読み込み可能にしました. サンプルデータは,dataeuc.csv または datasjis.csv です.
- ,(半角カンマ)を単語の区切りとします
- 形態素解析を実行せず,すべてのカンマで区切られたデータをキーワードとします
- 改行を一文の終わりとし,。(句点)を自動的に挿入します
- セグメントの区切りを与える場合,日本語で従来通り「スナリバラフト」と書いて下さい
- すべてのデータ(キーワード)は,一般名詞(形態素解析の結果では,「名詞-一般」)として扱います
- 初期状態では,ひらがなの単語や1文字の単語が除かれる設定になっていますのでご注意ください
- このオプションは,テキストマイニングではなくデータマイニングとしての応用可能性を広げることを目的としていますが,当面は積極的なサポートは行いません
バージョン0.32の修正項目追記 †
- テキストデータの再読み込み時に,データ連動用のデータベースをリセットする処理を追加しました
- フォーカス連動のための変数,mainFocusString, subFocusString, mainFocusDouble, subFocusDouble, mainFocusInteger, subFocusInteger を追加しました
2012年3月1日: ツールを追加しました †
- 処理ツール「国語辞書」
- 可視化ツール「デュアルテキスト」
2012年2月21日: バージョン0.31をアップロードしました †
- モジュール作成の際の仕様を変更しました.
- 詳細は更新されましたツール(モジュール)の作り方内のWebページをご覧下さい.
- <仕様変更点の概要>
- 処理モジュールと可視化モジュールで,これまで8ステップあった起動時の処理を6ステップにまとめ,実装しやすくしました.
- 処理モジュール
- MiningModuleクラス内の,visualization変数をprivate化しました.
- これに伴って,これまでの,visualization.setData, visualization.setDisplay, visualization.displayOptions メソッドは, MiningModuleクラス内で再定義された setData, setDisplay, displayOperations に置き換えられました.
- createInitialData メソッド,ならびに,setInitialData メソッドを廃止しました. 代わりに,miningOperationsのcase 0: において同等の内容(処理+データ生成)を実装してください.
miningOperations(int optionNumber)は実装必須です(使えるオプション番号に,制限はありません)
miningOperations(int optionNumber){
switch(optionNumber){
case 0:
//初期化処理
break;
}
}
- すべての(処理+データ生成)は,miningOperationsのcase分岐から呼び出すこととしました. (setData メソッドは,miningOperations メソッド内から呼び出すようにして下さい)
- 処理モジュールが想定するパネル構成にセットする「▲セット」ボタン, セットボタンを押す前のパネル構成に戻す「▼戻る」ボタン, パネルを削除する「×削除」ボタンを追加
- 可視化モジュール
- setData(void) メソッドを廃止しました(自動実行4に統合) 初期化はすべて,これまでの,initializeData() 内に記述して下さい.
- setDisplay() メソッドを廃止しました. 代わりに,displayOperationsのcase 0: において同等の内容を実装することとしました.
- displayOperations(int optionNumber)は実装必須です(使えるオプション番号に,制限はありません)
displayOperations(int optionNumber){
switch(optionNumber){
case 0:
//初期化処理
break;
}
}
- すべての(可視化処理)は,displayOperationsのcase分岐から呼び出すこととしました.
- setData(int dataID ***) メソッドのオプション番号に,制限はありません
- その他の変更点
- オプションによる可視化連動の仕様を作成し実装しました
- オプションによる処理連動の仕様を作成し実装しました
- データ取得による処理連動を作成し実装しました
- 全モジュールを新仕様向けに修正
- マイニングモジュール:フォーカスチェック(FocusCheck)を追加
- マイニングモジュール:テキスト分析(TextInfo)を追加
- フォーカス連動で,デフォルトですべてのモジュールが連動していたのを,フォーカス連動の仕様変更により修正
- 「パネル組合せ保存」において,同一処理モジュールを複数のパネルにセットして,それぞれが異なる可視化パネルを選択していた場合,うまく保存されないバグを修正
- 「環境設定」から戻ったとき,選択していたモジュールがなくなったときの処理を修正
- 可視化モジュールの初期化時のパネルサイズを,ウインドウサイズをもとに計算して与えるように修正
- パネル初期化時の環境側の処理の見直しと修正(若干軽量化)
- パネル初期化時のパネル割り当て方法の変更(若干軽量化)
- ボタン表示などの日本語化の仕様で,日本語判定メソッドを text.isMenuInJapanese() から isMenuInJapanese() に変更
- boolean のフラグ focusExecute と focusDisplay を細分化し,focusTouchExecute, focusClickExecute, focusTouchDisplay, focusClickDisplay に置き換えました.
- フォーカス実行時の executeAll を executeAllByTouch と executeAllByClick に,repaintOthers を repaintOthersByTouch と repaintOthersByClick に置き換えました.
- フォーカス実行時用に, executeOthersByTouch と executeOthersByClick を作成しました.
- パネル未選択時のパネルを追加
- 統合環境全体の背景色を白にして,選ばれているモジュールを表示するタイトルボーダーの色を変更
- jarファイルのダブルクリックからの起動時に,機能するボタンのみ押すことができるようにしました.
- jarファイルのダブルクリックからの起動時に,環境設定を行えるようにしました.
- 各パネルをJSplitPane上に配置するように変更しました(パネル間のボーダーを移動できます).
- マイニングモジュール:単語抽出(WordExtraction)を追加
- マイニングモジュール:単語置換(WordReplace)を追加
- マイニングモジュール:Twitter(TweetExtraction)を追加
- 可視化モジュール:TextDisplay2をバージョンアップし,TextDisplayColorと改名
2012年1月16日: バージョン0.24をアップロードしました †
- メモリを512MB確保して起動するTETDM512.jarファイルの追加
- 「フォルダ読込」によりフォルダ内のテキスト集合を読み込む機能の追加
- 「フォルダ読込」テスト用サンプルフォルダ「sampletexts」の追加
- 添付モジュール群のアップデート(可視化モジュール1個)
- 環境設定のボタンの背景色追加
2012年1月6日: バージョン0.23をアップロードしました †
- パネル生成時のデフォルトモジュールの選び方を変更
- 添付モジュール群のアップデート(処理モジュール10個,可視化モジュール2個)
- サンプルテキスト「山椒大夫」を追加
- Mac用ドロップレットのメモリを512MBに設定
過去のお知らせ †
- 2011年12月21日: 誤って一部のモジュールの古いバージョンがアップロードされていた時間帯がありました.
- 2011年12月20日: 現時点で不要な処理のコメントアウト,[可視化ツール]TextFocusDisplay内のバグ修正
- 2011年12月20日: 誤ってバージョン0.21がアップロードされていた時間帯がありました.