統合環境の起動方法
の編集
https://tetdm.jp:443/pukiwiki/index.php?%E7%B5%B1%E5%90%88%E7%92%B0%E5%A2%83%E3%81%AE%E8%B5%B7%E5%8B%95%E6%96%B9%E6%B3%95
-- 雛形とするページ --
2013年度人工知能学会全国大会論文募集
2014年度人工知能学会全国大会論文募集
2015クロージングディスカッションまとめ
2015年度人工知能学会全国大会論文募集
2016JSAI特設ページ
BracketName
CSVテキストの入力
ChatGPTを用いた機能について
FormattingRules
FrontPage
Help
InterWiki
InterWikiName
InterWikiSandBox
MacOSX(Mountain Lion, Lion)へのChaSenインストール
MacOSX(Snow Leopard)へのChaSenインストール
MenuBar
PHP
PukiWiki
PukiWiki/1.4
PukiWiki/1.4/Manual
PukiWiki/1.4/Manual/Plugin
PukiWiki/1.4/Manual/Plugin/A-D
PukiWiki/1.4/Manual/Plugin/E-G
PukiWiki/1.4/Manual/Plugin/H-K
PukiWiki/1.4/Manual/Plugin/L-N
PukiWiki/1.4/Manual/Plugin/O-R
PukiWiki/1.4/Manual/Plugin/S-U
PukiWiki/1.4/Manual/Plugin/V-Z
README.txtファイルの作成
RecentDeleted
R利用ツールの利用準備
SCIS2014
SCIS2014(JAPANESE)
SandBox
TETDM
TETDM 質問回答&更新ログ
TETDMのイベント
TETDMの学会活動
TETDMセッション@JSAI2012のまとめ
TETDMセッション@JSAI2013のまとめ
TETDM用語集
TETDM統合環境
TETDM統合環境(過去1)
TETDM統合環境0.62まで
WikiEngines
WikiName
WikiWikiWeb
WindowsへのJavaのインストール
YukiWiki
かえで
てすと:モジュールアップロード
アップロード用パッケージの準備
インタラクティブ情報アクセスと可視化マイニング
オプションによる処理連動
オプションによる可視化連動
キャラクターアシストチュートリアルの作成
チュートリアル
チュートリアル(バージョン0.42まで)
チュートリアル(バージョン0.43まで)
ツールIDの取得と記述
ツールの公開について
ツールの組合せの指定
ツールの選択
ツールタイプ
ツール作成の概要
ツール設定(バージョン0.43のみ)
テキストデータ
テトリーヌ
テトリーヌギャラリー
データ分析本のカラーの図(1-3章)
データ分析本のカラーの図(4章)
データ分析本のカラーの図(5-6章)
データ分析本のカラーの図(7章)
データ分析本を用いた講義用スライド
データ取得による処理連動
データ取得による処理連動(バージョン0.42まで)
データ取得による処理連動(バージョン0.46まで)
データ型コンバート
データ表示用クラス
パッケージのアップロード
パネルサイズに応じた表示更新
ファイルの入出力
フォーカス情報による処理連動
フォーカス情報による可視化連動
プログレスバーの表示
プロフィール
ボタンなどの日本語表示
ポジネガの判定方法
マイニングモジュールクラス
マイニング処理ツールの作り方
マイニング処理ツールの作り方(簡易版)
マイニング処理ツール一覧
マイニング処理ツール一覧(3.5まで)
マイニング処理モジュールの作り方(バージョン0.42まで)
マイニング処理モジュールの作り方(バージョン0.46まで)
マイニング処理モジュールの作り方(簡易版)(バージョン0.42まで)
マイニング処理モジュールの作り方(簡易版)(バージョン0.46まで)
マウス座標によるスレッドの停止と起動
モジュールの組合せの指定OLD
モジュールの連動の概要
使いやすいツールに向けて
個別にツールを追加・削除する方法
個別ツールの追加と削除
入力テキストの準備
処理ツール作成1
処理ツール作成1改
処理ツール作成1改2
処理ツール作成2
処理ツール作成3
処理モジュール作成1
処理モジュール作成1(バージョン0.42まで)
処理モジュール作成1(バージョン0.43まで)
処理モジュール作成1改(バージョン0.42まで)
処理モジュール作成1改(バージョン0.43まで)
処理モジュール作成1改2(バージョン0.42まで)
処理モジュール作成1改2(バージョン0.43まで)
処理モジュール作成2(バージョン0.42まで)
処理モジュール作成2(バージョン0.43まで)
処理モジュール作成3(バージョン0.42まで)
処理モジュール作成3(バージョン0.43まで)
処理対象テキストの更新、変更
利用者のよくある質問と回答
利用者・開発者用の掲示板
利用者向けチュートリアル
可視化インタフェースツールの作り方
可視化インタフェースツール一覧
可視化インタフェースツール一覧(3.5まで)
可視化インタフェースモジュールの作り方(バージョン0.46まで)
可視化ツール作成1
可視化ツール作成2
可視化ツール作成3
可視化ツール作成4
可視化モジュールクラス
可視化モジュール作成1
可視化モジュール作成1(バージョン0.42まで)
可視化モジュール作成1(バージョン0.43まで)
可視化モジュール作成2(バージョン0.42まで)
可視化モジュール作成2(バージョン0.43まで)
操作方法(バージョン0.42まで)
操作方法(バージョン0.45まで)
文字サイズの協調変更
更新ログ
更新ログ1.0
活用事例(バージョン0.42まで)
環境設定(バージョン0.42まで)
環境設定(バージョン0.45まで)
画像の表示
統合環境のインストールと設定
統合環境のクラス構成
統合環境のクラス構成(バージョン0.42まで)
統合環境の利用の流れ
統合環境の操作方法
統合環境の活用事例
統合環境の活用事例(バージョン0.43)
統合環境の環境設定
統合環境の起動方法
英語テキストの入力
複数ツールの連動
講座当日資料
起動モード
近未来チャレンジTETDM
追加ツールの利用方法
過去バージョン
開発者のよくある質問と回答
開発者登録
*統合環境の起動とテキストファイルの入力 [#xe80992c] **アイコンのダブルクリックによる起動 [#od714254] -&color(blue){ファイル ''TETDM.bat''をダブルクリック (Windowsマシン限定)};~ --コマンドプロンプト経由で,1536MB(1.5GB)のメモリを確保して起動します. --jarファイルから起動した場合に比べて,起動速度が速く,エラーの確認ができます. -&color(blue){ファイル ''TETDM.command''をダブルクリック (Macマシン限定)};~ --コマンドプロンプト経由で,1536MB(1.5GB)のメモリを確保して起動します. --jarファイルから起動した場合に比べて,起動速度が速く,エラーの確認ができます. -&color(red){ファイル ''TETDM-**.jar''(例えばTETDM-4.00.jar)のアイコンをダブルクリック};~ --1536MB(1.5GB)のメモリを確保して起動します -テキストファイルの入力 --起動後に表示される''&color(blue){「テキストエディタ」のパネルに,入力テキストをカットアンドペーストで貼付け};''て「保存+実行」ボタンを押す&color(red){''(全モード)''}; --画面左上の''&color(blue){「ファイル」ボタンを押して,ファイルを指定};''して入力する&color(red){''(通常,拡張モード)''}; **入力テキストファイルのドラッグアンドドロップによる起動[#j7b14b78] -Windowsの場合 --TETDM.bat ファイルの上に,入力テキストファイルをドラッグアンドドロップする -Macの場合 --TETDM.app(顔画像のアイコン)の上に,入力テキストファイルをドラッグアンドドロップする ---TETDM.appが機能しない(ダブルクリックすると「TETDMは壊れているため開けません。"ゴミ箱"に入れる必要があります。」と言われる)場合、ターミナルを起動して、以下のコマンドを実行すると使用できます。 cd desktop/tetdm-4.00 (デスクトップにtetdm-4.00をおいている場合) xattr -rc TETDM.app -いずれも,1536MB(1.5GB)のメモリを使用するように設定されています. **コマンドラインからの起動 [#h58bb23e] -入力テキストなしで起動する場合 --tetdmフォルダ内で次のコマンドを実行~ java -Xmx1536m -jar TET.jar ---1536の部分に使用するメモリ(MB)を指定(1024以上での利用を推奨します) -入力テキストを与えて起動する場合 --tetdmフォルダ内で次のコマンドを実行~ java -Xmx1536m -jar TET.jar [入力テキストのファイル名] ---ex) java -Xmx1536m -jar TET.jar text/urashima.txt *テキストの入力方法の詳細(一部上記と重複) [#e9668068] **統合環境起動後のコピー&ペーストによるテキスト入力(全モード) [#uc5577d5] -あるパネルに,''&color(blue){処理ツール「テキストエディタ」と可視化ツール「テキスト表示」の組合せがセットされている状態};''で,''&color(red){テキストフォーム内に入力したいテキストを貼付けて,「保存+実行」ボタンを押す};''と入力テキストとして扱われます. -貼付けたテキストに句点や段落の区切りを挿入したい場合は,「改行で文に」「空行で段落に」ボタンを利用することもできます. **統合環境起動後のファイル読み込みによる入力(通常,拡張モード) [#uc5577d5] -単一テキストの入力は,メニューウインドウの''&color(blue){「ファイル」};''ボタンを押して,&color(red){''テキストファイルを選択''};して与えます -複数テキストの入力は,メニューウインドウの''&color(blue){「フォルダ」};''ボタンを押して,&color(red){''フォルダを選択''};して与えます --フォルダ内のファイルをすべて結合したテキストファイル,「フォルダ名.txt」が作成され,フォルダtextの中に保存されます.~ (選択したフォルダ内のすべてのファイル(隠しファイルは除く)を結合しますので,フォルダ内の確認を行ってから選択して下さい.)~ (2度目からは,作成されたファイルをtextフォルダから読み込むことをおすすめします) --結合の際には,テキスト間に「スナリバラフト」が挿入されます. --フォルダ内のファイルの表示順に結合されます. --フォルダ内のテキストの日本語文字コードは,Shift-JIS と EUC のどちらでも(混ざっていても)問題ありません ---''&color(red){Windowsのjava1.7の場合,文字コードEUCのテキストを読み込めない可能性があるようです.その場合は文字コードをShift-JISに変換してご利用ください.};'' **入力テキストの形式 [#fbd149e5] -''[日本語文字コード]''''&color(blue){Shift-JIS か EUC};'' のテキストを入力できます. --&color(red){日本語文字コードがUTF-8のテキストは,ファイル選択時に「日本語(UTF-8)」をすると読み込むことができます.}; --コマンドラインからは,ファイル名の後ろに,0と1をオプションとして渡すことで入力することができます. 例) >java -Xmx1536m -jar TET.jar text/urashimautf8.txt 0 1 -''[文の区切り]''''&color(blue){句点(。や.)};''を文の区切りとして取り扱います.(句点が1つもないテキストでは動作しません) -''[段落の区切り]''単一テキストの場合,テキスト内に「''&color(blue){スナリバラフト};''(環境設定で設定したセグメント区切りの文字列)」という文字列を挿入することで, 段落(セグメント)の区切りを与えることができます. -''[テキストの区切り]''複数テキストを入力する場合,テキスト間に「''&color(blue){スナリバラフト};''」という文字列を挿入して1つのテキストに結合させることで,テキスト(セグメント)の区切りを与えた,入力テキストを生成することができます. --複数テキストを入力する場合,テキストの区切りと段落の区切りを区別して与えることはできません. -''[ファイル名]''&color(red){フォルダ名(ファイルがあるフォルダを含む)およびファイル名に日本語は使えません}; -''[ファイルへの処理]''統合環境内のすべての処理は,''&color(blue){入力テキストのコピー「入力ファイル名2」};''に対して行われます. --(どんな操作を行っても元のテキストが失われることはありません &ref(fileio.png,,50%,); -''[半角スペース,タブ]''半角スペース,タブは,バージョン4.30までは''&color(blue){改行};''に,以降のバージョンでは''&color(blue){全角スペース};''に自動的に変換されます. **入力テキストの長さ [#pb2a2480] -バージョン4.00時点で,以下の数値を設定しています.設定のないところは上限はありませんが,マシンのスペックや必要とするメモリ量によっては動作しない場合があります. -キーワード数の最大値:10000 -キーワード間の関連度計算を行うキーワード数の最大値:1500 -文間の関連度計算を行う文数の最大値:100 -セグメント間の関連度計算を行うセグメント数の最大値:1000 *日本語文章テキスト以外の入力 [#h91d2f97] **英語テキストの入力 [#h28897f8] -英語テキストを入力することができます. --[[英語テキストの入力]] **CSVテキストの入力 [#c02b9d94] -CSVテキストを入力することができます. --[[CSVテキストの入力]]
タイムスタンプを変更しない
*統合環境の起動とテキストファイルの入力 [#xe80992c] **アイコンのダブルクリックによる起動 [#od714254] -&color(blue){ファイル ''TETDM.bat''をダブルクリック (Windowsマシン限定)};~ --コマンドプロンプト経由で,1536MB(1.5GB)のメモリを確保して起動します. --jarファイルから起動した場合に比べて,起動速度が速く,エラーの確認ができます. -&color(blue){ファイル ''TETDM.command''をダブルクリック (Macマシン限定)};~ --コマンドプロンプト経由で,1536MB(1.5GB)のメモリを確保して起動します. --jarファイルから起動した場合に比べて,起動速度が速く,エラーの確認ができます. -&color(red){ファイル ''TETDM-**.jar''(例えばTETDM-4.00.jar)のアイコンをダブルクリック};~ --1536MB(1.5GB)のメモリを確保して起動します -テキストファイルの入力 --起動後に表示される''&color(blue){「テキストエディタ」のパネルに,入力テキストをカットアンドペーストで貼付け};''て「保存+実行」ボタンを押す&color(red){''(全モード)''}; --画面左上の''&color(blue){「ファイル」ボタンを押して,ファイルを指定};''して入力する&color(red){''(通常,拡張モード)''}; **入力テキストファイルのドラッグアンドドロップによる起動[#j7b14b78] -Windowsの場合 --TETDM.bat ファイルの上に,入力テキストファイルをドラッグアンドドロップする -Macの場合 --TETDM.app(顔画像のアイコン)の上に,入力テキストファイルをドラッグアンドドロップする ---TETDM.appが機能しない(ダブルクリックすると「TETDMは壊れているため開けません。"ゴミ箱"に入れる必要があります。」と言われる)場合、ターミナルを起動して、以下のコマンドを実行すると使用できます。 cd desktop/tetdm-4.00 (デスクトップにtetdm-4.00をおいている場合) xattr -rc TETDM.app -いずれも,1536MB(1.5GB)のメモリを使用するように設定されています. **コマンドラインからの起動 [#h58bb23e] -入力テキストなしで起動する場合 --tetdmフォルダ内で次のコマンドを実行~ java -Xmx1536m -jar TET.jar ---1536の部分に使用するメモリ(MB)を指定(1024以上での利用を推奨します) -入力テキストを与えて起動する場合 --tetdmフォルダ内で次のコマンドを実行~ java -Xmx1536m -jar TET.jar [入力テキストのファイル名] ---ex) java -Xmx1536m -jar TET.jar text/urashima.txt *テキストの入力方法の詳細(一部上記と重複) [#e9668068] **統合環境起動後のコピー&ペーストによるテキスト入力(全モード) [#uc5577d5] -あるパネルに,''&color(blue){処理ツール「テキストエディタ」と可視化ツール「テキスト表示」の組合せがセットされている状態};''で,''&color(red){テキストフォーム内に入力したいテキストを貼付けて,「保存+実行」ボタンを押す};''と入力テキストとして扱われます. -貼付けたテキストに句点や段落の区切りを挿入したい場合は,「改行で文に」「空行で段落に」ボタンを利用することもできます. **統合環境起動後のファイル読み込みによる入力(通常,拡張モード) [#uc5577d5] -単一テキストの入力は,メニューウインドウの''&color(blue){「ファイル」};''ボタンを押して,&color(red){''テキストファイルを選択''};して与えます -複数テキストの入力は,メニューウインドウの''&color(blue){「フォルダ」};''ボタンを押して,&color(red){''フォルダを選択''};して与えます --フォルダ内のファイルをすべて結合したテキストファイル,「フォルダ名.txt」が作成され,フォルダtextの中に保存されます.~ (選択したフォルダ内のすべてのファイル(隠しファイルは除く)を結合しますので,フォルダ内の確認を行ってから選択して下さい.)~ (2度目からは,作成されたファイルをtextフォルダから読み込むことをおすすめします) --結合の際には,テキスト間に「スナリバラフト」が挿入されます. --フォルダ内のファイルの表示順に結合されます. --フォルダ内のテキストの日本語文字コードは,Shift-JIS と EUC のどちらでも(混ざっていても)問題ありません ---''&color(red){Windowsのjava1.7の場合,文字コードEUCのテキストを読み込めない可能性があるようです.その場合は文字コードをShift-JISに変換してご利用ください.};'' **入力テキストの形式 [#fbd149e5] -''[日本語文字コード]''''&color(blue){Shift-JIS か EUC};'' のテキストを入力できます. --&color(red){日本語文字コードがUTF-8のテキストは,ファイル選択時に「日本語(UTF-8)」をすると読み込むことができます.}; --コマンドラインからは,ファイル名の後ろに,0と1をオプションとして渡すことで入力することができます. 例) >java -Xmx1536m -jar TET.jar text/urashimautf8.txt 0 1 -''[文の区切り]''''&color(blue){句点(。や.)};''を文の区切りとして取り扱います.(句点が1つもないテキストでは動作しません) -''[段落の区切り]''単一テキストの場合,テキスト内に「''&color(blue){スナリバラフト};''(環境設定で設定したセグメント区切りの文字列)」という文字列を挿入することで, 段落(セグメント)の区切りを与えることができます. -''[テキストの区切り]''複数テキストを入力する場合,テキスト間に「''&color(blue){スナリバラフト};''」という文字列を挿入して1つのテキストに結合させることで,テキスト(セグメント)の区切りを与えた,入力テキストを生成することができます. --複数テキストを入力する場合,テキストの区切りと段落の区切りを区別して与えることはできません. -''[ファイル名]''&color(red){フォルダ名(ファイルがあるフォルダを含む)およびファイル名に日本語は使えません}; -''[ファイルへの処理]''統合環境内のすべての処理は,''&color(blue){入力テキストのコピー「入力ファイル名2」};''に対して行われます. --(どんな操作を行っても元のテキストが失われることはありません &ref(fileio.png,,50%,); -''[半角スペース,タブ]''半角スペース,タブは,バージョン4.30までは''&color(blue){改行};''に,以降のバージョンでは''&color(blue){全角スペース};''に自動的に変換されます. **入力テキストの長さ [#pb2a2480] -バージョン4.00時点で,以下の数値を設定しています.設定のないところは上限はありませんが,マシンのスペックや必要とするメモリ量によっては動作しない場合があります. -キーワード数の最大値:10000 -キーワード間の関連度計算を行うキーワード数の最大値:1500 -文間の関連度計算を行う文数の最大値:100 -セグメント間の関連度計算を行うセグメント数の最大値:1000 *日本語文章テキスト以外の入力 [#h91d2f97] **英語テキストの入力 [#h28897f8] -英語テキストを入力することができます. --[[英語テキストの入力]] **CSVテキストの入力 [#c02b9d94] -CSVテキストを入力することができます. --[[CSVテキストの入力]]
テキスト整形のルールを表示する