入力テキストの形式 †
- 日本語の入力テキスト1つを用意してください.
- 入力テキストの日本語文字コードは,インストールしたChaSenと同一の文字コード
(基本的にWindows の場合は Shift-JIS, Windows以外の場合は EUC)に変換しておく必要があります.
- 句点(。や.)を文の区切りとして取り扱います.(句点が1つもないテキストでは動作しません)
- 単一テキストの場合,テキスト内に「スナリバラフト」という文字列を挿入することで,
セグメント(段落)の区切りを与えることができます.
- 複数テキストの場合,1つのテキストに結合させ,テキスト間に「スナリバラフト」という文字列を挿入すると,
それをセグメント(テキスト)の区切りとして,入力テキストとすることができます.
- 統合環境内のすべての処理は,入力テキストのコピー「入力ファイル名2」に対して行われます.
(どんな操作を行っても元のテキストが失われることはありません)
- 入力テキストのファイル名に日本語は使えません
- 日本語のフォルダ名の中にあるファイルも入力に使えません
「フォルダ読込」からの入力について †
- フォルダ内のファイルをすべて結合したテキストファイル,「フォルダ名.txt」が作成され,フォルダtextの中に保存されます.
(選択したフォルダ内のすべてのファイル(隠しファイルは除く)を結合しますので,フォルダ内の確認を行ってから選択して下さい.)
(2度目からは,作成されたファイルをtextフォルダから読み込むことをおすすめします)
- 結合の際には,テキスト間に「スナリバラフト(環境設定で設定したセグメント区切りの文字列)」が挿入されます.
- フォルダ内のファイルの表示順に結合されます.
- フォルダ内のテキストの日本語文字コードは,Shift-JIS と EUC のどちらでも(混ざっていても)問題ありません
- 現在,UTF-8の日本語を含む場合は,入力に使えません.
- Shift-JIS と EUC 以外の文字コードが含まれている場合などにはテキスト全体が文字化けすることがあります
- フォルダ名およびファイル名に日本語は使えません