テキストデータに戻る

利用した辞書

  • 以下の,日本語評価極性辞書(https://www.cl.ecei.tohoku.ac.jp/Open_Resources-Japanese_Sentiment_Polarity_Dictionary.html)を利用させていただきました.ここに記して感謝いたします.
    • 著作者: 東北大学 乾・岡崎研究室 / Author(s): Inui-Okazaki Laboratory, Tohoku University
    • 小林のぞみ,乾健太郎,松本裕治,立石健二,福島俊一. 意見抽出のための評価表現の収集. 自然言語処理,Vol.12, No.3, pp.203-222, 2005. Nozomi Kobayashi, Kentaro Inui, Yuji Matsumoto, Kenji Tateishi. Collecting Evaluative Expressions for Opinion Extraction, Journal of Natural Language Processing 12(3), 203-222, 2005.
    • 東山昌彦, 乾健太郎, 松本裕治, 述語の選択選好性に着目した名詞評価極性の獲得, 言語処理学会第14回年次大会論文集, pp.584-587, 2008. Masahiko Higashiyama, Kentaro Inui, Yuji Matsumoto. Learning Sentiment of Nouns from Selectional Preferences of Verbs and Adjectives, Proceedings of the 14th Annual Meeting of the Association for Natural Language Processing, pp.584-587, 2008.

ポジネガ判定アルゴリズム

  • 用言編の辞書には単語の組合せが記されているものがありますが,基本的に1単語のもののみを評価対象としています.
    • 名詞+「だ,です,と,の」との組合せについては,先頭の名詞のみを評価対象としています.

単語のポジネガ判定アルゴリズム

  • 辞書内の単語について,形態素解析結果として得られる単語とのマッチングを,単語単位で行い評価します.
  • ただし,単語の品詞情報は用いずに文字列が一致するかどうかで評価しています.

セグメントのポジネガ判定アルゴリズム

  • セグメントが含むポジティブな文とネガティブな文の数を数えて,どちらが多いかで評価します.

文のポジネガ判定アルゴリズム

  • 文が含むポジティブな単語とネガティブな単語の数を数えて,どちらが多いかで評価します.
  • ただし,文が含む単語のポジネガ判定の際には,以下の補正を番号順に行った後の値を利用します.

文のポジネガ判定補正アルゴリズム

1. 否定補正:否定がかかっている単語は,ポジネガを逆にする

  • [前置否定] 直後の単語のポジネガを入れ替えます.
  • 不,無,非.未
  • [後置否定] 後ろ5単語以内に以下の否定語(否定の助動詞「ない」「ぬ」の活用形)があれば,その単語のポジネガを入れ替えます.
  • ない,なかろ,なかっ,なく,なけれ,ず,ぬ,ん
  • 品詞の判定は行っていないため,「ぬ」の仮定形「ね」は,名詞,助詞ともマッチングする可能性があるため,現時点では除外しています.

2. 形容詞,動詞補正:ポジネガ形容詞の修飾先の単語,ポジネガ動詞の動作元の単語はニュートラルにする

  • 「ポジネガ形容詞+名詞(集合)」の場合,前方のポジネガ形容詞のポジネガを優先して,後ろの名詞(集合)の極性を,ニュートラルにします.
  • 「名詞(集合)+1単語(ポジネガ極性無し,助詞を想定)+ポジネガ形容詞」の場合,後方の「ポジネガ形容詞」のポジネガを優先して,前の名詞(集合)の極性を,ニュートラルにします.
  • 「名詞(集合)+1単語(ポジネガ極性無し,助詞を想定)+ポジネガ動詞」の場合,後方の「ポジネガ動詞」のポジネガを優先して,前の名詞(集合)の極性を,ニュートラルにします.
  • *この補正は,名詞と形容詞,または,名詞と動詞,がキーワードに設定されていないと,動作しません.

3. 複合名詞補正:複合名詞は一番後ろにあるポジネガ名詞のポジネガを採用する

  • 「名詞(集合)+ポジネガ名詞」の場合,一番後ろにあるポジネガ名詞のポジネガを優先して,その前にある名詞(集合)の極性を,ニュートラルにします.
  • *この補正は,名詞がキーワードに設定されていないと,動作しません.

4. 複合ポジネガ補正:ポジネガ単語が連続する場合は一番後ろの単語のポジネガを採用する

  • 複数のポジネガ単語が連続する場合,一番後ろのポジネガ単語を優先して,その前にあるポジネガ単語の極性を,ニュートラルにします.

5. 例外処理

  • ポジネガ極性を与える例外単語を,ニュートラルにします.
  • 処理ツール「ポジネガ抽出(PosiNega)」のフォルダ内の辞書(テキストファイル exceptionDic.txt)を直接編集することで設定可能です.
    • 現在,「イヤ」の1単語が指定されています.

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2022-06-23 (木) 15:44:49 (672d)