上脇 優人‎ > ‎

感情辞書

背景:
現在,公開されている日本語の感情辞書はノイズ(感情を含んでいない単語,普段使わないような単語)を多く含んでおり,辞書ベースの感情解析に適していない.
また,自動で語に対する感情を付与し,辞書構築をすると少なからずノイズが入ってしまう.そこで,手作業にてノイズとなる語を除去し,かつ語に対して感情を付与を実施することでノイズのない感情辞書を構築することを目指した.
また,現在公開されている辞書の中で1語に対して感情が付与されているものは,ない.

目的:
辞書ベースの感情解析に適したノイズのない感情辞書の構築をし,公開する.

感情辞書について:
構築した感情辞書は,1語に対して48の感情分類の中から当てはまる感情を付与した辞書である.
感情辞書に収録してある語は,感情表現辞典[1]等より収集した語である.本感情辞書は,表記ゆれには対応していない.しかし,各語の読みを付与してあるため,同じ読みの語であれば表記ゆれにも対応可能である.
1語に対して複数の感情がある場合は,複数の感情が付与されている.
1語に付与する感情の数に制限は設けていない.
また,1人のみで感情付与をした辞書の場合,付与する感情に偏りが出てしまう可能性がある.
そこで,本辞書は,3人が独立してそれぞれ各語に対して感情付与を実施した.これにより,感情の偏りは防げる.

本感情辞書は,各テキストデータの感情分析に利用できる.従来の感情辞書に比べ,本感情辞書は,ノイズが少ない.
そのため,辞書ベースでの感情分析をした際,精度の向上が見込める.

感情辞書:
感情辞書(Google Spreadsheet) : こちら

[1]中村 明, 『感情表現辞典』, 東京堂出版, 1993.

Comments