研究室‎ > ‎卒業生のみなさまへ‎ > ‎真嘉比 愛‎ > ‎文献紹介‎ > ‎NLP2012‎ > ‎

文書集合の話題俯瞰手法に関する分析

関連研究:
Yippy,ファセット検索,Facetedpedia

俯瞰するためにはラベルだろう
 → クエリ尤度モデルに基づくラベル付与によるクラスタリング(予稿)
 ↓ 発表では・・・
 → トピックモデル(LDA等)を使う
   冗長なトピックを取り除き,話題を集約する

トピック間の冗長性:Jaccard係数で求める

LDAによって推定したトピックを集約
トピックモデルによって推定したトピックは冗長という前提
 → 上記前提を置かない各種関連研究において,精度改善可能か調査


捨てるトピックもあるのでは?
 → 今回は人間が見て捨てている
最後の二次元の配置方法はどうなっているのか?
 → 左上から右下に向けて配置
 → むしろ近いものは似ていないはず
Comments