研究室‎ > ‎卒業生のみなさまへ‎ > ‎真嘉比 愛‎ > ‎文献紹介‎ > ‎NLP2012‎ > ‎

アスペクトの被覆を実現するための最小値最大化問題に基づく文書要約モデル

Guided Summarization
 含めるべき情報にアスペクトという指向性がある
 アスペクト:要約する文書集合の内容を知る上で重要な項目
 可能な限りアスペクトをバランスよく含む

Maximum Coverage Model
 可能な限り多様な情報を含め,かつ要約にある程度の結束性をもたせたもの
 文を概念単位の集合と考える
  → 文書頻度を利用して計算した重みを概念単位へ与える
  → 重要な概念単位を可能な限りカバーする

Scorer:最大エントロピー法
 条件付き確率を,文がどのくらいアスペクトを反映しているかを表す反映度として用いる

先行研究(多様性と主題との関連性を線型結合した式)+バランスのよいアスペクトの被覆率

ROUGE:参照要約とbigramの重複度


アスペクトの作り方は?
 → アスペクトはTACであらかじめ定義されている
アスペクトを自動的に作れるか?
 → この研究では考えていない
でもそれは必要じゃないか?
 → 必要だと思う.今後の課題
アスペクト分類がどのくらい分類できるか評価したか?
 → うまくいっていいない時:約60%,うまくいっている時:約90%
その部分が関係していると思われる.検討した方が良い
アスペクト分類が100%うまくいった場合の提案手法の有効性は?
 → まだ調べていない.今後の課題
棒グラフの分散の逆数を使った方が良いのでは?最小値を用いた理由は?
 → 一つ低いのがあると,そこにまとまろうとしてしまう
Comments