研究室‎ > ‎卒業生のみなさまへ‎ > ‎真嘉比 愛‎ > ‎文献紹介‎ > ‎NLP2012‎ > ‎

Wikipedia記事構造のモデル化による用語説明の自動編集

用語説明の自動編集
テキストを観点に分類する問題に帰着
 → テキストがどの観点に分類されるか判断

[Fujii 2010]を改善
 用語の拡張性問題 → 用語クラスタリング
 観点の冗長性問題 → 観点クラスタリング
 用語の誤分類問題 → 非決定的分類


適切にクラスタリングすれば,有害動物のようなクラスができるのでは?
 → 今回はクラスタリングの粒度を決め打ちでやってしまっている
人名だと色々種類が出てくるのでは?
 → 今回の実験に使っている人名の記事は政治家の記事が多かった
英語だとどうなるのか?同じように観点が抽出できるのか?
 → 手法自体はそのまま適用できると思うが,セクション名の付き方を調べていないため,わからない
今後やる予定は?
 → 可能であればやりたい
Comments