丸山 拓海‎ > ‎

Simple English Wikipedia: A New Text Simplification Task

William Coster, David Kauchak
Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics:shortpapers, pages 665–669(2011)

概要

・English Wikipedia(Normal)とSimple English Wikipedia(Simple)から137,000文対の平易化コーパスを構築
・作成したコーパスとPB-SMT(Moses)を用いて文単位の平易化

平易化コーパス

・Normal sentenceからSimple sentenceへの変換
    rewording 65%, deletion 47%, reorders 34%, merges 31%, split 27%
・平易化コーパスの27%はNormal,Simple間で一致

文単位の平易化

・手法: None(平易化なし), Moses, Moses-Oracle
・評価: BLEU, SSA, word-F1
・Mosesを用いることでBLEUが0.005向上
・Moses-Oracleにより, BLEUが0.034改善できることを示す

Comments