丸山 拓海‎ > ‎

Optimizing Statistical Machine Translation for Text Simplification.

Wei Xu, Courtney Napoles, Ellie Pavlick, Quanze Chen and Chris Callison-Burch
Transactions of the Association for Computational Linguistics, vol. 4, pp. 401–415, 2016.


概要

・平易化システム(SMT) のチューニング
    - 大規模コーパスから獲得した換言ルール
    - 人手によって作られた小規模な平易化コーパス
    - 文平易化の自動評価尺度

自動評価尺度

入力文-参照文間の変化がない場合にペナルティを設ける
・FKBLEU
・SARI

結果

・SARIによってシステムを最適化することで、既存手法を上回る結果を実現
・SARIが人間の評価と相関があることを示す。

Comments