IALP2015 総括


中国・蘇州で行われたIALP2015について記述を行う

期間: 10月24〜25日
旅程: 10月23日(長岡→東京→茨城空港→浦東国際空港→上海(中国)→蘇州(中国)),
         10月26日(蘇州→上海→浦東国際空港)
        
10月27日(浦東国際空港→茨城空港→東京→長岡)

発表内容:
Japanese Sentence Compression using Simple English Wikipedia
Authors: Shunsuke Takeno, Yamamoto Kazuhide

概要:
We describe a cross-lingual approach for sentence compression of articles of Japanese Wikipedia
using the correspondence of articles of Simple English Wikipedia.
Taking advantages of the nature of the corpus, we can find essential parts from encyclopedic description without highly depending on the statistical information which are noisy.
We manually explored the correspondences between the articles of Japanese Wikipedia and those of Simple English Wikipedia
and then proposed a cross-lingual alignment method using simple matching algorithm.
We provide an analysis of the abovementioned correspondence and the preliminary result of sentence compression using Simple English Wikipedia.


質問内容について:
1. データの数値について計算ミスが見られる.
   こちらのミスです. MATCHとPMATCHを合わせて 50.9%となります. 数値はPMATCHの数が含まれていません

2. なぜ2つの実験でデータ数が異なるのか
   3のアルゴリズムの性能だけを評価するために 2の実験で, 文間に"十分対応関係"があるものを評価セットとして用いたため.

3. 圧縮された文はどの程度流暢であるか?
    依存関係構造を考慮しているため可読性という観点からは十分に流暢であると考えている.
  ただし依存関係のパーシングが失敗しているものに対しては難しいし, 文節を削除しただけでは 若干違和感を感じるような文が生成される.
  この解決のためには 機能語などの書き換え知識が必要である.


YouTube 動画



Comments