複雑な文の翻訳

今までは主語、動詞、目的語の3単語からなる文を処理する機構が紹介されていた。
次は、3単語以上の文を翻訳する手法が紹介されている。

 入力. He bought a book on international politics.
 翻訳対. He bought a notebook. → He bought X.
      彼はノートを買った。  → 彼はXを買った。

 2つを見比べ、Xに
a book on international politicsが入ると認識させる。

 He bought
(a book on international politics).
 彼は
(a book on international politics)を買った。

次にa book on international politicsを辞書、または例文より翻訳。
 *翻訳対『I read
(a book on international politics).
      →私は(国際政治について書かれた本)を読んだ。』がある場合、
  抜粋して
『彼は(国際政治について書かれた本)を買った。』と翻訳。
 *翻訳対『a book on economic.→ 経済学について書かれた本』がある場合、
  『a book on
Y. → Yについて書かれた本』 Yにinternational politics(国際政治)を代入

実現方法

 照合表現を介した翻訳を行う。翻訳の入出力として木構造の単語係り受け構造を使用。
『He bought a notebook』について
リスト表記
 [[buy,v],
  [[he,pron]],
  [[notebook,n],
   [[a,det]]]]

 [[買う,動詞],
  [[は,助詞],
   [[彼,代名詞]]],
  [[を,助詞],
   [[ノート,
名詞]]]

     ↓ 部分対応関係を付加

リスト表記
 [e1,[buy,v],
  [e2,[he,pron]],
  [e3,[notebook,n],
   [e4,[a,det]]]]

 [j1,[買う,動詞],
  [j2,[は,助詞],
   [j3,[彼,代名詞]]],
  [j4,[を,助詞],
   [j5,[ノート,
名詞]]]

(対応関係
 [[e1,j1],[e2,j3],[e3,j5]]

  翻訳ユニット・・・翻訳の際に使用する部品。次の2つの条件のどちらかを満たす。
  1.翻訳可能な木(対応付けが存在する部分木)
  2.翻訳可能な木から任意の翻訳可能な木を削除したもの
  (例の翻訳ユニット)
 e1
 j1
 e2 j3
 e3 j5
 e1-e2 j1-j3
 e1-e3 j1-j5
 e1-e2-e3 j1-j3-j5

 照合表現の例.
 He bought a book on international politics. について
  (リスト表記
  [j11,[読む,動詞],
    [j12,[は,係助詞],
      [j13,[私,代名詞]],
    [j14,[を,格助詞],
      [j15,[本,名詞],
        [j16,[た,助動詞],
          [j17,[れる,助動詞],
            [j18,[書く,動詞],
              [j19,[について,格助詞],
                [j20,[国際政治,名詞]]]]]]]]]

  [e11,[read,v],
    [e12,[I,pron]],
    [e13,[book,n],
      [e14,[a,det]],
      [e15,[on,p],
        [e16,[politics,n],
        [e17,[international,adj]]]]]]

  (対応関係)
  [[e11,j11],[e12,j13],[e13,j15],[e16,j20]]

  上の2つの例文のe3(notebook)をe13(
book on international politics)に置き換えることを照合表現で記述
  [e1,[r,e3,[e13]]]

得点付け
 この手法では複数の文を使用するため、記憶型推論のときのように文同士の距離で翻訳の良し悪しを判定できない。
 したがって、翻訳ユニットごとに点数をつけて判定する。点数は高いほどよい。
 点数が高くなる条件は次の2つ
  ・まとめて翻訳した翻訳ユニットが長い
  ・入力と翻訳例の翻訳ユニットの周囲の状況が似ている(例ではa notebookとa book...が似ている)。
   (翻訳ユニットの外的類似度が高い)
 外的類似度はその総和を用いる。

 以上より、ある入力Wに対する翻訳ユニットTの得点score(T,W)を次のように計算する。

score(T,W)=大きさ(T)×(大きさ(T)+外的類似度(T,W))/大きさ(W)^2

Comments