記憶型推論

●記憶型推論とは
 入力と大量のデータから近似したものを選び、出力を決定する。
 翻訳に適応させると、近似している用例をもとに翻訳を行う。
 データベース内の大量の
翻訳対・翻訳例を使用する。
 ここでは、SVOそれぞれ1単語ずつの文のみを採用。

  例.入力 『He eats potatoes』
入力を変形→ (eat he potatoes)
    データベース内から「eat」を使った翻訳例を探し出す。
     翻訳例1 ((eat he vegetable)(食べる 彼 野菜))
     翻訳例2 ((eat acid iron)(侵す 酸 金属))
   入力に対して距離が一番小さい翻訳例(近似しているもの)を採用
翻訳例1との距離が近い場合(食べる 彼 ジャガイモ)
翻訳例2との距離が短い場合(侵す 彼 ジャガイモ)
   (動詞の訳語と同時に、名詞の訳語選択もできる可能性もある)


 実際の処理では入力に対して考えうる動詞と名詞の訳語の組合せから翻訳候補を作る。
 そして、そのすべてに対して距離(近似度)を求める。

  例.入力『Japanese play card』→ (play Japanese card)
    入力に対する翻訳候補は次の通り
play
Japanese
card
する
日本人
トランプ
する
日本人
カード
する
日本語
トランプ
する
日本語
カード
弾く
日本人
トランプ
弾く
日本語
カード
演じる
日本人
カード


  翻訳候補に対してもっとも近い距離の翻訳例をそれぞれ探し出す。

  例に関して、あるデータベースを用い、(play:する、Japanese:日本人、card:トランプ)の
 翻訳候補がもっとも近い距離をもてば翻訳結果は(する 日本人 トランプ)となる。



●2文間の距離
 特定の動詞からなるまとまりをフレーム、フレームにおいて名詞の入り得る部分をスロットと定義する。
 翻訳候補aと翻訳例bが以下のようにあるとする。

     翻訳候補a=(<play,する> <he,彼>   <card,トランプ>)
           ↑      ↑       ↑
         動詞が等しい   d1       d2
           ↓      ↓       ↓
     翻訳例b=(<play,する> <she,彼女> <game,ゲーム>)


 このとき、2つの文の距離(近似度)
△(a,b)は次の式で定義する。
     △(a,b)=w1d1+w2d2
 ここで、dはスロットに入り得る名詞(参考書では名詞ペア)の距離、wはスロットの重要度である。
 翻訳例は動詞が同じものから選ばれる(動詞の訳語は考慮されない)。

 dは同じ動詞のときに各スロットに特定の名詞(名詞ペア)が出現した回数を比較し、名詞同士の近似度を算出。
wはその品詞の情報量(重要度)で決定。

 このシステムにおいて、小規模な実験を行った結果、正解率は85.9%。
Comments