第7章 コンピュータで翻訳する方法

7.1 コンピュータで翻訳する三つの方法

  • 機械翻訳:入力された言語(原言語:source language)に対して、異なる言語(目標言語:target language)に翻訳した文字列を出力する
  • 単語直接方式
  1. 対訳辞書を用いて、単語単位で原言語を目標言語に置き換える
  2. 置き換えた目標言語の単語列を、品詞情報や文法規則に整合するように並び替えて訳文を得る
    • 問題点
      • 文の構造や意味情報を訳文に反映できない
      • 語の並び替え規則が膨大になる
    • あまり用いられていなかったが、近年では統計に基づく翻訳手法が盛んになり、単語直接方式が見直されている
  • 変換方式(トランスファ方式)
  1. 原言語辞書を用いて形態素解析と構文解析を行い、原言語の構文解析結果を得る
  2. 対訳辞書と変換規則を用いて、目標言語に依存した構造に変換する
  3. 目標言語辞書を用いて目標言語の文を生成する
    • 利点
      • 構文構造の表現を用いるため、句構造を用いることができる
      • 原言語の表層的情報や構文構造が目標言語に反映されやすい
      • 原言語の曖昧さを保持したままで変換が可能
      • 利用する知識が少なくて済む
    • 前処理
      • 訳文に依存せずに、英文を訳文の構造に適合するように変換する
    • 訳語選択
      • 多くの訳語の中から文脈に合った訳語を選択する
      • 対訳辞書を用いて訳語を選択する
      • 訳語は対象分野により異なるので、一般辞書よりも分野辞書の訳語を優先する
    • 問題点
      • 変換規則を言語対ごとに用意しなけらばならない
    • 構文解析がある程度の精度で実現できているので、商用のシステムで最も広く使われている
  • 中間言語方式(ピボット方式)
    • 言語に依存しない意味表現である中間言語に変換してから目標言語の訳文を生成する
    • 人間が行なっている翻訳過程と非常に近く、機械翻訳の究極的な手段として研究が盛んに行われた
    • そもそも言語に依存しない、完全に抽象的な意味表現が存在するかどうかという問題もあり、広く利用されるには至っていない
    1. 原言語辞書を用いて原言語を中間言語に変換する
    2. 目標言語辞書を用いて中間言語から目標言語の文を生成する
    • 利点
      • 意訳が可能
    • 問題点
      • 変換過程で表層的な情報が失われる
      • 原言語の曖昧さを全て解消してからでないと中間言語を生成できない
      • 深い意味処理を行うためには膨大な知識が必要

7.2 翻訳例をまねる方法

  • 人間は例文中から、いま訳そうとしている文に類似した例文を探し、それを基に翻訳を行うことがしばしばある
  • これをシステム上で実現するのが、用例に基づく翻訳である
  • 用例をできるだけ大量に用意し、用例の部分部分を組み合わせて翻訳を行う
  • 翻訳用例の使用方法には、次に示すようにいろいろなものがある
    • 字面情報のみを利用するもの
    • 形態素解析結果を利用するもの
    • 構文解析結果を利用するもの
  • 処理時間がかかるという問題があり、補助的な利用にとどまることが多い


Comments