言語商会

言語商会旧研究室SNOW

SNOW T10: KFTT日本語表記統制テキスト

Name in English

  • SNOW T10: normalized Japanese text of The Kyoto Free Translation Task

内容

  • Graham NEUBIG氏が公開している京都フリー翻訳タスク(KFTT)の日本語テキスト部分を表記統制(表記ゆれ解消)したテキストです。
    • data/orig/kyoto-dev.js
    • data/orig/kyoto-test.ja
    • data/orig/kyoto-train.ja
    • data/orig/kyoto-tune.ja
  • 以上の4ファイルに対して表記統制を行ったものです。上記4ファイル(表記統制され単語分割されていない日本語テキスト)のみ加工して公開していますので、対訳英文や単語分割結果など、その他のファイルについては京都フリー翻訳タスク(KFTT)を参照してください。
  • 表記統制は本研究室が作成している日本語解析システム「雪だるま」(2016年8月10日現在)を用いて行いました。
  • 表記統制について、詳しくはこのページをご参照ください。

ダウンロード

利用制限・免責事項

関連URL

フィードバック

  • 本公開に対する責任はすべて山本にあります。
  • 本公開に関するあらゆるご意見・苦情・ご感想は山本にお送りください。
 (感想・要望・情報提供)