[[:|言語商会]]>[[:lab:|旧研究室]]>[[:SNOW:|SNOW]] ~~NOTOC~~ ===== SNOW T10: KFTT日本語表記統制テキスト ===== === Name in English === * SNOW T10: normalized Japanese text of The Kyoto Free Translation Task === 内容 === * [[http://www.phontron.com/|Graham NEUBIG氏]]が公開している[[http://www.phontron.com/kftt/index-ja.html|京都フリー翻訳タスク(KFTT)]]の日本語テキスト部分を表記統制(表記ゆれ解消)したテキストです。 * 具体的には、http://www.phontron.com/kftt/index-ja.html で公開されている [[http://www.phontron.com/kftt/download/kftt-data-1.0.tar.gz|Kyoto Free Translation Task (Data Only v. 1.0)]] にある * data/orig/kyoto-dev.js * data/orig/kyoto-test.ja * data/orig/kyoto-train.ja * data/orig/kyoto-tune.ja * 以上の4ファイルに対して表記統制を行ったものです。上記4ファイル(表記統制され単語分割されていない日本語テキスト)のみ加工して公開していますので、対訳英文や単語分割結果など、その他のファイルについては[[http://www.phontron.com/kftt/index-ja.html|京都フリー翻訳タスク(KFTT)]]を参照してください。 * 表記統制は本研究室が作成している日本語解析システム「雪だるま」(2016年8月10日現在)を用いて行いました。 * 表記統制について、詳しくはこのページをご参照ください。 === ダウンロード === * [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/T10|圧縮ファイル(.tar.bz2)]] (2016年8月10日公開) === 利用制限・免責事項 === * このデータは[[http://creativecommons.org/licenses/by-sa/3.0/|Creative Commons Attribution-Share-Alike License 3.0]]に基づいて再配布可能です。 === 関連URL === * [[http://www.phontron.com/kftt/index-ja.html|京都フリー翻訳タスク(KFTT)]] / [[http://www.phontron.com/|Graham NEUBIG(奈良先端大)]] * [[http://alaginrc.nict.go.jp/WikiCorpus/|Wikipedia日英京都関連文書対訳コーパス]] / 情報通信研究機構(NICT) === フィードバック === * 本公開に対する責任はすべて山本にあります。 * 本公開に関するあらゆるご意見・苦情・ご感想は山本にお送りください。