言語商会

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

snow:t10 [2021/09/07 16:51] – 作成 adminsnow:t10 [2021/09/07 22:10] (現在) admin
行 1: 行 1:
 [[:|言語商会]]>[[:lab:|旧研究室]]>[[:SNOW:|SNOW]] [[:|言語商会]]>[[:lab:|旧研究室]]>[[:SNOW:|SNOW]]
 ~~NOTOC~~ ~~NOTOC~~
 +
 +===== SNOW T10: KFTT日本語表記統制テキスト =====
 +=== Name in English ===
 +  * SNOW T10: normalized Japanese text of The Kyoto Free Translation Task
 +
 +=== 内容 ===
 +  * [[http://www.phontron.com/|Graham NEUBIG氏]]が公開している[[http://www.phontron.com/kftt/index-ja.html|京都フリー翻訳タスク(KFTT)]]の日本語テキスト部分を表記統制(表記ゆれ解消)したテキストです。
 +  * 具体的には、http://www.phontron.com/kftt/index-ja.html で公開されている [[http://www.phontron.com/kftt/download/kftt-data-1.0.tar.gz|Kyoto Free Translation Task (Data Only v. 1.0)]] にある
 +    * data/orig/kyoto-dev.js
 +    * data/orig/kyoto-test.ja
 +    * data/orig/kyoto-train.ja
 +    * data/orig/kyoto-tune.ja
 +  * 以上の4ファイルに対して表記統制を行ったものです。上記4ファイル(表記統制され単語分割されていない日本語テキスト)のみ加工して公開していますので、対訳英文や単語分割結果など、その他のファイルについては[[http://www.phontron.com/kftt/index-ja.html|京都フリー翻訳タスク(KFTT)]]を参照してください。
 +  * 表記統制は本研究室が作成している日本語解析システム「雪だるま」(2016年8月10日現在)を用いて行いました。
 +  * 表記統制について、詳しくはこのページをご参照ください。
 +
 +=== ダウンロード ===
 +  * [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/T10|圧縮ファイル(.tar.bz2)]] (2016年8月10日公開)
 +
 +=== 利用制限・免責事項 ===
 +  * このデータは[[http://creativecommons.org/licenses/by-sa/3.0/|Creative Commons Attribution-Share-Alike License 3.0]]に基づいて再配布可能です。
 +
 +=== 関連URL ===
 +  * [[http://www.phontron.com/kftt/index-ja.html|京都フリー翻訳タスク(KFTT)]]  / [[http://www.phontron.com/|Graham NEUBIG(奈良先端大)]]
 +  * [[http://alaginrc.nict.go.jp/WikiCorpus/|Wikipedia日英京都関連文書対訳コーパス]] / 情報通信研究機構(NICT)
 +
 +=== フィードバック ===
 +  * 本公開に対する責任はすべて山本にあります。
 +  * 本公開に関するあらゆるご意見・苦情・ご感想は山本にお送りください。
  
  
 (感想・要望・情報提供)