言語商会

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
snow:t15 [2021/08/19 22:05] adminsnow:t15 [2021/09/10 19:21] (現在) admin
行 1: 行 1:
 +[[:|言語商会]]>[[:lab:|旧研究室]]>[[:SNOW:|SNOW]]
 ~~NOTOC~~ ~~NOTOC~~
 +
 ===== SNOW T15:やさしい日本語コーパス ===== ===== SNOW T15:やさしい日本語コーパス =====
 ==== Name in English ==== ==== Name in English ====
行 5: 行 7:
  
 ==== Reference in English ==== ==== Reference in English ====
-  * Takumi Maruyama and Kazuhide Yamamoto. Simplified Corpus with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), (2018.5)+  * Takumi Maruyama and Kazuhide Yamamoto. Simplified Corpus with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.1153-1160 (2018.5) [[https://www.jnlp.org/cgi-priv/download.cgi?id=18LREC-maruyama|[原稿]]] [[https://www.jnlp.org/cgi-priv/download.cgi?id=slide/18/18LREC-maruyama.pdf|[ポスター]]] [[https://www.jnlp.org/cgi-priv/download.cgi?id=one/18/18LREC-maruyama.pdf|[概要]]]
  
 ==== 内容 ==== ==== 内容 ====
   * 5万文をやさしい日本語(平易な日本語語彙)に書き換えた対訳コーパスです。   * 5万文をやさしい日本語(平易な日本語語彙)に書き換えた対訳コーパスです。
     * 本研究室の学生5名がすべて人手で書き換えました。詳しくは下記文献[2]をご参照ください。     * 本研究室の学生5名がすべて人手で書き換えました。詳しくは下記文献[2]をご参照ください。
 +    * 本コーパスとは別に、約3.5万文の[[t23|SNOW T23:やさしい日本語拡張コーパス]]も作成しました。
   * ここで言う「やさしい日本語」とは、我々が独自に定義したUniDic単語体系の2,000語です。   * ここで言う「やさしい日本語」とは、我々が独自に定義したUniDic単語体系の2,000語です。
     * 詳しくはやさしい日本語の解説ページをご覧ください。     * 詳しくはやさしい日本語の解説ページをご覧ください。
行 17: 行 20:
  
 ==== ダウンロード ==== ==== ダウンロード ====
-  * [[https://filedn.com/lit4DCIlHwxfS1gj9zcYuDJ/SNOW/T15-2020.1.7.xlsx|XLSXファイル (3.5MB) ]]+  * [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/T15|XLSXファイル (3.5MB) ]]
     * 2020/1/ 対応のおかしかった下記の行(1808, 3804, 9473, 13981, 14377, 17721, 20961, 30422, 41142, 42133, 46615, 48631, 49930)について修正しました。ご指摘ありがとうございました。     * 2020/1/ 対応のおかしかった下記の行(1808, 3804, 9473, 13981, 14377, 17721, 20961, 30422, 41142, 42133, 46615, 48631, 49930)について修正しました。ご指摘ありがとうございました。
     * 2018/2/28 ファイルを差し替えました。     * 2018/2/28 ファイルを差し替えました。
行 27: 行 30:
  
 ==== 発表文献 ==== ==== 発表文献 ====
-  * [1] Takumi Maruyama and Kazuhide Yamamoto. Simplified Corpus with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), (2018.5) [[https://filedn.com/lit4DCIlHwxfS1gj9zcYuDJ/arc/18/18LREC-maruyama.pdf|[PDF]]] +  * [1] Takumi Maruyama and Kazuhide Yamamoto. Simplified Corpus with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.1153-1160 (2018.5) [[https://www.jnlp.org/cgi-priv/download.cgi?id=18LREC-maruyama|[原稿]]] [[https://www.jnlp.org/cgi-priv/download.cgi?id=slide/18/18LREC-maruyama.pdf|[ポスター]]] [[https://www.jnlp.org/cgi-priv/download.cgi?id=one/18/18LREC-maruyama.pdf|[概要]]]  
-  * [2] ⼭本 和英, 丸⼭ 拓海, ⾓張 ⻯晴, 稲岡 夢⼈, ⼩川 耀⼀朗, 勝⽥ 哲弘, 髙橋 寛治. やさしい⽇本語対訳コーパスの構築. 言語処理学会第23回年次大会, pp.763-766 (2017.3) [[https://filedn.com/lit4DCIlHwxfS1gj9zcYuDJ/arc/17/17NLP-yamamoto.pdf|[PDF]]]+  * [2] ⼭本 和英, 丸⼭ 拓海, ⾓張 ⻯晴, 稲岡 夢⼈, ⼩川 耀⼀朗, 勝⽥ 哲弘, 髙橋 寛治. やさしい⽇本語対訳コーパスの構築. 言語処理学会第23回年次大会, pp.763-766 (2017.3) [[https://www.jnlp.org/cgi-priv/download.cgi?id=arc/17/17NLP-yamamoto.pdf|[原稿]]] [[https://www.jnlp.org/cgi-priv/download.cgi?id=slide/17/17NLP-yamamoto.pdf|[ポスター]]] 
  
 ==== フィードバック ==== ==== フィードバック ====
 (感想・要望・情報提供)