言語商会

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
snow:t23 [2021/08/19 22:04] adminsnow:t23 [2021/09/07 20:00] (現在) admin
行 1: 行 1:
 +[[:|言語商会]]>[[:lab:|旧研究室]]>[[:SNOW:|SNOW]]
 ~~NOTOC~~ ~~NOTOC~~
 ===== SNOW T23:やさしい日本語拡張コーパス ===== ===== SNOW T23:やさしい日本語拡張コーパス =====
-==== Name in English ====+=== Name in English ===
   * SNOW T23: Crowdsourced Corpus of Sentence Simplification with Core Vocabulary   * SNOW T23: Crowdsourced Corpus of Sentence Simplification with Core Vocabulary
  
-==== Reference in English ====+=== Reference in English ===
   * Akihiro Katsuta and Kazuhide Yamamoto. Crowdsourced Corpus of Sentence Simplification with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.461-466 (2018.5)   * Akihiro Katsuta and Kazuhide Yamamoto. Crowdsourced Corpus of Sentence Simplification with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.461-466 (2018.5)
  
-==== 内容 ====+=== 内容 ===
   * [[T15|SNOW T15:やさしい日本語コーパス]]を参考にして、新たに3万5千文をやさしい日本語(平易な日本語語彙)に書き換えた対訳コーパスです。   * [[T15|SNOW T15:やさしい日本語コーパス]]を参考にして、新たに3万5千文をやさしい日本語(平易な日本語語彙)に書き換えた対訳コーパスです。
     * クラウドソーシングで集めた7名がすべて人手で書き換えました。     * クラウドソーシングで集めた7名がすべて人手で書き換えました。
行 19: 行 20:
     * もとからやさしい日本語だけで構成されていない文     * もとからやさしい日本語だけで構成されていない文
  
-==== ダウンロード ====  +=== ダウンロード === 
-  * [[https://filedn.com/lit4DCIlHwxfS1gj9zcYuDJ/SNOW/T23-2020.1.7.xlsx|XLSXファイル]] (3.5MB) +  * [[https://www.jnlp.org/cgi-priv/download.cgi?id=SNOW/T23|XLSXファイル]] (3.5MB) 
     * 2020/1/ 対応のおかしかった下記の行(Ab_101,  Ab_519,  Ab_721,  Ab_2238,  Ab_3280,  Ab_4095,  Ab_4832,  Ac_87,  Ah_1238,  Ah_1426,  Ah_2410,  Ah_2450,  Ah_2650,  Ah_2651,  Ah_2975,  Ah_2976,  Ah_4243,  Ah_4632,  Ak_1454,  Ak_2089,  Ak_2154,  Ak_2321,  Ak_4686,  Al_1311,  Al_1723,  Al_2780,  Al_3737,  Al_3796,  Al_3860,  Al_4024) について修正を行いました。ご指摘ありがとうございました。     * 2020/1/ 対応のおかしかった下記の行(Ab_101,  Ab_519,  Ab_721,  Ab_2238,  Ab_3280,  Ab_4095,  Ab_4832,  Ac_87,  Ah_1238,  Ah_1426,  Ah_2410,  Ah_2450,  Ah_2650,  Ah_2651,  Ah_2975,  Ah_2976,  Ah_4243,  Ah_4632,  Ak_1454,  Ak_2089,  Ak_2154,  Ak_2321,  Ak_4686,  Al_1311,  Al_1723,  Al_2780,  Al_3737,  Al_3796,  Al_3860,  Al_4024) について修正を行いました。ご指摘ありがとうございました。
     * 2019/7/2 公開     * 2019/7/2 公開
行 29: 行 30:
     * 4,900文と共通の100文でそれぞれシートを分けています。     * 4,900文と共通の100文でそれぞれシートを分けています。
  
-==== 利用制限・免責事項 ==== +=== 利用制限・免責事項 ===
   * このデータは[[https://creativecommons.org/licenses/by/4.0/|Creative Commons Attribution 4.0 International (CC BY 4.0)]]に基づいて再配布可能です。   * このデータは[[https://creativecommons.org/licenses/by/4.0/|Creative Commons Attribution 4.0 International (CC BY 4.0)]]に基づいて再配布可能です。
   * 研究利用の際は下記の関連文献[1]または[2]を引用いただけると助かります。   * 研究利用の際は下記の関連文献[1]または[2]を引用いただけると助かります。
  
-==== 発表文献 ==== +=== 発表文献 === 
   * [1] Akihiro Katsuta and Kazuhide Yamamoto. Crowdsourced Corpus of Sentence Simplification with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.461-466 (2018.5)   * [1] Akihiro Katsuta and Kazuhide Yamamoto. Crowdsourced Corpus of Sentence Simplification with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.461-466 (2018.5)
  
-==== フィードバック ====+=== フィードバック ===
   * 本公開に対する責任はすべて山本にあります。   * 本公開に対する責任はすべて山本にあります。
   * 本公開に関するあらゆるご意見・苦情・ご感想は山本にお送りください。   * 本公開に関するあらゆるご意見・苦情・ご感想は山本にお送りください。
  
 (感想・要望・情報提供)