研究内容‎ > ‎

やさしい日本語(研究まとめ)

研究概要

本研究室では2010年から自然言語処理の立場で「やさしい日本語」の研究を行っています。特に、やさしい日本語への自動変換(日本語平易化)の研究を進めています。

主な研究成果
  • やさしい日本語換言辞書を作成しました(2018年3月)。
    • 下記の SNOW T15 で出現しない単語に対して、やさしい日本語語彙(2,000語)の範囲で書き換えた換言辞書を作成しました。この辞書も将来的に一般公開します。参考文献:[15]
  • やさしい日本語対訳コーパスを拡張しました(2018年3月)。
    • 下記の SNOW T15と同様の作業を他の文に対して行い、規模を拡大させました。このコーパスも将来一般公開します(公開予定は未定)。参考文献:[16]
  • やさしい日本語対訳コーパス (SNOW T15)を公開しました(2018年2月)。
    • 5万文に対して上記2,000語の語彙で書き換えています。参考文献:[12] [17]
  • やさしい日本語チェッカー (SNOW S13)を公開しました(2017年3月)。
    • 研究室独自に定義した2,000語が入力文中にどの程度含まれているかを瞬時に視覚化します。参考文献:[12]
  • 語彙平易化システムを公開しました(2015年1月)。
    • 入力文中の難しい単語を平易な単語に置き換えるシステムです。参考文献:[10]
  • 語彙平易化評価セットを公開しました(2015年1月)。
    • このデータを用いることで語彙平易化の自動評価が可能になります。参考文献:[9] [11]
外部発表

※下記原稿はすべて国際会議研究会大会のページでダウンロードできます。
  • [17] Takumi Maruyama and Kazuhide Yamamoto. Simplified Corpus with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.1153-1160 (2018.5)
  • [16] Akihiro Katsuta and Kazuhide Yamamoto. Crowdsourced Corpus of Sentence Simplification with Core Vocabulary. The 11th International Conference on Language Resources and Evaluation (LREC 2018), pp.461-466 (2018.5)
  • [15] 角張 竜晴, 山本 和英. クラウドソーシングによる大規模なやさしい日本語換言辞書の構築. 言語処理学会第24回年次大会, pp.508-511 (2018.3)
  • [14] 角張 竜晴, 山本 和英. やさしい日本語格フレームの構築による係り受け解析. 言語処理学会第24回年次大会, pp.777-780 (2018.3)
  • [13] Takumi Maruyama and Kazuhide Yamamoto. Sentence Simplification with Core Vocabulary. Proceedings of the International Conference on Asian Language Processing (IALP 2017), pp.363-366 (2017.12)
  • [12] ⼭本 和英, 丸⼭ 拓海, ⾓張 ⻯晴, 稲岡 夢⼈, ⼩川 耀⼀朗, 勝⽥ 哲弘, 髙橋 寛治. やさしい日本語対訳コーパスの構築. 言語処理学会第23回年次大会, pp.763-766 (2017.3)
  • [11] Tomoyuki Kajiwara and Kazuhide Yamamoto. Evaluation Dataset and System for Japanese Lexical Simplification. Proceedings of the ACL-IJCNLP 2015 Student Research Workshop (ACL SRW 2015), pp.35-40, DOI:10.3115/v1/P15-3006 (2015.7)
  • [10] 梶原 智之, 山本 和英. 日本語の語彙平易化システムの構築. 情報処理学会第77回全国大会, Vol.2, pp.167-168 (2015.3)
  • [9] 梶原 智之, 山本 和英. 日本語の語彙平易化評価セットの構築. 言語処理学会第21回年次大会, pp.501-504 (2015.3)
  • [8] 梶原 智之, 山本 和英. 高頻度語は平易語なのか?. NLP若手の会 第9回シンポジウム, (発表P02) (2014.9)
  • [7] Tomoyuki Kajiwara, Hiroshi Matsumoto and Kazuhide Yamamoto. Selecting Proper Lexical Paraphrase for Children. Proceedings of The 25th Conference on Computational Linguistics and Speech Processing (ROCLING 2013), pp.59-73 (2013.10)
  • [6] 梶原 智之, 山本 和英. 小学生の読解支援に向けた語釈文から語彙的換言を選択する手法. NLP若手の会 第8回シンポジウム, (発表23) (2013.9)
  • [5] 杢真奈見, 山本 和英. 「やさしい日本語」変換システムの試作. 言語処理学会第19回年次大会, pp.678-681 (2013.3)
  • [4] 梶原 智之, 山本和英. 小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価. 言語処理学会第19回年次大会, pp.272-275 (2013.3)
  • [3] Manami Moku, Kazuhide Yamamoto and Ai Makabi. Automatic Easy Japanese Translation for information accessibility of foreigners. Proceedings of Coling-2012 Workshop on Speech and Language Processing Tools in Education (SLP-TED), pp.85-90 (2012.12)
  • [2] 梶原 智之, 山本 和英. 小学生の読解支援に向けた語釈文による換言. NLP若手の会 第7回シンポジウム, (発表1) (2012.9)
  • [1] 杢真奈見, 山本和英. 「やさしい日本語」のための語彙制限の検討. 言語処理学会第18回年次大会, pp.209-212 (2012.3)

研究助成(科研費)

  • H29-31挑戦的研究(萌芽), やさしい日本語化実証実験による言語資源構築と自動平易化システムの試作, 代表者:山本和英
  • H25-28基盤(A), やさしい日本語を用いた言語的少数者に対する言語保障の枠組み策定のための総合的研究, 代表者:庵 功雄
  • H22-25基盤(A), やさしい日本語を用いたユニバーサルコミュニケーション社会実現のための総合的研究, 代表者:庵 功雄
Comments