言語商会

言語商会旧研究室

SNOW

本研究室で作成し、一般に公開した言語資源・ツールのリストです。

  • 本研究室では、日本語の言語資源群・ツール群を総称して SNOW と呼び、個別の資源・ツール(の略称、別称、英語名称)を SNOW S22 のように SNOW + ID で呼んでいます。
  • ID はアルファベット1文字+数字からなり、アルファベットは内容(D:辞書、E:評価セット、S:システム、T:テキスト)を、数字は通し番号を表しています。
  • 下記のうち、システムは研究室デモサイトで公開しています。

日本語

ID 言語資源名 公開日
S24 日本語文法誤りチェッカー 2020.1.15
T23 やさしい日本語拡張コーパス 2019.7.2
S22 ニューラル格助詞誤りチェッカー 2019.3.8
T21 「れる/られる」語義付与テキスト 2019.2.1
S20 格助詞誤りチェッカー 2018.11.1
E19 話題に基づく語義曖昧性解消評価セット 2018.9.10
D18 日本語感情表現辞書 2018.7.24
D17 形の似ている漢字リスト 2018.5.30
D16 やさしい日本語格フレーム 2018.3.8
T15 やさしい日本語コーパス 2018.2.27
S14 形の似ている漢字の誤用チェッカー 2017.10.2
S13 やさしい日本語チェッカー 2017.3.9
E12 機械翻訳システム安定性評価セット 2017.3.3
D11 話題分類単語辞書 2016.9.26
T10 KFTT日本語表記統制テキスト 2016.8.10
D9 動詞名詞対応辞書 2016.4.8
D8 疑問詞タグ辞書 2016.4.8
S7 表現難易度解析システム 2016.1.19
T6 意味類型曖昧性解消データセット 2015.3.31
D5 サ変動詞意味類型辞書 2015.3.18
E4 語彙平易化評価セット 2015.1.15
S3 語彙平易化システム 2015.1.7
D2 内容語換言辞書 2014.8.12
D1 一般動詞意味類型辞書 2014.8.12

Vietnamese

  • Vietnamese NLP tools (Xử lý ngôn ngữ tiếng Việt) (2016.8.2)
    • DongDu は本研究室で作成したベトナム語の単語分割器です。LUU TUAN ANH が山本 和英の指導の元に作成し、2012年10月に公開しました。
    • 開発は Linux で行い、プログラムは C++ で書かれています。
    • 我々の実験では、98%以上という高い分割精度が得られており、かつこれまでに知られている分割器よりも8倍以上高速に分割することができます(2012年10月現在、世界で最も高速かつ高精度のベトナム語分割器です)。

Tigrinya

システム

 (感想・要望・情報提供)