{{:lab:customlogo.png}} [[:|言語商会]]>[[:lab:|旧研究室]] ~~NOTOC~~ ===== SNOW ===== 本研究室で作成し、一般に公開した言語資源・ツールのリストです。 * 本研究室では、日本語の言語資源群・ツール群を総称して SNOW と呼び、個別の資源・ツール(の略称、別称、英語名称)を SNOW S22 のように SNOW + ID で呼んでいます。 * ID はアルファベット1文字+数字からなり、アルファベットは内容(D:辞書、E:評価セット、S:システム、T:テキスト)を、数字は通し番号を表しています。 * 下記のうち、システムは研究室デモサイトで公開しています。 === 日本語 === ^ ID ^ 言語資源名 ^ 公開日 | ^ S24 | 日本語文法誤りチェッカー | 2020.1.15 | ^ T23 | [[t23|やさしい日本語拡張コーパス]] | 2019.7.2 | ^ S22 | ニューラル格助詞誤りチェッカー | 2019.3.8 | ^ T21 | [[t21|「れる/られる」語義付与テキスト]] | 2019.2.1 | ^ S20 | 格助詞誤りチェッカー | 2018.11.1 | ^ E19 | [[e19|話題に基づく語義曖昧性解消評価セット]] | 2018.9.10 | ^ D18 | [[d18|日本語感情表現辞書]] | 2018.7.24 | ^ D17 | [[d17|形の似ている漢字リスト]] | 2018.5.30 | ^ D16 | [[d16|やさしい日本語格フレーム]] | 2018.3.8 | ^ T15 | [[t15|やさしい日本語コーパス]] | 2018.2.27 | ^ S14 | 形の似ている漢字の誤用チェッカー | 2017.10.2 | ^ S13 | やさしい日本語チェッカー | 2017.3.9 | ^ E12 | [[e12|機械翻訳システム安定性評価セット]] | 2017.3.3 | ^ D11 | [[d11|話題分類単語辞書]] | 2016.9.26 | ^ T10 | [[t10|KFTT日本語表記統制テキスト]] | 2016.8.10 | ^ D9 | [[d9|動詞名詞対応辞書]] | 2016.4.8 | ^ D8 | [[d8|疑問詞タグ辞書]] | 2016.4.8 | ^ S7 | 表現難易度解析システム | 2016.1.19 | ^ T6 | [[t6|意味類型曖昧性解消データセット]] | 2015.3.31 | ^ D5 | [[d5|サ変動詞意味類型辞書]] | 2015.3.18 | ^ E4 | [[e4|語彙平易化評価セット]] | 2015.1.15 | ^ S3 | 語彙平易化システム | 2015.1.7 | ^ D2 | [[d2|内容語換言辞書]] | 2014.8.12 | ^ D1 | [[d1|一般動詞意味類型辞書]] | 2014.8.12 | === Vietnamese === * [[https://github.com/kanjirz50/vnlp-outline|Vietnamese NLP tools]] (Xử lý ngôn ngữ tiếng Việt) (2016.8.2) * [[dongdu|ベトナム語単語分割器 DongDu]] (2012.10) * DongDu は本研究室で作成したベトナム語の単語分割器です。LUU TUAN ANH が山本 和英の指導の元に作成し、2012年10月に公開しました。 * 開発は Linux で行い、プログラムは C++ で書かれています。 * 我々の実験では、98%以上という高い分割精度が得られており、かつこれまでに知られている分割器よりも8倍以上高速に分割することができます(2012年10月現在、世界で最も高速かつ高精度のベトナム語分割器です)。 === Tigrinya === * [[Nagaoka Tigrinya Corpus]] === システム === * [[https://github.com/kanjirz50/web-nlp-interface|NLP Web Demonstration Template]] (2016.8.5)