===== アノテーション ===== [[コーパス]]作成などのために手作業で正解データを付与する作業のこと。 === アノテーションツール ==== 単一言語の要素(主に単語)に対して手作業で[[:言語:固有表現]]などを付与するツール。 ^ ツール名 | URL | 備考 | ^ brat | https://brat.nlplab.org/ | ^ doccano | https://github.com/doccano/doccano | ^ INCEpTION | https://inception-project.github.io/ | ^ Prodigy | https://prodi.gy/ | (有料) | === アライメントツール === 異なる2文に対して単語(トークン)単位で手作業で対応付けを行うツール。[[:機械翻訳]]用途だけでなく、[[:自動要約]]や[[生成:平易化]]など単一言語に対しても行う。 ^ ツール名 | URL | ^ yawat | https://github.com/ugermann/yawat | === 記事 === * 2023-02-07 | [[https://qiita.com/konbu9640/items/ea4dcb99d8e8cf0a28a5|【自然言語処理】テキストデータにラベル付けするサイトを作った]] * 2022-03-18 | [[https://ichi.pro/nlp-no-tekisuto-chushaku-ni-saitekina-muryo-no-raberutsuke-tsu-ru-145432521328219|NLPのテキスト注釈に最適な無料のラベル付けツール]] * 2021-07-26 | [[https://note.com/asahi_ictrad/n/n2201dad206bd|【自然言語処理】アノテーションがぐっと楽になる! お助けツールprodigyについて]] * 2021-01-15 | [[https://github.com/heartexlabs/awesome-data-labeling|awesome-data-labeling]] - A curated list of awesome data labeling tools * 2021-01-08 | [[https://www.st-hakky-blog.com/entry/2021/01/08/000000|自然言語処理向けのデータ作成ツールの「doccano」を使ってみたので、まとめる]]