内容へ移動
自然言語処理の餅屋
https://www.jnlp.org/
ユーザ用ツール
ユーザー登録
ログイン
サイト用ツール
検索
ツール
ソースの表示
以前のリビジョン
バックリンク
最近の変更
メディアマネージャー
サイトマップ
ユーザー登録
ログイン
>
最近の変更
メディアマネージャー
サイトマップ
現在位置:
自然言語処理の餅屋
»
データ
»
コーパス
サイドバー
(
広告募集
)
データ:コーパス
文書の過去の版を表示しています。
目次
コーパス
コーパスとは
日本語コーパス・言語データ
コーパスツール
その他
コーパス
コーパスとは
2021-03-12 |
「コーパス」とは?自然言語を扱うAIのカラクリ
日本語コーパス・言語データ
京都大学ウェブリード文書コーパス
2019-12-19 |
KWDLC(京都大学ウェブ文書リードコーパス)を知って、意味関係解析に取り組もう
現代日本語書き言葉均衡コーパス(BCCWJ)
Wikipedia
,
Wiki-40B
CC-100: Monolingual Datasets from Web Crawl Data
- 日本語15GB
OSCAR (Open Super-large Crawled ALMAnaCH coRpus)
- huge multilingual corpus obtained by language classification and filtering of the Common Crawl corpus using the goclassy architecture
青空文庫
livedoorニュースコーパス
日本語諸方言コーパス (COJADS)
2020-08-17 |
日本語諸方言コーパスをDB化して遊ぶ (3) PHP Laravel で操作する
- Qiita
NMTデータストア
コーパスツール
#LancsBox: Lancaster University corpus toolbox
その他
The Business Scene Dialogue corpus
- GitHub
ビジネス対話シナリオ(日英)(20,000文程度)文脈を踏まえた口語表現による自然な対話文、シーンは対面会話・雑談・電話・ミーティング・研修・プレゼンの6つを想定しております。
The Abstraction and Reasoning Corpus (ARC)
- GitHub
NASDAQ 100 - Free News Intelligence Dataset Download
2020-10-10 |
The Big Bad NLP Database
(感想・要望・情報提供)
.gz · 最終更新: 2021/06/20 13:42 by
admin
ページ用ツール
ソースの表示
以前のリビジョン
バックリンク
文書の先頭へ
(広告募集)