内容へ移動
自然言語処理の餅屋
https://www.jnlp.org/
ユーザ用ツール
ユーザー登録
ログイン
サイト用ツール
検索
ツール
文書の表示
以前のリビジョン
バックリンク
最近の変更
メディアマネージャー
サイトマップ
ユーザー登録
ログイン
>
最近の変更
メディアマネージャー
サイトマップ
現在位置:
自然言語処理の餅屋
»
データ
»
Wiki-40B
データ:wiki-40b
この文書は読取専用です。文書のソースを閲覧することは可能ですが、変更はできません。もし変更したい場合は管理者に連絡してください。
===== Wiki-40B ===== ^wiki40b|[[https://www.tensorflow.org/datasets/catalog/wiki40b]]| ==== Wiki-40Bとは ==== [[データ:wikipedia]]のクリーンアップテキスト(日本語を含む40言語) 。 ==== 記事 ==== * 2020-09-26 | [[https://hironsan.hatenablog.com/entry/how-to-use-wiki40b|Wikipediaの前処理はもうやめて「Wiki-40B」を使う]] * 3.16GB (1GB=5.6億文字とすれば 17.7億文字)
(感想・要望・情報提供)
· 最終更新: 2021/12/07 12:07 by
admin
ページ用ツール
文書の表示
以前のリビジョン
バックリンク
文書の先頭へ
(広告募集)