===== Wikipedia ===== ^Wikipedia(ダウンロード)|[[https://ja.wikipedia.org/wiki/Wikipedia:%E3%83%87%E3%83%BC%E3%82%BF%E3%83%99%E3%83%BC%E3%82%B9%E3%83%80%E3%82%A6%E3%83%B3%E3%83%AD%E3%83%BC%E3%83%89|ja.wikipedia.org/wiki/Wikipedia:データベースダウンロード]]| ^Preprocessed files generated from Japanese Wikipedia as of 2022-04-04|https://github.com/singletongue/wikipedia-utils/releases/tag/2022-04-04| ==== 記事 ==== * 2021-06-17 | [[https://akito-fujita.hatenablog.com/entry/2021/06/17/113553|Turing Bot(1)Wikipediaページからのトークン抽出]] * 2020-03-23 | [[https://qiita.com/YuukiMiyoshi/items/aee751a1055144adb18c|【自然言語処理のためのWikipediaデータの扱い方(#1) 】Wikipedia記事DBの作成]] ==== 関連ページ ==== * [[データ:コーパス]] * [[データ:wiki-40b]]