内容へ移動
自然言語処理の餅屋
https://www.jnlp.org/
ユーザ用ツール
ユーザー登録
ログイン
サイト用ツール
検索
ツール
ソースの表示
以前のリビジョン
バックリンク
最近の変更
メディアマネージャー
サイトマップ
ユーザー登録
ログイン
>
最近の変更
メディアマネージャー
サイトマップ
現在位置:
自然言語処理の餅屋
»
データ
»
Wiki-40B
サイドバー
(
広告募集
)
データ:wiki-40b
目次
Wiki-40B
Wiki-40Bとは
記事
Wiki-40B
wiki40b
https://www.tensorflow.org/datasets/catalog/wiki40b
Wiki-40Bとは
Wikipedia
のクリーンアップテキスト(日本語を含む40言語) 。
記事
2020-09-26 |
Wikipediaの前処理はもうやめて「Wiki-40B」を使う
3.16GB (1GB=5.6億文字とすれば 17.7億文字)
(感想・要望・情報提供)
· 最終更新: 2021/12/07 12:07 by
admin
ページ用ツール
ソースの表示
以前のリビジョン
バックリンク
文書の先頭へ
(広告募集)