
布朗语料库(Brown Corpus)- 数据集
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
布朗语料库是一份经典英语文本数据集,包含50万单词的美国英语样本,按主题和文体分类,为语言分析、模型训练等提供基础资源。
布朗语料库是美国英语的首个文本语料库,它取自不同主题的报纸、书籍以及政府文件,包含1,014,312个单词。该语料库主要用于语言建模,并提供了cats.csv、brown-meta.json和brown.csv等数据文件。
全部评论 (0)
还没有任何评论哟~


