Advertisement

已预训练的中文GPT-2模型

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
本项目包含一个基于GPT-2架构、经过大规模中文语料库训练的语言模型。它能够生成流畅且连贯的中文文本,并支持多种自然语言处理任务,如文本生成和摘要提取等。 博客介绍了训练好的中文GPT2模型的相关内容。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • GPT-2
    优质
    本项目包含一个基于GPT-2架构、经过大规模中文语料库训练的语言模型。它能够生成流畅且连贯的中文文本,并支持多种自然语言处理任务,如文本生成和摘要提取等。 博客介绍了训练好的中文GPT2模型的相关内容。
  • ELECTRA:
    优质
    Electra是谷歌推出的一种创新的文本生成与识别框架,专门用于中文等语言的预训练模型,极大提升了自然语言处理任务中的效果和效率。 ELECTRA中文预训练模型 ELECTREA:基于对抗学习的中文tiny模型 使用官方代码的具体步骤如下: 1. 修改 `configure_pretraining.py` 文件中的数据路径、TPU 和 GPU 配置。 2. 定义模型大小,在 `code/util/training_utils.py` 中自行设置。 **ELECTRA Chinese tiny 模型** - **generator**: 为 discriminator 的 1/4 - **配置说明**: 同tinyBERT 数据输入格式:原始的
  • 实践指南:(1.效果评估 2.本数据截断 3.自定义
    优质
    本书为读者提供关于文本预训练模型的实际操作指导,内容涵盖模型效果评估、文本数据处理策略及自定义模型的训练方法。 文本预训练模型实战包括三个部分:首先是对预训练模型效果进行分析;其次是处理文本数据的截断问题;最后是自定义训练预训练模型。
  • CDial-GPT:大简短对话数据集与对话
    优质
    CDial-GPT为一个专为中国用户设计的大型中文简短对话数据库及预训练模型,旨在促进高效、自然的人机对话技术发展。 CDial GPT项目提供了一个大规模的中文对话数据集,并在此基础上训练了中文GPT模型。更多信息请参考我们的文档。 该项目基于HuggingFace Pytorch库进行开发,支持预训练与微调操作。更新记录如下: 2021年2月28日:我们发布了一项新功能,欢迎各位用户报告bug并提出加速优化算法的建议以及新的数据清洗需求等。 2021年1月9日:实验室出版了新书《自然语言处理实践》,欢迎大家阅读购买。 2020年11月20日:发布了预训练模型的新工作。该研究将词级的语言学知识(包括词性和情感倾向)融入到表示模型SentiLARE中,欢迎使用并给予反馈。 2020年10月18日:我们的论文《大规模中文短文本对话数据集》在NLPCC 2020会议上荣获最佳学生论文奖。 2020年9月8日:感谢所有贡献者和用户的帮助和支持。 2020年9月2日:现在可以加载预训练模型,感谢苏剑林提供的代码支持。我们所提供的数据集LCCC(大规模汉语清洁会话)可满足多种研究需求。
  • BERT-base
    优质
    中文BERT-base预训练模型是专为中文自然语言处理设计的基础模型,通过大规模中文语料库进行无监督学习获得。该模型在多项NLP任务中表现出色,可应用于文本分类、情感分析等领域。 来源于Hugging Face官方的中文BERT预训练模型已下载并放置在国内分享。资源包含pytorch_model.bin和tf_model.h5文件。官方地址可在Hugging Face平台上找到。
  • SpeechBrain.tar
    优质
    SpeechBrain中文预训练模型.tar包含了一个专门为处理中文语音任务而优化的SpeechBrain框架预训练模型。该资源旨在促进中文语音识别、合成和理解的研究与应用发展。 官网下载不方便,原来的渠道也不好找,你可以试试这个方法,不需要下载码。
  • 官方BERT
    优质
    简介:本项目提供官方BERT中文预训练模型,支持多种中文自然语言处理任务,促进机器阅读理解、文本分类等领域的研究与应用。 Google官方提供了中文Bert预训练模型,当前使用的是bert base模型,无需担心爬梯下载的问题。如果有需要其他类型的模型,请直接私信联系。去掉具体联系方式后: Google官方发布了适用于中文的BERT预训练模型,并且目前提供的是基础版本(BERT Base)。用户可以方便地进行访问和下载而不需要额外处理或特定工具的支持。对于有特殊需求想要获取不同配置的模型,可以通过平台内的消息系统与发布者取得联系以获得进一步的帮助和支持。
  • 版XLNet:XLNet
    优质
    中文版XLNet是一款经过大规模数据训练的先进语言模型,专为理解和生成高质量的中文文本而设计,适用于多种自然语言处理任务。 本项目提供了针对中文的XLNet预训练模型,并扩展了丰富的自然语言处理资源,为用户提供多种中文预训练模型选择。我们欢迎各位专家学者下载使用并共同促进和发展中文资源建设。 该项目基于CMU/谷歌官方的XLNet开发,提供了一系列相关的预训练模型和其他工具,包括MacBERT、ELECTRA和BERT-wwm等中英文版本,并且发布了知识蒸馏工具TextBrewer。所有这些模型都已支持TensorFlow 2并通过变压器库进行调用或下载。 项目重要时间线如下: - 2021年1月27日:所有模型均已更新至TensorFlow 2。 - 2020/9/15:我们的论文被录用为长文。 - 2020/8/27:哈工大讯飞联合实验室在通用自然语言理解评论GLUE中取得了第一名的成绩。 - 2020/3/11:为了更好地了解用户需求,我们邀请大家填写反馈表单以提供更好的资源和服务。 此外,在项目开发过程中还发布了一些历史新闻和模型更新信息。
  • RoBERTa_roberta_zh.zip
    优质
    简介:RoBERTa_Zh是RoBERTa模型的中文版本,基于大规模语料库进行预训练,适用于各种自然语言处理任务。该模型以.zip文件形式提供下载,方便用户快速集成到项目中使用。 RoBERTa中文预训练模型(roberta_zh)是一款针对中文文本的优化版本,基于Facebook开源的RoBERTa架构进行改进与扩展,以更好地适应汉语语境下的自然语言处理任务。