Advertisement

BERTSUM-Chinese: 中文BERTSUM版本;抽取式模型的Chinese BERTSUM实现;提供示例数据和全面代码注释...

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
BERTSUM-Chinese是一款基于中文的抽取式文本摘要模型,它是原始英文BERTSUM模型的本地化版本,并提供了详尽的数据样例与代码说明。 BERTSUM中文摘要抽取代码搬砖不易,欢迎star bert-chinese-web//web小接口可以在浏览器中展示,bert-sum-dataprocess//负责数据处理,bertsum-chinese//用于模型训练。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • BERTSUM-Chinese: BERTSUMChinese BERTSUM...
    优质
    BERTSUM-Chinese是一款基于中文的抽取式文本摘要模型,它是原始英文BERTSUM模型的本地化版本,并提供了详尽的数据样例与代码说明。 BERTSUM中文摘要抽取代码搬砖不易,欢迎star bert-chinese-web//web小接口可以在浏览器中展示,bert-sum-dataprocess//负责数据处理,bertsum-chinese//用于模型训练。
  • BERTSUM: BertSum
    优质
    BERTSUM基于BERT模型,创新性地提出了适用于文本摘要任务的新方法,实现了高质量文档摘要自动生成。 BertSum模型复现。
  • BertSum: 基于微调BERT以摘要
    优质
    本文介绍了BertSum模型,通过在预训练语言模型BERT上进行编码器端到端微调,应用于文本摘要生成任务,实现高效的摘要提取。 BertSum 代码是针对纸质《Fine-tune BERT for Extractive Summarization》。新:请查看我们的更新结果(25/3/2019): 楷模ROUGE-1 ROUGE-2 ROUGE-L 变压器基线40.9 18.02 37.17 BERTSUM +分类器43.23 20.22 39.60 BERTSUM +变压器43.25 20.24 39.63 BERTSUM + LSTM 43.22 20.17 39.59 Python版本:此代码在Python3.6中运行。 软件包要求:pytorch, pytorch_pretrained_bert, tensorboardX, 多进程pyrouge 一些代码是从ONMT借来的。
  • Chinese NRE: 命名体关系,基于PyTorchBiLSTM+Attention
    优质
    Chinese NRE项目采用PyTorch框架下的BiLSTM+Attention模型进行中文文本中的人名、地名和组织机构等实体识别及其关系抽取,提升自然语言处理精度。 本项目使用Python 2.7与Pytorch 0.4.0进行中文实体关系抽取。对于不熟悉该领域的读者建议先行了解相关背景知识。该项目中使用的数据集较为稀缺,目前包含11+1种人物关系类型的数据集质量尚可但仍有改进空间。(更新)近期ybNero同学提供了一份新的数据集,详情可以在项目问题列表中查看。 示例格式如下:实体A 实体B 关系 句子。尽管名为中文实体关系抽取,项目也增加了一个英文语料库SemEval2010_task8,并进行了基本的数据预处理工作。这是个免费且公开的资源,其他优质数据集可能需要付费获取。 训练模型采用LSTM+Attention架构,特征提取利用词向量和位置信息,在运行前需先执行dat脚本进行准备。
  • ORB_SLAM2-Chinese-Annotated: ORB-SLAM2(适合初学者)
    优质
    ORB_SLAM2-Chinese-Annotated是基于ORB-SLAM2视觉SLAM库的中文注释版本,旨在帮助初学者更好地理解和使用该库。 ORB-SLAM2(中文版)于2017年1月13日进行了更新,支持OpenCV 3和Eigen 3.3;在2016年12月22日添加了AR演示功能。ORB-SLAM2是一款实时SLAM库,适用于单目、立体声及RGB-D相机,能够计算相机轨迹并生成稀疏的三维重建(对于具有真实比例的立体和RGB-D情况)。该系统能够在环路中进行实时检测,并重新定位摄像机。我们提供了在单眼模式下运行系统的实例,在立体或RGB-D模式下的实现实例同样可以找到。 此外,还提供了一个ROS节点用于处理实时单目、立体声及RGB-D流的输入数据。ORB-SLAM2支持独立于ROS环境进行编译和构建。该库还包含一个图形用户界面,允许在SLAM模式与定位模式之间切换,请参阅文档中的第九节获取更多详细信息。
  • 消解PyTorchChinese Coreference Resolution
    优质
    Chinese Coreference Resolution 是一个基于 PyTorch 的项目,专注于中文文本中的指代消解问题。该项目提供了一套完整的解决方案,包括模型训练、评估和应用等环节,旨在提升中文自然语言处理的准确性与效率。 SpanBERT用于中文共指解析(Pytorch)参考论文。预训练模型下载地址包括:中文预训练RoBERTa模型、中文预训练BERT-wwm模型和中文预训练Bert模型。 1. 代码架构: - conll.py, coreference.py, demo.py, metrics.py, utils.py - experiments.conf, requirements.txt - bert目录下包含modelling.py,optimization.py,tokenization.py - conll-2012文件夹内有scorer子文件夹以及reference-coreference-scorers和v8.01相关资源。 - data文件夹包括dev、test、train三个子文件夹,并且在pretrain_model目录下包含bert_config.json, pyt等。
  • MIT6.824-2017-Chinese: MIT 6.824分布系统
    优质
    本课程为MIT 6.824分布式系统原理与实现的官方中文版学习资料,旨在帮助学生深入理解分布式系统的概念、设计及实践。 这是我的个人学习笔记,在非计算机专业背景下撰写,可能存在较多不足之处,请各位高手指正。 6.824课程使用Go语言实现了一个简单的分布式系统,通过学习可以对分布式系统的原理有更广泛而深入的理解。在开始之前建议具备一定的计算机网络和操作系统知识基础。选择这门课的主要原因如下:分散式技能已成为后台开发者的必备能力;自从解决了GC问题后,Go语言的性能非常出色,值得深入了解。 现在正式开始吧: 进度: Lab1: MapReduce Lab2: 木筏(C部分正在建设中) 实验3: KV木筏通知 该项目已不再维护,请移步至重建后的版本。主要优化包括:工作协程的设计更加合理;解决了所有竞争条件问题,修复了随机性失败的情况。
  • 相似度、推理匹配集——Chinese SNLI MultiNli
    优质
    这段简介可以描述为:中文SNLI与MultiNli是两个重要的数据集,专注于中文文本的相似度评估、逻辑推理及语义匹配等任务,旨在促进自然语言处理领域的发展。 中文文本相似度、文本推理和文本匹配数据集包括Chinese SNLI MultiNli。
  • Chinese-Pyrosetta-源
    优质
    Chinese-Pyrosetta是一款基于Pyrosetta蛋白质设计软件的优化版源代码,专为中国用户定制,提供了更高效的蛋白质结构预测和模拟功能。 焦炉石核心PyRosetta Core中文教程由浅入深地讲解了Rosetta的基本原理及其在PyRosetta中的应用实例。本教程的贡献者包括吴炜坤、翟珂、张博文以及晶泰人工智能研发中心的一名实习生。 大纲内容如下: 零,安装与入门介绍 1. Pose与Structure IO:这部分将重点介绍如何使用PyRosetta处理结构文件,并阐述Pose对象的重要作用。 2. 能量函数与约束:本部分将详细介绍Rosetta的能量函数和物理约束。 3. 运动学与运动 章节分配成员可自行领取。 相关官方章节的进度为100%已完成,由吴炜坤负责。
  • ATSHA204A 手册(含)+ STM32F103
    优质
    本资料包含Atmel ATSHA204A安全认证芯片的数据手册,并附有详细的中文注释,同时提供STM32F103微控制器的代码实例,便于开发者理解和应用。 ATSHA204A数据手册(重要的部分我有中文注释,双击可以看到中文注释)以及STM32F103的代码示例包括IIC和单总线两种通信方式的完整代码流程。