BERTSUM-Chinese: 中文BERTSUM版本；抽取式模型的Chinese BERTSUM实现；提供示例数据和全面代码注释...

5星

浏览量: 0

大小:None

文件类型：None

简介：
BERTSUM-Chinese是一款基于中文的抽取式文本摘要模型，它是原始英文BERTSUM模型的本地化版本，并提供了详尽的数据样例与代码说明。 BERTSUM中文摘要抽取代码搬砖不易，欢迎star bert-chinese-web//web小接口可以在浏览器中展示，bert-sum-dataprocess//负责数据处理，bertsum-chinese//用于模型训练。

全部评论 (0)

还没有任何评论哟~

客服

BERTSUM-Chinese: 中文BERTSUM版本；抽取式模型的Chinese BERTSUM实现；提供示例数据和全面代码注释...

优质

BERTSUM-Chinese是一款基于中文的抽取式文本摘要模型，它是原始英文BERTSUM模型的本地化版本，并提供了详尽的数据样例与代码说明。 BERTSUM中文摘要抽取代码搬砖不易，欢迎star bert-chinese-web//web小接口可以在浏览器中展示，bert-sum-dataprocess//负责数据处理，bertsum-chinese//用于模型训练。

BERTSUM: 模型再现 BertSum

优质

BERTSUM基于BERT模型，创新性地提出了适用于文本摘要任务的新方法，实现了高质量文档摘要自动生成。 BertSum模型复现。

BertSum: 基于代码微调BERT以提取摘要

优质

本文介绍了BertSum模型，通过在预训练语言模型BERT上进行编码器端到端微调，应用于文本摘要生成任务，实现高效的摘要提取。 BertSum 代码是针对纸质《Fine-tune BERT for Extractive Summarization》。新：请查看我们的更新结果（25/3/2019）：楷模ROUGE-1 ROUGE-2 ROUGE-L 变压器基线40.9 18.02 37.17 BERTSUM +分类器43.23 20.22 39.60 BERTSUM +变压器43.25 20.24 39.63 BERTSUM + LSTM 43.22 20.17 39.59 Python版本：此代码在Python3.6中运行。软件包要求：pytorch, pytorch_pretrained_bert, tensorboardX, 多进程pyrouge 一些代码是从ONMT借来的。

Chinese NRE: 中文命名实体关系抽取，基于PyTorch的BiLSTM+Attention模型

优质

Chinese NRE项目采用PyTorch框架下的BiLSTM+Attention模型进行中文文本中的人名、地名和组织机构等实体识别及其关系抽取，提升自然语言处理精度。本项目使用Python 2.7与Pytorch 0.4.0进行中文实体关系抽取。对于不熟悉该领域的读者建议先行了解相关背景知识。该项目中使用的数据集较为稀缺，目前包含11+1种人物关系类型的数据集质量尚可但仍有改进空间。（更新）近期ybNero同学提供了一份新的数据集，详情可以在项目问题列表中查看。示例格式如下：实体A 实体B 关系句子。尽管名为中文实体关系抽取，项目也增加了一个英文语料库SemEval2010_task8，并进行了基本的数据预处理工作。这是个免费且公开的资源，其他优质数据集可能需要付费获取。训练模型采用LSTM+Attention架构，特征提取利用词向量和位置信息，在运行前需先执行dat脚本进行准备。

ORB_SLAM2-Chinese-Annotated: ORB-SLAM2中文注释版（适合初学者）

优质

ORB_SLAM2-Chinese-Annotated是基于ORB-SLAM2视觉SLAM库的中文注释版本，旨在帮助初学者更好地理解和使用该库。 ORB-SLAM2（中文版）于2017年1月13日进行了更新，支持OpenCV 3和Eigen 3.3；在2016年12月22日添加了AR演示功能。ORB-SLAM2是一款实时SLAM库，适用于单目、立体声及RGB-D相机，能够计算相机轨迹并生成稀疏的三维重建（对于具有真实比例的立体和RGB-D情况）。该系统能够在环路中进行实时检测，并重新定位摄像机。我们提供了在单眼模式下运行系统的实例，在立体或RGB-D模式下的实现实例同样可以找到。此外，还提供了一个ROS节点用于处理实时单目、立体声及RGB-D流的输入数据。ORB-SLAM2支持独立于ROS环境进行编译和构建。该库还包含一个图形用户界面，允许在SLAM模式与定位模式之间切换，请参阅文档中的第九节获取更多详细信息。

中文指代消解的PyTorch实现：Chinese Coreference Resolution

优质

Chinese Coreference Resolution 是一个基于 PyTorch 的项目，专注于中文文本中的指代消解问题。该项目提供了一套完整的解决方案，包括模型训练、评估和应用等环节，旨在提升中文自然语言处理的准确性与效率。 SpanBERT用于中文共指解析（Pytorch）参考论文。预训练模型下载地址包括：中文预训练RoBERTa模型、中文预训练BERT-wwm模型和中文预训练Bert模型。 1. 代码架构： - conll.py, coreference.py, demo.py, metrics.py, utils.py - experiments.conf, requirements.txt - bert目录下包含modelling.py，optimization.py，tokenization.py - conll-2012文件夹内有scorer子文件夹以及reference-coreference-scorers和v8.01相关资源。 - data文件夹包括dev、test、train三个子文件夹，并且在pretrain_model目录下包含bert_config.json, pyt等。

MIT6.824-2017-Chinese: MIT 6.824分布式系统的中文版本

优质

本课程为MIT 6.824分布式系统原理与实现的官方中文版学习资料，旨在帮助学生深入理解分布式系统的概念、设计及实践。这是我的个人学习笔记，在非计算机专业背景下撰写，可能存在较多不足之处，请各位高手指正。 6.824课程使用Go语言实现了一个简单的分布式系统，通过学习可以对分布式系统的原理有更广泛而深入的理解。在开始之前建议具备一定的计算机网络和操作系统知识基础。选择这门课的主要原因如下：分散式技能已成为后台开发者的必备能力；自从解决了GC问题后，Go语言的性能非常出色，值得深入了解。现在正式开始吧：进度： Lab1: MapReduce Lab2: 木筏（C部分正在建设中）实验3: KV木筏通知该项目已不再维护，请移步至重建后的版本。主要优化包括：工作协程的设计更加合理；解决了所有竞争条件问题，修复了随机性失败的情况。

中文文本相似度、推理和匹配数据集——Chinese SNLI 和 MultiNli

优质

这段简介可以描述为：中文SNLI与MultiNli是两个重要的数据集，专注于中文文本的相似度评估、逻辑推理及语义匹配等任务，旨在促进自然语言处理领域的发展。中文文本相似度、文本推理和文本匹配数据集包括Chinese SNLI MultiNli。

Chinese-Pyrosetta-源代码

优质

Chinese-Pyrosetta是一款基于Pyrosetta蛋白质设计软件的优化版源代码，专为中国用户定制，提供了更高效的蛋白质结构预测和模拟功能。焦炉石核心PyRosetta Core中文教程由浅入深地讲解了Rosetta的基本原理及其在PyRosetta中的应用实例。本教程的贡献者包括吴炜坤、翟珂、张博文以及晶泰人工智能研发中心的一名实习生。大纲内容如下：零，安装与入门介绍 1. Pose与Structure IO：这部分将重点介绍如何使用PyRosetta处理结构文件，并阐述Pose对象的重要作用。 2. 能量函数与约束：本部分将详细介绍Rosetta的能量函数和物理约束。 3. 运动学与运动章节分配成员可自行领取。相关官方章节的进度为100%已完成，由吴炜坤负责。

ATSHA204A 数据手册（含中文注释）+ STM32F103 代码示例

优质

本资料包含Atmel ATSHA204A安全认证芯片的数据手册，并附有详细的中文注释，同时提供STM32F103微控制器的代码实例，便于开发者理解和应用。 ATSHA204A数据手册（重要的部分我有中文注释，双击可以看到中文注释）以及STM32F103的代码示例包括IIC和单总线两种通信方式的完整代码流程。

是否确定退出登录?

BERTSUM-Chinese: 中文BERTSUM版本；抽取式模型的Chinese BERTSUM实现；提供示例数据和全面代码注释...

全部评论 (0)