Advertisement

tBERT代码:源自ACL 2020论文的实现

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
tBERT是基于ACL 2020论文开发的开源代码库,旨在提供一种改进的BERT模型变体,适用于特定任务的自然语言处理。 tBERT 该存储库提供了论文“ tBERT:用于语义相似性检测的主题模型和BERT联合力”的代码。设置下载预训练的BERT,在主目录中创建缓存文件夹: ```bash cd ~ mkdir tf-hub-cache ``` 进入缓存文件夹后,下载并解压缩预训练的BERT模型: ```bash cd tf-hub-cache wget https://storage.googleapis.com/bert_models/2018_10_18/uncased_L-12_H-768_A-12.zip unzip uncased_L-12_H-768_A-12.zip ``` 下载预处理数据,转到tBERT存储库: ```bash cd /path/to/tBERT/ ``` 从仓库中获取主题模型和原始数据集: ```bash wget https://www.dropbox.com/s/6p26mkwv62677zt/original_data.tar.gz ``` 解压下载的文件。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • tBERTACL 2020
    优质
    tBERT是基于ACL 2020论文开发的开源代码库,旨在提供一种改进的BERT模型变体,适用于特定任务的自然语言处理。 tBERT 该存储库提供了论文“ tBERT:用于语义相似性检测的主题模型和BERT联合力”的代码。设置下载预训练的BERT,在主目录中创建缓存文件夹: ```bash cd ~ mkdir tf-hub-cache ``` 进入缓存文件夹后,下载并解压缩预训练的BERT模型: ```bash cd tf-hub-cache wget https://storage.googleapis.com/bert_models/2018_10_18/uncased_L-12_H-768_A-12.zip unzip uncased_L-12_H-768_A-12.zip ``` 下载预处理数据,转到tBERT存储库: ```bash cd /path/to/tBERT/ ``` 从仓库中获取主题模型和原始数据集: ```bash wget https://www.dropbox.com/s/6p26mkwv62677zt/original_data.tar.gz ``` 解压下载的文件。
  • Flat-Lattice-Transformer: ACL 2020
    优质
    Flat-Lattice-Transformer是ACL 2020的一篇论文提出的创新模型,该模型引入了一种新颖的扁平化格结构,显著提升了大规模序列到序列任务中的性能与效率。此条目提供相关代码资源链接。 平面变压器ACL 2020论文的代码:FLAT使用平格变压器进行中文命名实体识别(NER)。模型及结果可在我们的ACL 2020文件中找到。 所需环境: - Python: 3.7.3 - PyTorch: 1.2.0 - FastNLP: 0.5.0 - Numpy: 1.16.4 如何运行代码? 下载字符嵌入和单词嵌入。具体包括:字符及Bigram嵌入(gigaword_chn.all.a2b.{uni或bi}.ite50.vec);词(格)嵌入,如yj(ctb.50d.vec) 或 ls(sgns.merge.word.bz2)。 步骤: 1. 修改paths.py以添加预训练的嵌入和数据集。 2. 运行以下命令:python preprocess.py 若需在MSRA NER 数据集中进行FLAT模型的训练,可使用 --clip_msra 参数。
  • NeuralCodeSum: ACL 2020 摘要正式发布与
    优质
    《NeuralCodeSum》是ACL 2020发表的一篇重要论文,介绍了一种新颖的神经网络模型用于生成高质量的源代码摘要。该研究为程序理解及自动化开发提供了新思路。 基于变压器的源代码汇总方法在ACL 2020关于源代码摘要的论文中有正式实施。 安装C2NL软件包可以是一个选择。这个工具需要Linux操作系统以及Python 3.6或更高版本的支持,并且还需要安装PyTorch 1.3版。其他依赖项可以在requirements.txt文件中找到,强烈建议使用CUDA以提高运行速度,尽管这不是必需的。 要开始,请通过以下命令克隆存储库并安装C2NL: ``` git clone https://github.com/wasiahmad/NeuralCodeSum.git cd NeuralCodeSum; pip install -r requirements.txt; python setup.py develop ``` 我们提供了基于RNN的序列到序列(Seq2Seq)模型和我们的Transformer模型。要进行训练或评估,请先转至与目标数据集相关的文件夹中操作。
  • OGNet: CVPR 2020《老是黄金》
    优质
    简介:本文档提供了CVPR 2020论文《老是黄金》中的算法代码实现,旨在帮助研究者复现和理解该工作。项目名称为OGNet。 古老就是黄金:重新定义对抗性学习的分类器训练方法(CVPR 2020) 该代码最初是使用Python3.5构建的,但鉴于此版本已达到其生命周期终点(EOL),现在已在Python 2.7上对该代码进行了验证。执行Train.py文件作为进入整个程序的主要入口点。 请按照“dataset.txt”文档中的指示,在“数据”目录下放置训练和测试图像。在第一阶段,请使用opts.py设置必要的选项;而在第二阶段,则需通过opts_fine_tune_discriminator.py进行相应配置。 在此之前,评估功能仅依赖于test.py文件的执行来完成。然而,对于当前版本而言,无需单独运行test.py脚本,因为代码内部每次调用时都会自动执行测试函数以对比基线和OGNet的结果。
  • 优质
    本论文详细探讨了研究课题中相关算法和模型的设计理念,并着重描述了如何高效、准确地将理论转化为实践,包括编程技巧、调试方法及优化策略等关键技术点。通过详实的代码示例与实验结果,验证了所提出的方法的有效性和创新性。 论文《Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme》的代码实现涉及根据一种新的标记方案同时提取实体和关系的方法。这一方法在处理自然语言数据时能够有效提高信息抽取的效果,特别是在需要识别文本中多个实体及其相互间复杂关联的应用场景下更为显著。通过采用新颖的标签体系,该研究不仅简化了模型的设计与训练过程,还提升了系统的灵活性及适应性,使其能够在不同领域和任务之间轻松切换应用。
  • SememePSO-Attack: ACL 2020《单词级本对抗攻击组合优化方法》与数据
    优质
    SememePSO-Attack是ACL 2020论文提出的一种针对单词级文本对抗攻击的组合优化方法,旨在通过粒子群算法改进文本扰动策略。该项目提供了相关代码和数据资源。 SememePSO攻击ACL 2020论文“作为组合优化的单词级文本对抗攻击”的代码和数据。如果发现有帮助,请引用我们的论文。 @inproceedings{zang2020word, title={Word-level Textual Adversarial Attacking as Combinatorial Optimization}, author={Zang, Yuan and Qi, Fanchao and Yang, Chenghao and Liu, Zhiyuan and Zhang, Meng and Liu, Qun and Sun, Maosong}, booktitle={Proceedings of ACL}, year={2020}} 该存储库主要由袁Yuan和杨成浩贡献。要求使用tensorflow-gpu == 1.14。
  • JSENet: ECCV 2020-JSENet
    优质
    JSENet是ECCV 2020上发表的一篇论文的工作实现,旨在解决特定计算机视觉问题。该网络采用先进的架构和算法,以提高模型性能和效率。 JSENet:3D点云的联合语义分割和边缘检测网络介绍(ECCV2020论文)。如果我们的工作对您的研究有所帮助,请考虑引用: @inproceedings{hu2020jsenet, title={JSENet: Joint Semantic Segmentation and Edge Detection Network for 3D Point Clouds}, author={Hu, Zeyu and Zhen, Mingmin and Bai, Xuyang and Fu, Hongbo and Tai, Chiew-lan}, booktitle={Proceedings of the European Conference on Computer Vision (ECCV)}
  • 控制理与MATLAB
    优质
    本书《现代控制理论与MATLAB实现》提供了一系列基于MATLAB编程语言的实用源代码示例,深入浅出地讲解了现代控制理论的核心概念及其在实际工程问题中的应用方法。通过丰富的案例和详尽的解释,读者能够更好地理解和掌握如何使用MATLAB进行控制系统的设计、分析及仿真工作。 本段落介绍应用现代控制理论进行系统分析和综合的方法,并探讨如何使用MATLAB编程与计算来实现这些方法。
  • 算法MATLAB
    优质
    本资源包含多种经典图论算法在MATLAB中的实现源代码,如最短路径、最小生成树等,适用于科研与学习。 本段落介绍了一些图论算法及其在MATLAB中的实现方法,包括计算给定图的最小费用最大流、图的中心和加权中心算法以及图的连通性计算等程序的源代码。
  • PointDAN: NeurIPS 19 PointDAN
    优质
    PointDAN是基于NeurIPS 2019论文开发的一个代码库,专注于领域适应中的点云数据处理,旨在通过深度学习方法减少源域和目标域间的分布差异。 资源浏览查阅110次。PointDAN是NeurIPS 2019论文的代码,“PointDAN,3D转移学习-PointDAN”此存储库包含我们NeurIPS 2019论文的源代码和数据集,介绍域适应(DA)方法在广泛的机器学习中的应用。更多下载资源、学习资料请访问相关平台获取。