
该模型基于PyTorch框架,并采用中文语义相似度匹配技术,包括ABCNN、Albert、Bert、BIMPM、Decompo...等。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目将持续进行完善和升级,旨在对当前行业内领先的文本匹配模型在中文环境下的表现进行全面比较。运行环境要求配置为Python 3.7,PyTorch 1.2,以及 Transformers 2.5.1。数据集采用LCQMC数据集,该数据集通过对句子对进行分类,以判断两个句子是否具有相同的语义含义(这是一个二分类任务)。由于数据集可能涉及敏感内容,因此不提供直接下载,若有需求者可向官方渠道提交数据申请。请将解压后的数据文件放置至指定的“数据文件夹”中。模型评估指标主要包括准确率(ACC)、AUC值以及预测过程的总耗时。在嵌入方面,本项目采用统一的分词策略,并利用维基百科的中文语料库训练字向量作为嵌入表示。同时,我们也提供了训练语料、矢量模型和词表等资源,可通过百度网盘进行下载。具体链接如下:链接:[链接] 提取码:s830;模型文件下载链接:[链接] 提取码:s830。此外,我们提供了模型训练结果的测试集对比分析,包括行政协调会AUC指标以及预测过程的耗时(s)。
全部评论 (0)
还没有任何评论哟~


