
Cail2019:法研杯2019相似案例匹配解决方案(包含数据集及相关文档)-源代码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
法研杯 (CAIL 2019) 相似案例匹配任务的比赛介绍,详细信息请参考相关链接。总而言之,该比赛旨在解决法律文书相似度计算这一问题,所有参赛文书均来源于裁判文书网的真实借贷纠纷案件。具体而言,参赛者需根据提供的三个文书(A、B、C),预测其中哪一个与另一个文书最为相似。评估指标为准确率。
在项目方案中,我们最终提交的方案主要依赖于数据增强技术,并设计了一个基于孪生 BERT 模型的解决方案,并未采用模型集成策略。最终,该方案获得了比赛的第二名。
模型结构的设计如下:首先,模型采用了孪生网络架构,包含两个共享权重的 BERT 模型。这两个模型分别接收 AB 和 AC 文书作为输入,提取对应的 [CLS] 嵌入向量后进行相减运算,并将结果拼接后通过一个线性层进行分类。最后,利用交叉熵损失函数计算二分类损失值。可以理解为,通过精心设计的监督学习任务,BERT 模型能够学习到两个输入句子在不同维度上的相似度特征差异,从而实现 Cab 和 Cac 的有效区分。
全部评论 (0)
还没有任何评论哟~


