
《利用Sentence-BERT训练个性化文本相似度模型的源代码》
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
本项目提供了一个基于Sentence-BERT框架训练个性化文本相似度模型的完整解决方案,包含详细的源代码和使用说明。
BERT 和 RoBERTa 在处理文本语义相似度等句子对的回归任务上已经达到了最先进的成果。然而,这些模型需要同时将两个句子输入到网络中进行计算,这导致了巨大的计算开销问题,并且使得它们不适用于诸如语义相似度搜索和无监督任务(例如聚类)的应用场景。
Sentence-BERT (SBERT) 网络通过使用孪生网络和三胞胎网络结构生成具有语义意义的句子embedding向量。这种设计下,语义相近的句子其embedding 向量之间的距离会比较近,从而可以利用余弦相似度、曼哈顿距离或欧氏距离等方法来进行相似度计算。
因此,SBERT 能够应用于一些新的特定任务上,例如进行相似性对比、聚类以及基于语义的信息检索。
全部评论 (0)
还没有任何评论哟~


