
Java文本相似度检测代码及示例
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目提供了一套基于Java实现的文本相似度检测工具和示例代码,适用于计算文档或句子之间的相似性。
JAVA查重算法包括多种技术:HanLP相似度比较、二叉树及DFA算法实现、敏感词处理工具以及IKAnalyzer中文分词工具,并且能够通过分词进行敏感词过滤。这些方法可以计算海明距离、余弦相似性、莱文斯坦距离、Jaccard 相似度和Sorensen Dice相似度系数,同时提供了相关的调用样例。该算法适用于毕业论文查重以及文本或坐落地址的简单学术查重等场景。
全部评论 (0)
还没有任何评论哟~


