
关于基于Hadoop的抄袭检测中源代码检索的研究论文.pdf
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文探讨了在大数据环境下利用Hadoop框架进行源代码检索的技术,并提出了一种新的抄袭检测方法。
随着科学技术的进步及互联网的普及,网络在给人们带来便利的同时也催生了抄袭剽窃现象的增长。因此,抄袭检测研究已成为一个重要的课题。本段落分析了传统抄袭检测系统中源检索模块的优点与不足,并结合分布式系统的特性,提出了基于索引分片的源检索体系结构,在大规模数据集上进行有效的抄袭检测实验,以期快速识别出可疑文档的相关文集。通过实际验证表明,这种基于索引分片的源检索方法能够有效处理大规模的数据量需求,显著提升了源检索阶段的时间效率,并保证了整个抄袭检测系统的可靠性。
全部评论 (0)
还没有任何评论哟~


