
关于数字化科技论文自动分类的研究(2006年)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究探讨了利用计算机技术对数字化科技论文进行自动化分类的方法与应用,旨在提高文献管理效率和科研信息检索精度。
针对科技论文的半结构化特点,我们提出了一种基于元数据的多层次分类模型。这里的元数据包括论文标题、关键词集合以及摘要等内容。实验表明,仅使用这些元数据进行分类可以达到与传统全文信息分类方法相似的效果;而如果先利用领域知识建立一个分类法,并通过元数据对文献进行粗略分类后再进一步分析全文,则可以获得比现有最优算法更高的准确度。由于元数据的规模远小于论文正文,且经过初步筛选后的每个类别中包含的文章数量也显著减少,在面对大量需要细分的类目和较为均衡分布的数据时,这种方法可以大幅提高分类效率。
全部评论 (0)
还没有任何评论哟~


