
使用Bag of Words(词袋模型)的压缩文件。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本演示程序致力于基于BOW原理对图像进行分类,并能够对已测试的图像集执行BoW(Bag of Words)词袋模型查找。最初,该词袋模型主要应用于文本分类,旨在将文档表示为特征向量。其核心理念在于,对于一篇文本而言,应忽略其词序和语法结构,仅仅将其视为一系列独立的词汇集合。换句话说,每篇文档都被视为一个包含各种词汇的“袋子”,并分析其中包含的词汇种类,从而进行分类。例如,如果一篇文档中“猪”、“马”、“牛”、“羊”、“山谷”、“土地”、“拖拉机”等词汇出现频率较高,而“银行”、“大厦”、“汽车”、“公园”等词汇出现频率较低,则我们更有可能判断其内容描绘的是乡村风光而非城镇景象。
在`searchFeatures.py`文件中,主要实现通过解析功能(parse)来支持命令行参数的传递;随后则进行SIFT特征提取、聚类运算、TF-IDF计算以及单词直方图生成,最后再应用L2归一化处理。由于通常情况下,单幅图像中提取的SIFT特征点数量众多,尤其是在处理大型图像库时更是如此,直接进行聚类运算会面临极大的困难(包括内存不足和计算速度缓慢),因此为了应对这个问题,可以在聚类过程中先对SIFT特征点进行降采样处理,从而牺牲一定的检索精度。最后将一些在在线查询过程中常用的变量保存下来。此外, `query.py`只能一次性查找一张图片并返回与之匹配度最高的前6张图片。
全部评论 (0)
还没有任何评论哟~


