
真实的Corel-5K图像库 标准训练集和测试集
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
真实的Corel-5K图像库提供了一个包含五千张图片的标准数据集合,用作计算机视觉与机器学习领域中的训练及测试资源。该库旨在促进图像识别、分类等技术的研发工作。
深圳电信培训中心的徐海蛟博士使用真正的Corel-5K图像数据集进行教学。该数据集包含科雷尔(Corel)公司收集整理的5000张图片,因此命名为Corel-5K。学生可以利用这些图片来进行科学图像实验,如分类和检索等。
Corel-5k是用于图像标注实验的事实标准数据集,并且被广泛应用于比较不同算法在性能上的表现。该库由五十个CD组成,每个包含10张大小相等的图片(共500张),涵盖多个主题领域,例如公共汽车、恐龙和海滩等等。
Corel-5k通常会被分成三个部分:4,000幅图像作为训练集;500幅用于调整模型参数的验证集以及剩余的500个用来评估算法性能。在找到最优模型参数后,这4,500张图片(即之前的训练和验证集合)将被混合在一起重新构成一个新的更大的训练数据集。
每一张Corel-5K中的图像都被标注了1到5个关键词,在整个数据库中总共有374种不同的标签。在测试集中,则使用263个这些标签进行评估算法性能的实验。
学生可以自行从图片中提取各种低级视觉特征,例如RGB、Lab颜色空间、HSV色彩模型、SIFT(尺度不变特征变换)、GIST和HOG等,并利用svm(支持向量机)、knn(K近邻算法)、adaboost(自适应增强学习) 逻辑回归、随机森林以及MIML-SVM, MIML-KNN, MIML-Boost等多种机器学习方法来进行多类与多标签的实验。
全部评论 (0)
还没有任何评论哟~


