Stanford Dogs Dataset是专为图像分类及目标检测设计的数据集,包含超过20,000张狗的照片,按200个品种分类,并采用VOC格式标注。
斯坦福犬类数据集是一个专注于细粒度图像分类研究的图像集合,包含120种不同犬种共计20,580张图片。这些图片是从ImageNet数据库中精选而来,旨在帮助研究人员解决犬种间细微差异的分类问题。该数据集提供了类别标签和边界框注释信息,以支持图像识别和分析任务。
研究者可以在斯坦福大学人工智能实验室的网页上找到数据集的相关资源及更多信息。如果在学术出版物中使用了这个数据集,则应引用以下文献:
Aditya Khosla等人,《用于细粒度图像分类的新数据集》,《细粒度视觉分类研讨会(FGVC)》, IEEE计算机视觉与模式识别会议(CVPR),2011年。
J. Deng等人,《ImageNet:大规模层级图像数据库》,IEEE计算机视觉与模式识别会议(CVPR),2009年。
此外,数据集的灵感图片由摄影师Hannah Lim在Unsplash上提供。这个数据集不仅是计算机视觉领域的一个宝贵资源,也是对犬种识别能力的一项挑战,特别是对于那些外观极为相似的犬种,例如巴塞特猎犬和寻血猎犬或是不同年龄阶段的吉娃娃。
个人处理时将图像数据与xml格式的目标检测标签分开。