Advertisement

Open Images Dataset: 包含约900万张图像的数据集,每张图像均带有图像级别标签及涵盖数千种类别的边界框标注...

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
Open Images Dataset是一个庞大的视觉数据集合,包含近900万张图片,每一张都附有详细的图像级标签和数千种类别的精确边界框标注。 “开放图像”数据集包含约900万个URL的图片,并且这些图片被标注了超过6000个类别。此页面提供了Open Images Dataset的数据下载指引。 CVDF托管在打开图像数据集V4/V5中的图像是具有边界框注释的一部分,它们包含了完整的图像子集并对其进行了实例分割和视觉关系的标注。所有这些图片被划分为训练(1,743,042张)、验证(41,620张)以及测试(125,436张)三个集合。其中,训练集合用于了2018年及2019年的开放图像挑战赛。 这些图片的最长边被重新调整为最多拥有1024个像素,并且保持原始长宽比不变。整个数据集大小达到了约561GB。用户可以直接从CVDF AWS S3云存储桶下载至本地目录中:s3://open-images-dataset

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Open Images Dataset: 900...
    优质
    Open Images Dataset是一个庞大的视觉数据集合,包含近900万张图片,每一张都附有详细的图像级标签和数千种类别的精确边界框标注。 “开放图像”数据集包含约900万个URL的图片,并且这些图片被标注了超过6000个类别。此页面提供了Open Images Dataset的数据下载指引。 CVDF托管在打开图像数据集V4/V5中的图像是具有边界框注释的一部分,它们包含了完整的图像子集并对其进行了实例分割和视觉关系的标注。所有这些图片被划分为训练(1,743,042张)、验证(41,620张)以及测试(125,436张)三个集合。其中,训练集合用于了2018年及2019年的开放图像挑战赛。 这些图片的最长边被重新调整为最多拥有1024个像素,并且保持原始长宽比不变。整个数据集大小达到了约561GB。用户可以直接从CVDF AWS S3云存储桶下载至本地目录中:s3://open-images-dataset
  • 舌苔512x512LabelMe
    优质
    本数据集包含两千余张512x512像素的舌苔图像及其LabelMe详细标注,为医学影像分析和机器学习研究提供丰富资源。 这是一个关于中医舌诊的数据集,包含了2000多张512x512像素的图像,用于研究和分析不同类型的舌苔特征。在中医诊断中,通过观察舌苔的颜色、质地和厚度等特征可以推断人体健康状况。此数据集非常适合开发和训练深度学习模型,例如使用Python、PyTorch或TensorFlow进行图像识别与分类任务。 以下是该数据集的主要组成部分: 1. **原图**:未经处理的舌苔图片,尺寸为512x512像素,高分辨率保证了细节保留,并有助于提高模型的识别准确性。 2. **Labelme标签**:每张图片都使用开源图像标注工具Labelme进行了标记。每个图像文件附带XML格式的标注数据,详细描述舌苔的颜色、分布和厚度等信息。 接下来是相关技术术语: - **数据集**:这是一个专门为机器学习与深度学习准备的数据集合,可用于模型训练及验证。创建高质量的数据集需考虑其规模、多样性以及平衡性。 - **Python**:一种广泛应用于数据分析和机器学习领域的编程语言,拥有众多库支持(如Pandas, NumPy)用于数据预处理,并提供Scikit-learn等工具构建与优化算法。 - **PyTorch & TensorFlow**:这两个框架是目前最流行的深度学习平台。它们提供了高级API来创建神经网络模型,分别采用动态计算图和静态计算图的方式支持各种任务如图像分类、目标检测等。 下面列举了一些数据集中的舌苔类型: - 黑色舌苔(black tongue coating)——可能与体内湿寒、血液循环不畅或毒素积累有关。 - 地图状舌苔(map tongue coating)——表现为局部剥落,通常提示消化系统问题或营养不良。 - 白腻厚舌苔(white and greasy thick fur)——暗示体内湿气过重及脾胃功能异常。 - 紫色舌苔(purple tongue coating)——可能与血液循环障碍相关,如血瘀现象。 - 红腻厚舌苔(red and greasy thick fur)——提示内热、湿热或心火旺盛的情况。 - 黄腻红舌苔(yellow and red thick fur)——通常表明肝火旺盛和体内湿气过重的问题。 实际应用中,可以利用这些图像训练深度学习模型实现自动化的舌诊识别任务。通过数据预处理技术如归一化、裁剪或增强来提升模型性能,并构建卷积神经网络(CNN)。使用反向传播算法优化权重参数后,在测试集上评估模型效果并进行交叉验证和超参调优以提高准确率。 此舌苔数据集为中医舌诊的数字化与自动化提供了宝贵资源,结合Python及深度学习框架有望推动医疗图像识别技术的发展。
  • 大豆子缺陷5,500
    优质
    本数据集包含约5,500张带有标签的大豆种子缺陷图像,旨在支持机器学习模型识别大豆种子的各种瑕疵类型。 大豆种子缺陷图像分类数据集【已标注,约5,500张数据】 分类个数:5(破碎、完整、斑点等)【详细类别请查看json文件】 该数据集已经划分了训练集与测试集,并分别存放各自同一类别的图片。如需可视化数据集,请运行资源中的show脚本。 有关图像分类网络改进的内容,可参考相关博客文章;同时也有一个完整的计算机视觉项目可供学习和参考。
  • 害虫样本156片)
    优质
    这是一个包含15种不同类别害虫的小型图像数据集,每类害虫大约有6张高质量照片,非常适合用于害虫识别的研究和模型训练。 害虫图片样品数据集包含15种类别,每类大约有6张图片。
  • CattleBreed90个品50
    优质
    CattleBreed数据集包含来自全球各地的90种不同牛的品种图片,每个类别包括50幅高质量图像,为研究和机器学习提供丰富资源。 包含的类别有:Abondance奶牛、Afrikaner阿非利卡牛、Albera阿尔伯拉、American Milking Devon美国产奶德文郡牛、Angus安格斯牛、Ankole Watusi恩科尔·瓦图西牛、Aquitaine阿基坦牛、Argentine阿根廷红牛、Armorican奥马里克纳牛、Arouquesa阿罗奎萨牛、Asturian阿斯图里亚斯奶牛、Australian Braford澳大利亚布拉福德杂交品种、Bargur巴尔古尔奶牛、Barzona巴佐娜肉用母系改良品种、Bazadaise巴斯达兹雌性繁殖体系牛种、Belgian比利时蓝牛、Belmont贝尔蒙特杂交品种、Black Hereford黑色赫里福牛种、Blonde Aquitaine浅色阿基坦牛种、Boran博尔安牛种、Braford布拉福德混血品种、Brahman瘤牛(印度水牛)、Brangus布兰格斯混合品种(布尔曼与安格斯的杂交)、Braunvieh棕瑞士奶牛、Brava布拉瓦肉用母系改良品种、Brown Swiss棕色瑞士奶牛、Burlina伯利纳乳肉兼用型牛种、Busa布萨肉牛品系、Cachena卡赫娜乳肉兼用品种、Camargue卡马尔格沼泽湿地牛种、Canadian Speckle加拿大斑点母系改良品种(Speckle Park)、Canadienne加拿大原始奶牛、Canchim坎奇姆杂交品种(Canchim为Nelore与Hereford或Angus的混血)、Caracu卡拉库肉用乳用兼备型种牛、Casta卡斯塔母系改良品种、Charolais夏洛来红白花色大型肉牛品系、Chianina奇安纳意大利巨型屠宰用公牛品系、Corriente科里恩特西班牙斗牛场上的赛跑牛种(也用于肉类生产)、Corsican科西嘉乳牛肉兼用型品种、Criollo克里奥罗南美原生奶牛或肉牛品系、Dangi达尼格印度地方性肉牛品种、Danish Red丹麦红牛、Deoni德昂尼印度次大陆的本地化水牛种群之一(用于生产牛奶和肉类)、Devon德文郡乳用母系改良品种及小型多用途奶牛,也被称为“Rouge des Prés”、“Lodge Park Devon”,或“North Devon”等名称、Dexter戴克斯特爱尔兰矮小型肉牛与乳用兼备的原始遗传资源品系(常用于家庭农场)、Dhannir达尼尔印度水牛品种、Droughtmaster抗旱大师澳大利亚杂交改良品种,结合了婆罗门和约克夏特征以适应干旱环境、Dutch Belted荷兰带状奶牛也被称为“Belted Galloway”,是一种乳用母系改良的品种。
  • MSRA1000真实片)
    优质
    本MSRA图像数据集包含了1000张具备精准注释的真实世界图片,为计算机视觉领域的研究提供了宝贵的资源。 MSRA数据库用于评估图像显著性检测算法的性能。该数据库包含真实标记的数据集,可以用来进行对比分析和定量效果测量。
  • 狗狗20180照片)
    优质
    本数据集包含3600张高质量图片,涵盖20种不同犬种,每个类别均有180幅图像,适用于深度学习模型训练和测试。 训练狗狗进行分类识别可以通过参考视频教程来学习。例如,在B站上有一个关于如何训练狗狗的视频(原链接:https://www.bilibili.com/video/av33504629),这个视频提供了详细的指导和技巧,可以帮助你更好地理解和实践这一过程。
  • 11常见动物【已7000片】
    优质
    这是一个包含了大约7000张图片的数据集,涵盖了11种常见的动物种类,并且每一张图片都已经进行了详细的标注。非常适合用于图像分类的研究和学习。 11种常见动物图像分类数据集【已标注,约7000张数据】 该数据经过预处理,可以直接作为分类网络的输入使用。 包含的类别有【11】:狗、牛、羊、老虎、猪等(具体查看json文件)。 划分了训练集和测试集,并分别存放各自同一类别的图片。如果想可视化数据集,可以运行资源中的show脚本。 有关图像分类与分割网络改进的内容可以在相关博客中查阅;计算机视觉的完整项目也可以在其他文章中找到。
  • 番茄叶病害分10病害,1800
    优质
    本数据集包含了针对番茄叶部的十种常见病害的高分辨率图像,每种类别均包含大约1800张图片,为深度学习研究提供了宝贵的资源。 番茄叶片疾病分类数据集包含10类病害,每类约有1800多张图片。
  • 辣椒病虫害7,500片】
    优质
    本数据集提供了超过7,500张经过详细标注的辣椒病虫害图片,涵盖多种常见疾病与害虫,为深度学习研究提供丰富资源。 辣椒病虫害图像分类数据集【已标注,约7,500张数据】 类别数量【11】:炭疽病、螨虫、温度不适、缺素等【具体查看json文件】 划分了训练集与测试集,并将各自的数据图片存放于相应目录。如果想可视化数据集,可以运行资源中的show脚本。 提供了一些基于CNN的分类网络项目和图像分割完整项目的介绍,以及对YOLOv5模型进行改进的相关内容。 对于更多关于图像分类、医学图像分割及目标检测(使用yolo)等领域的项目与相应网络改进的内容,请参考本人主页。