Advertisement

Total-Text-Dataset:全面的文本数据集,含1555张图片及多种文字方向

  • 5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
Total-Text-Dataset是一个包含1555张图像的综合文本数据集,涵盖了水平、垂直和弯曲等多种文字排列方式,为复杂场景下的文本检测研究提供了丰富资源。 Total-Text-Dataset(官方站点)的更新记录如下: 2020年4月29日:检测排行榜已更新,并突出显示了E2E方法。 2020年3月19日:查询测试集的基础已经更新。 2019年9月8日:Total-Text的新版本现已提供。 2019年9月7日:用于场景文本图像标注的工具和数据已更新,并且关于我们的IJDAR的内容也进行了更新。 2019年8月1日:接受带有新基准和注释工具扩展版的提交。 2019年5月30日:有关Total-Text和ArT数据集的重要公告发布。 2019年4月2日:表排名已根据推荐使用DetEval进行了更新。 2019年3月31日:提供了一个更快版本的DetEval.py,支持Python3。 2019年3月14日:带有评估协议信息的新版表格排名发布。 2018年11月26日:包含参考用的表格排名已添加。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Total-Text-Dataset1555
    优质
    Total-Text-Dataset是一个包含1555张图像的综合文本数据集,涵盖了水平、垂直和弯曲等多种文字排列方式,为复杂场景下的文本检测研究提供了丰富资源。 Total-Text-Dataset(官方站点)的更新记录如下: 2020年4月29日:检测排行榜已更新,并突出显示了E2E方法。 2020年3月19日:查询测试集的基础已经更新。 2019年9月8日:Total-Text的新版本现已提供。 2019年9月7日:用于场景文本图像标注的工具和数据已更新,并且关于我们的IJDAR的内容也进行了更新。 2019年8月1日:接受带有新基准和注释工具扩展版的提交。 2019年5月30日:有关Total-Text和ArT数据集的重要公告发布。 2019年4月2日:表排名已根据推荐使用DetEval进行了更新。 2019年3月31日:提供了一个更快版本的DetEval.py,支持Python3。 2019年3月14日:带有评估协议信息的新版表格排名发布。 2018年11月26日:包含参考用的表格排名已添加。
  • 街景 - The Street View Text Dataset
    优质
    《街景文字数据集》是由谷歌公司发布的一个大型图像数据集合,其中包含从Google街景图片中提取出的文字样本及其标注信息,广泛应用于计算机视觉和光学字符识别等领域。 街景文字(SVT)数据集是从Google街景图像中获取的。这些图像中的文本具有较高的可变性,并且通常分辨率较低。在处理室外街道级图像时,我们注意到两个特征:一是图片中的文字大多来自商业标牌;二是可以通过地理业务搜索轻松获得公司的名称。
  • 今日头条中新闻分类(toutiao-text-classfication-dataset)
    优质
    今日头条中文新闻文本分类数据集包含大量中文新闻文章,涵盖了多个类别,旨在促进自然语言处理中的话题分类研究与应用。 中文文本分类数据集的数据来源是今日头条客户端。数据格式为:每行代表一条独立的新闻记录,并通过_!_进行字段分割。 - 第一个字段表示新闻ID。 - 第二个字段表示分类代码,如102对应娱乐类别的code。 - 第三个字段表示该条目所属的具体类别名称,例如news_entertainment。 - 最后是具体的新闻标题内容和相关关键词列表。 具体示例: 6552431613437805063_!_102_!_news_entertainment_!_谢娜为李浩菲澄清网络谣言,之后她的两个行为给自己加分_!_佟丽娅,网络谣言,快乐大本营,李浩菲,谢娜,观众们 分类code与名称对应关系如下: - 100 民生 故事 news_story - 101 文化 文化 news_culture - 102 娱乐 娱乐 news_entertainment - 103 体育 体育 news_sports - 104 财经 财经 news_finance - 106 房产 房产 news_house - 107 汽车 汽车 news_car - 108 教育 教育 news_edu - 109 科技 (原文中未完整列出,此处仅提供示例)
  • Landscape-Dataset: 包7268320x180尺寸风景
    优质
    Landscape-Dataset是一个包含7268张尺寸为320x180像素风景照片的数据集,适用于图像识别和分类研究。 Landscape-Dataset风景数据集包含7268张尺寸为320x180的风景照片。
  • ChineseMNIST KNN中手写识别 15000
    优质
    ChineseMNIST KNN中文手写字识别数据集包含了15000张汉字图像,适用于训练和评估基于K近邻算法的手写字符识别模型。 在使用Python进行中文手写字识别时,可以采用ChineseMnist数据集中的15000张手写中文样本,并利用KNN模型进行分类。
  • YOLO车辆检测三类别1793(car-detect-dataset类型)
    优质
    本数据集为YOLO车辆检测项目定制,包含1793张图像,涵盖汽车、行人和自行车三大类别的标注信息,适用于训练精确的多目标检测模型。 YOLO车辆检测三类别数据集包含1793张图片,适用于车辆检测任务。该数据集中的标签类型包括VOC格式和YOLO格式两种,类别名称分别为car、bus和truck。每张图中可能含有多个目标对象,并且这些目标在图像中清晰可见。
  • MNIST手写7000.rar
    优质
    该文件包含一个经典的手写数字识别数据集MNIST,内有7000张灰度图像,每张表示从0到9的一个数字,适用于训练和测试神经网络等机器学习模型。 MNIST手写数字数据集包含7000张高质量的jpg格式图片,分为测试集和训练集。更多关于数据集的信息可以在相关博客文章中找到。
  • MNIST手写(7000).rar
    优质
    本资源包含MNIST手写数字数据集,共计7000张图片,适用于机器学习中的分类算法训练和测试。 资源描述:MNIST手写数字数据集(7000张图片).rar 资源内容:包含宽幅数字识别及流行的手写数字数据集中的7000幅图像,欢迎使用。 适用对象:此数据集适用于计算机、电子信息工程和数学等专业的大学生课程设计与毕业设计项目。 作者介绍:一位在大厂工作超过十年的资深算法工程师,在Matlab、Python、C/C++、Java及YOLO算法仿真方面有丰富的经验。擅长领域包括但不限于计算机视觉,目标检测模型,智能优化算法,神经网络预测,信号处理,元胞自动机图像处理以及智能控制和路径规划等项目的研究与开发工作,并乐意进行交流学习。
  • 车辆类识别:2000标注件(YOLOv5)
    优质
    本数据集包含2000张不同类型的车辆图像及其对应的YOLOv5格式标注文件,适用于训练和测试车辆分类模型。 车俩种类识别数据集包含7个类别:一类客车(tinycar)、二类客车(midcar)、三类客车(bigcar)、一类货车(smalltruck)、二类货车(bigtruck)、油罐车(oil truck)以及特殊车辆(specialcar)。该数据集中共有1488张训练图片、507张验证图片和31张测试图片,所有图像均已标注并转换为txt格式。这些数据适用于YOLOv5 v7 v8深度学习模型的训练,类别总数为nc: 7,类名分别为[tinycar, midcar, bigcar, smalltruck, bigtruck, oil truck, specialcar]。