Advertisement

Street View House Numbers (SVHN) 数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
Street View House Numbers (SVHN)数据集是由一系列街景房屋数字图像构成的数据库,广泛应用于机器学习和计算机视觉领域中的识别与分类任务。 Street View House Numbers (SVHN) 数据集原为 mat 文件格式的数据已提取成图像,并将标签以 coco 格式标注出来。训练集与测试集中共有10万张图片。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Street View House Numbers (SVHN)
    优质
    Street View House Numbers (SVHN)数据集是由一系列街景房屋数字图像构成的数据库,广泛应用于机器学习和计算机视觉领域中的识别与分类任务。 Street View House Numbers (SVHN) 数据集原为 mat 文件格式的数据已提取成图像,并将标签以 coco 格式标注出来。训练集与测试集中共有10万张图片。
  • SVHN-Detection-and-Classification-using-Street-View-House-Numbers
    优质
    本项目利用街景房屋号码(SVHN)数据集进行物体检测与分类研究,旨在提升对自然环境中的数字识别精度和效率。 我尝试使用两个卷积神经网络(CNN)对街景门牌号码数据集中的数字进行检测与分类,但效果并不理想。该项目包含两部分:首先利用一个CNN执行边界框回归以确定图像中所有数字的顶部、左侧、宽度和高度;然后基于步骤一得到的边界框提取仅含有数字的部分,并通过另一个多输出CNN对剪切后的图片进行数字识别。 我的初衷是,相较于直接将整个SVHN图像输入到神经网络并让其预测其中的所有数字,这种方法能够提高准确性。然而,在实际操作中,整体流程只能达到51%的整体准确率(即所有数字完全匹配)。同时第一、第二、第三和第四位的单个数字识别精度分别为71%,65%,84% 和98% (只考虑最多四位数的情况)。 检测与分类过程如下: - 获取输入图像,目前仅在SVHN测试集上进行了尝试。 - 调整为64x64像素大小,并转换成灰度图进行标准化处理; - 将经过预处理的图像送入用于检测边界框的第一步CNN中获取边界信息。
  • 街景文字 - The Street View Text Dataset
    优质
    《街景文字数据集》是由谷歌公司发布的一个大型图像数据集合,其中包含从Google街景图片中提取出的文字样本及其标注信息,广泛应用于计算机视觉和光学字符识别等领域。 街景文字(SVT)数据集是从Google街景图像中获取的。这些图像中的文本具有较高的可变性,并且通常分辨率较低。在处理室外街道级图像时,我们注意到两个特征:一是图片中的文字大多来自商业标牌;二是可以通过地理业务搜索轻松获得公司的名称。
  • SVHN
    优质
    简介:SVHN数据集是一个用于识别场景中房屋数字图像的数据集合,广泛应用于机器学习和计算机视觉领域,旨在推动复杂背景下的数字识别技术的发展。 【SVHN 数据集详解】 SVHN(Street View House Numbers)数据集是计算机视觉领域尤其是深度学习中的数字识别任务常用的数据集合。该数据集基于谷歌街景图像,包含大量门牌号图片,旨在帮助研究者在真实场景中进行数字识别的研究。 1. **数据集结构**: - `mchar_train.json`:此文件包含了训练集中每个样本的元信息,如图像ID、对应的标签(即具体数字)以及可能包括的预处理参数等。 - `mchar_val.json`:验证集用于在模型训练过程中评估中期性能。它帮助调整超参数或优化模型,并包含与训练集类似的图像元数据和对应标签的信息。 - `mchar_data_list_0515.csv`:这个CSV文件可能包含了所有图像的路径及其相关信息,便于读取和分析。 2. **数据集特点**: - SVHN拥有超过60万张标注好的数字图片,支持训练复杂的模型。 - 数据源自街景图像是实际场景的一部分,包含各种环境条件如光照变化、角度倾斜等,增加了识别难度并提升了泛化能力。 - 包含10个类别(即从0到9的数字),适用于多类别的分类问题。 - 提供JSON和CSV格式的数据文件以适应不同的处理需求。 3. **使用场景**: SVHN数据集广泛应用于以下研究与应用领域: - 计算机视觉基础研究,如改进卷积神经网络(CNN)模型; - 开发并测试数字识别算法; - 实时应用场景中的数字检测和识别任务,例如智能交通系统或安全监控。 4. **数据预处理**: 在训练模型之前需要对SVHN数据集进行一些基本的预处理工作,如图像像素值归一化、调整统一尺寸以及随机翻转等增强技术来提高泛化性能。 5. **模型训练**: 训练过程包括构建CNN架构,并使用GPU加速及反向传播算法更新权重。同时通过验证集监控模型表现并采用早停策略防止过拟合现象的发生。 6. **评估指标**: 常用的评价标准有准确率、混淆矩阵等,用于全面衡量识别不同数字类别的性能。 总结来说,SVHN数据集为研究者和开发者提供了一个强大的工具来训练能够在实际环境中有效工作的模型。熟悉并正确使用这些文件对于构建高效的计算机视觉系统至关重要。
  • SVHN分析
    优质
    简介:SVHN(Street View House Numbers)数据集用于识别自然环境中房屋数字号码,广泛应用于计算机视觉领域中的物体检测与分类研究。 Street View House Numbers (SVHN) 数据集的原始数据格式为 mat 文件,并已提取成图像并标注了标签。整个数据集中共有10万张图片,分为训练集和测试集。
  • NGSIM——亚特兰大GA Peachtree Street
    优质
    该数据集包含美国亚特兰大Peachtree街段车辆和行人的动态行为记录,是研究交通流模式与智能交通系统的重要资源。 包含Peachtree-Street-Atlanta上的三个数据段,可用于路径预测研究。具体数据见vehicle-trajectory-data.zip文件(该文件大小为1.6G的CSV格式),这是全量的NGSIM数据,但大多数论文通常使用其中的数据片段进行分析和研究。
  • 波士顿房价 (boston-house-prices.csv)
    优质
    本数据集包含关于波士顿地区的房屋价格信息,包括犯罪率、住宅平均房间数等13个特征变量,可用于回归分析和机器学习模型训练。 boston_house_prices.csv 是一个包含波士顿房价数据的数据集。
  • 加州房屋价格(california-house-prices)
    优质
    加州房屋价格数据集包含了美国加利福尼亚州多个地区房屋的价格信息及相关属性,是数据分析和机器学习中常用的数据资源。 加州房价数据集适用于数据分析、机器学习和深度学习的学习与应用。
  • PyTorch-Playground:探索PyTorch的基础预训练模型与(包括MNIST、SVHN、CIFAR10等)
    优质
    PyTorch-Playground是一个专注于使用PyTorch框架进行机器学习研究和实践的平台。它提供了丰富的基础预训练模型及常用数据集,如MNIST手写数字识别、SVHN街景门牌号图像识别以及CIFAR10小型图片分类等资源,旨在帮助开发者快速入门并深入探索深度学习领域。 这是为Pytorch初学者准备的游乐场,提供了流行数据集上的预定义模型支持。当前我们支持的数据集包括MNIST、SVHN、CIFAR10、CIFAR100 和 STL10;而可选的神经网络架构则涵盖AlexNet, VGG(如vgg16和vgg19,带或不带batch normalization)、ResNet系列(resnet18至resnet152)以及SqueezeNet版本v0与v1、Inception_v3等。这里展示了一个针对MNIST数据集的示例代码片段: ```python import torch from torch.autograd import Variable model_raw, ds_fetcher = selector.select(mnist) ds_val = ds_fetcher(batch_size=64) # 示例中可能需要根据实际情况调整batch size参数值。 ``` 这段代码会自动下载MNIST数据集和预先训练好的模型。