Advertisement

PubLayNet上的MaskRCNN:段落、表格和图形检测等任务

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
本研究在PubLayNet数据集上应用了Mask R-CNN模型,实现了对文档中段落、表格及图形的有效检测与分割,推动了布局分析技术的发展。 PubLayNet 是一个大型文档图像数据集,其布局通过边框和多边形进行分割标注。 最近更新: - 2020年9月15日:添加了训练代码。 - 2020年2月29日:为maskrcnn_resnet50_fpn 添加基准测试。 - 2020年2月22日:增加了预训练的Mask-RCNN模型(Pytorch)。 标杆管理: | 指标 | 值 | | --- | --- | | Iter num (x16) | 196k | | AP50 | 0.91 | | AP75 | 0.98 | | AP小 | 0.41| | AP中等 | 0.76| | AP大 | 0.95| MD5SUM: 393e6700095a673065fcecf5e8f264f7 演示版:(相关信息未具体提供)

全部评论 (0)

还没有任何评论哟~
客服
客服
  • PubLayNetMaskRCNN
    优质
    本研究在PubLayNet数据集上应用了Mask R-CNN模型,实现了对文档中段落、表格及图形的有效检测与分割,推动了布局分析技术的发展。 PubLayNet 是一个大型文档图像数据集,其布局通过边框和多边形进行分割标注。 最近更新: - 2020年9月15日:添加了训练代码。 - 2020年2月29日:为maskrcnn_resnet50_fpn 添加基准测试。 - 2020年2月22日:增加了预训练的Mask-RCNN模型(Pytorch)。 标杆管理: | 指标 | 值 | | --- | --- | | Iter num (x16) | 196k | | AP50 | 0.91 | | AP75 | 0.98 | | AP小 | 0.41| | AP中等 | 0.76| | AP大 | 0.95| MD5SUM: 393e6700095a673065fcecf5e8f264f7 演示版:(相关信息未具体提供)
  • 四活动1:使用CSS设置背景、标题颜色.zip
    优质
    本资料为《形考任务四活动1:使用CSS设置背景、标题和段落颜色》提供指导与实践操作,涵盖利用CSS技术调整网页元素样式的基础知识及具体应用方法。 形考任务四活动1:使用CSS样式来设置背景、标题和段落的颜色。
  • 毕业设计资料模板,包括中期
    优质
    本资源包提供全面的毕业设计指导材料,涵盖详细的任务书、进度规划及中期检查表格,旨在帮助学生系统化地完成学业项目。 毕业设计文档模板包括任务书、中期检查表以及正文示例等内容。
  • Labelme标注文件转COCO关键点
    优质
    本项目旨在提供一套高效的方法和工具,用于将LabelMe标注的数据转换为COCO数据集格式,特别针对关键点检测任务进行了优化。 参考已有资源进行了修改,避免了在标注过程中出现点位顺序与指定顺序不一致的问题。
  • 使用OpenGL练习绘制如三角、四边线
    优质
    本项目旨在通过OpenGL进行基础图形编程实践,涵盖三角形、矩形及线段等多种基本几何形状的绘制技巧学习与应用。 使用OpenGL练习绘制图形如三角形、四边形、线段等,并涉及四边形旋转、光照和动画效果的实现。
  • :抖动算法
    优质
    抖动算法是一种在计算机图形学中用于将低精度图像数据转换为高精度显示的技术,通过添加微小误差来减少量化过程中的视觉伪影。 对灰度图进行量化处理可以采用阈值、随机抖动、有序抖动以及误差分散方法。
  • MATLAB版基于MaskRCNN多目标代码
    优质
    本项目提供了一套基于MATLAB实现的Mask R-CNN框架,用于执行复杂的图像分析任务中的多目标检测。此版本代码为研究人员与工程师提供了一个强大的工具,以便于在MATLAB环境中探索和应用先进的计算机视觉技术。 该代码使用MATLAB 2021版本运行环境,能够检测80类常见目标,并且基于coco数据集训练的模型。此外,代码包含中文注释以便于理解。
  • 目标视频教程(从RCNN到MaskRCNN
    优质
    本教程全面解析目标检测技术发展历程,涵盖经典算法如RCNN、SPP-Net、Fast R-CNN及先进方法Faster R-CNN和Mask R-CNN,适合计算机视觉初学者与进阶者。 我整理了一系列关于目标检测的视频讲解(MP4格式),涵盖了从RCNN到Mask R-CNN的发展过程:01懒人学RCNN.mp4、02懒人学FastRCNN.mp4、03懒人讲Faster RCNN之简介.mp4、04懒人学Faster RCNN之融合.mp4、05懒人讲Faster RCNN之RPN.mp4、06懒人讲FPN之引言.mp4、07懒人讲FPN之深入浅出FPN.mp4、08懒人讲FPN之Faster RCNN实践.mp4、09懒人学Mask R-CNN之介绍.mp4、10懒人学Mask R-CNN之RoIAlign.mp4、11懒人学Mask R-CNN之画龙点睛.mp4、12懒人学Mask R-CNN之Architecture.mp4 和 13 懒人学 Mask R-CNN 之 Architecture & 画龙点睛.mp4,以及关于Focal Loss的讲解(14懒人学 Focal Loss.mp4)。这些视频均采用华文详细讲解。
  • 在Java编程中设置Word文档字体
    优质
    本教程详细介绍如何使用Java编程技术来设置Microsoft Word文档中的字体样式与段落布局,帮助开发者实现自动化办公需求。 使用Java对PageOffice进行编程可以实现在空白的Word模板上动态生成文件,并填充文本内容、图片以及设置文本字体、段落格式等功能。PageOffice是标准的Java组件,可以通过JSP Tag标签方式引用,在Eclipse、MyEclipse等开发工具中完美支持。通过其提供的Word动态数据填充功能,可以实现复杂格式模板的套红处理。不仅可以将单独的Word文档进行拼合,还可以动态地填充公文标题、发文号、发文日期、主题词和发文单位等内容。
  • Matlab11111.rar_矩MATLAB像识别_
    优质
    本资源包提供了使用MATLAB进行矩形和圆形图像识别的代码与示例,适用于初学者学习形状检测技术。 在Matlab中可以实现图像中的圆、矩形、正方形等多种形状的识别功能。