Advertisement

非官方EfficientDet:基于MMDetection的实现

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本项目提供了一个基于MMDetection框架的非官方EfficientDet实现,旨在为开发者和研究人员提供一个灵活、高效的物体检测模型。 使用高效饮食BiFPN和改进后的BiFPN,并采用@rwightman的effcientNet骨干及预训练权重进行训练和测试。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • EfficientDetMMDetection
    优质
    本项目提供了一个基于MMDetection框架的非官方EfficientDet实现,旨在为开发者和研究人员提供一个灵活、高效的物体检测模型。 使用高效饮食BiFPN和改进后的BiFPN,并采用@rwightman的effcientNet骨干及预训练权重进行训练和测试。
  • TableNet
    优质
    TableNet非官方实现版是一款基于深度学习技术的数据表格处理工具,尽管不是官方发布版本,但其在数据提取和转换方面的功能强大且灵活,适合需要高效处理复杂表格数据的研究者和技术人员使用。 ICDAR 2019论文的非正式实施:TableNet是一种用于从扫描文档图像进行端到端表检测和表格数据提取的深度学习模型。 概述: TableNet是由TCS Research年度团队在2019年提出的一种现代深度学习架构。其主要目标是通过手机或相机从扫描的表格中准确地提取信息。 他们提供了一种解决方案,包括精确识别图像中的表格区域,并随后检测和提取这些表格行与列的信息。 体系结构: 该模型基于Long等人提出的用于语义分割的语言设计。编码器-解码器网络被用作全卷积网络(FCN)架构以进行表提取。在使用TableNet之前,需要先通过Tesseract OCR对图像进行预处理和修改。 运行方法: 首先安装所需的依赖项:`pip install -r requirements.txt` 然后下载Marmot数据集,并按照说明文档中的指示操作来运行模型。
  • Keras_TP-GAN:TensorFlowTP-GANKeras-源码
    优质
    Keras_TP-GAN是基于TensorFlow的一个非官方库,实现了TP-GAN算法。该项目提供了简洁易用的Keras接口来访问和扩展该模型的源代码。 Keras_TP-GANTP-GAN是基于非官方的Keras(使用Tensorflow)对“超越面部旋转:用于真实感和身份保留正面视图合成的全局和局部感知GAN”的重新实现。“原论文”作者为Huang R,Zhang S.,Li T. 和 He R. (2017)。该代码主要参考了作者官方纯Tensorflow版本进行开发。 目前的结果在概括性上不如原始研究中的结果。如果您对此实现有任何评论或建议,请通过电子邮件与我联系,我很乐意共同探讨和改进。 输入综合的GT 这4张图像的主题包含在训练数据集中,但照明条件有所不同。 使用的库及环境: - Python:3.6.3 - Tensorflow:1.5.0 - Keras: 2.1.3 - GPU:GeForce GTX 1080 Ti(单个)
  • RTM3D: PyTorch中RTM3D
    优质
    RTM3D是一款基于PyTorch开发的非官方实现工具,专为三维重建和理解任务设计,提供高效灵活的深度学习解决方案。 RTM3D-PyTorch是ECCV 2020论文的PyTorch实现版本,它基于单眼RGB图像进行实时3D对象检测,并支持张量板。该模型使用RESNET与关键点特征金字塔网络(KFPN),可以通过设置参数--arch fpn_resnet_18来选择架构。此外,还可以通过调整use_left_cam_prob参数来控制左右摄像机的图像输入。 在公式(3)中,由于log运算符不接受负值作为输入,因此不需要对dim进行归一化处理(因为归一化的dim值可能小于0)。为了适应这一情况,我直接回归到以米为单位的绝对尺寸值。对于深度估计,使用L1损失函数,并首先将sigmoid激活应用于深度输出。 在公式(5)中,我没有采用地面真实值的绝对值而是采用了相对值。而在式(7)中,则是用argmin替代了原文中的argmax操作符。这些修改旨在优化模型性能和准确性。
  • Binance-Java:Java Binance API
    优质
    Binance-Java是一款由社区维护的开源库,它为Binance交易所提供了一套全面且灵活的Java API接口解决方案。 Binance的非官方Java Binance API实现。
  • FixMatch-Pytorch代码:“FixMatch”
    优质
    这段简介可以这样写: 本项目提供了一个非官方版本的PyTorch实现代码,用于复现“FixMatch”的半监督学习方法。 FixMatch-pytorch 是一个非官方的 PyTorch 实现,在 NeurIPS 20 上发布。此实现可以重现论文中的结果(包括 CIFAR10 和 CIFAR100),并包含半监督学习与完全监督方式训练模型的结果。需要 Python 3.6、PyTorch 1.6.0、torchvision 0.7.0 和 TensorBoard 2.3.0,以及 Pillow 库。 结果如下: - 分类准确率(%) 除了论文中提到的半监督学习成果外,我们还提供了完全监督学习的额外数据(50,000个标签),仅支持全监督。此外,在具有50,000个标签的情况下,一致性正则化也得到了应用。 即使在所有标签都已提供的情况下,引入一致性正则化依然提升了分类准确度。评估模型时采用了通过SGD训练过程中的指数移动平均值(EMA)方法进行评价。 对于 CIFAR10 数据集的测试结果: - 40个标签:超+一致性只吃纸(RA),86.19±3.37 - 250个标签:同上,94.93±0.65 - 4,000个标签:同样方法,此处未给出具体数值。
  • FixMatch-pytorch:PyTorch版本
    优质
    FixMatch-pytorch是由社区维护的一个非官方项目,提供了用PyTorch框架实现的FixMatch半监督学习算法。此代码库旨在为机器学习爱好者和研究者提供一个易于使用的实验平台。 这是FixMatch的非官方PyTorch实现。Tensorflow的官方实现在另一处提供。 该代码仅在使用RandAugment的情况下适用于FixMatch。 结果如下: CIFAR10数据集: 标签数量:40,250,4000 论文(RA)的结果为:86.19±3.37, 94.93±0.65, 95.74±0.05 本代码实现结果为:93.60, 95.31, 95.77 CIFAR100数据集: 标签数量:400,2500,10000 论文(RA)的结果为:51.15±1.75, 71.71±0.11, 77.40±0.12 本代码实现结果为:57.50, 72.93, 78.12 使用以下选项进行训练--amp --opt_level O2 --wdecay 0.001。 用法: 通过CIFAR-10数据集的4000个标记数据来训练模型。
  • SOLOv2: 例分割-源码
    优质
    简介:本项目提供了一个非官方的SOLOv2实例分割算法的源代码实现,旨在为研究者和开发者提供一个灵活的学习和实验平台。 SOLOV2:实例分割,非官方实现。
  • Graph-Based Global Reasoning: 全局推理PyTorch(http)
    优质
    本项目提供了一个基于PyTorch的非官方实现,用于探索和应用Graph-Based Global Reasoning模块,促进图像理解和视觉识别任务中的全局信息处理。 GraphBasedGlobalReasoning 是一个非官方的 PyTorch 实现,它基于图进行全局推理。我在这个实现中对一些细节进行了改动。
  • Copy-Paste for Semantic Segmentation: 简便法...
    优质
    本项目提供了一种非官方但便捷的方法,用于复制和粘贴技术在语义分割任务中的应用。通过简化现有算法,使开发者能够快速上手并改进语义分割模型性能。 这个仓库提供了语义分割的非官方实现方法,并且也可以应用于实例分割场景。我们在类似于VOC的数据集上进行了测试,如果使用的是类似COCO的数据集,则需要先从COCO中提取掩码。 本repo采用的方法包括随机水平翻转和大规模抖动复制粘贴等步骤:选择源图像与主图像;获取并处理源图中的注释信息;将缩放后的源图片及对应的注释合并到目标图片上,并整合新的标注数据。如果使用类似COCO的数据集,需要先运行get_coco_mask.py脚本来提取掩码。 用法示例:`usage: get_coco_mask.py [options]` 可选参数: - `-h, --help`: 显示帮助信息并退出。 - `--input_dir INPUT_DIR`: 指定输入目录的位置。 - `--split SPLIT`: 指定数据集的分割部分。