Advertisement

Graph-Based Global Reasoning: 基于图的全局推理的PyTorch非官方实现(http)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本项目提供了一个基于PyTorch的非官方实现,用于探索和应用Graph-Based Global Reasoning模块,促进图像理解和视觉识别任务中的全局信息处理。 GraphBasedGlobalReasoning 是一个非官方的 PyTorch 实现,它基于图进行全局推理。我在这个实现中对一些细节进行了改动。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Graph-Based Global Reasoning: PyTorchhttp
    优质
    本项目提供了一个基于PyTorch的非官方实现,用于探索和应用Graph-Based Global Reasoning模块,促进图像理解和视觉识别任务中的全局信息处理。 GraphBasedGlobalReasoning 是一个非官方的 PyTorch 实现,它基于图进行全局推理。我在这个实现中对一些细节进行了改动。
  • FixMatch-pytorchPyTorch版本
    优质
    FixMatch-pytorch是由社区维护的一个非官方项目,提供了用PyTorch框架实现的FixMatch半监督学习算法。此代码库旨在为机器学习爱好者和研究者提供一个易于使用的实验平台。 这是FixMatch的非官方PyTorch实现。Tensorflow的官方实现在另一处提供。 该代码仅在使用RandAugment的情况下适用于FixMatch。 结果如下: CIFAR10数据集: 标签数量:40,250,4000 论文(RA)的结果为:86.19±3.37, 94.93±0.65, 95.74±0.05 本代码实现结果为:93.60, 95.31, 95.77 CIFAR100数据集: 标签数量:400,2500,10000 论文(RA)的结果为:51.15±1.75, 71.71±0.11, 77.40±0.12 本代码实现结果为:57.50, 72.93, 78.12 使用以下选项进行训练--amp --opt_level O2 --wdecay 0.001。 用法: 通过CIFAR-10数据集的4000个标记数据来训练模型。
  • RTM3D: PyTorchRTM3D
    优质
    RTM3D是一款基于PyTorch开发的非官方实现工具,专为三维重建和理解任务设计,提供高效灵活的深度学习解决方案。 RTM3D-PyTorch是ECCV 2020论文的PyTorch实现版本,它基于单眼RGB图像进行实时3D对象检测,并支持张量板。该模型使用RESNET与关键点特征金字塔网络(KFPN),可以通过设置参数--arch fpn_resnet_18来选择架构。此外,还可以通过调整use_left_cam_prob参数来控制左右摄像机的图像输入。 在公式(3)中,由于log运算符不接受负值作为输入,因此不需要对dim进行归一化处理(因为归一化的dim值可能小于0)。为了适应这一情况,我直接回归到以米为单位的绝对尺寸值。对于深度估计,使用L1损失函数,并首先将sigmoid激活应用于深度输出。 在公式(5)中,我没有采用地面真实值的绝对值而是采用了相对值。而在式(7)中,则是用argmin替代了原文中的argmax操作符。这些修改旨在优化模型性能和准确性。
  • FixMatch-Pytorch代码:“FixMatch”
    优质
    这段简介可以这样写: 本项目提供了一个非官方版本的PyTorch实现代码,用于复现“FixMatch”的半监督学习方法。 FixMatch-pytorch 是一个非官方的 PyTorch 实现,在 NeurIPS 20 上发布。此实现可以重现论文中的结果(包括 CIFAR10 和 CIFAR100),并包含半监督学习与完全监督方式训练模型的结果。需要 Python 3.6、PyTorch 1.6.0、torchvision 0.7.0 和 TensorBoard 2.3.0,以及 Pillow 库。 结果如下: - 分类准确率(%) 除了论文中提到的半监督学习成果外,我们还提供了完全监督学习的额外数据(50,000个标签),仅支持全监督。此外,在具有50,000个标签的情况下,一致性正则化也得到了应用。 即使在所有标签都已提供的情况下,引入一致性正则化依然提升了分类准确度。评估模型时采用了通过SGD训练过程中的指数移动平均值(EMA)方法进行评价。 对于 CIFAR10 数据集的测试结果: - 40个标签:超+一致性只吃纸(RA),86.19±3.37 - 250个标签:同上,94.93±0.65 - 4,000个标签:同样方法,此处未给出具体数值。
  • PyTorch版本RandAugment重pytorch-randaugment
    优质
    pytorch-randaugment是一个非官方但功能强大的PyTorch库,实现了RandAugment数据增强技术,用于提高机器学习模型在图像分类任务中的性能和泛化能力。 PyTorch-Randaugment 是 RandAugment 的非官方 PyTorch 重新实现版本。大部分代码来自其他开源项目。介绍使用 RandAugment 可以在不依赖单独代理任务的情况下,对感兴趣的数据集训练模型。通过仅调整两个超参数(N 和 M),您可以获得与 AutoAugments 性能相竞争的效果。 安装方法: ``` pip install git+https://github.com/ildoonet/pytorch-randaugment ``` 用法示例: ```python from torchvision.transforms import transforms from RandAugment import RandAugment transform_train = transforms.Compose([ transforms.RandomCrop(32, padding=4), # 其他转换步骤... ]) ```
  • EfficientDet:MMDetection
    优质
    本项目提供了一个基于MMDetection框架的非官方EfficientDet实现,旨在为开发者和研究人员提供一个灵活、高效的物体检测模型。 使用高效饮食BiFPN和改进后的BiFPN,并采用@rwightman的effcientNet骨干及预训练权重进行训练和测试。
  • StyleGAN2-ADA-PyTorchPyTorch
    优质
    StyleGAN2-ADA-PyTorch是基于PyTorch框架的官方实现版本,它提供了高效且灵活的方式来训练和应用StyleGAN2模型,并加入了自适应数据增强功能。 StyleGAN2-ADA——官方PyTorch实施 作者:Tero Karras, Miika Aittala, Janne Hellsten, Samuli Laine, Jaakko Lehtinen 和 Timo Aila 摘要: 训练生成对抗网络(GAN)时,如果使用的数据量过小,通常会导致判别器过度拟合。这进而导致了模型在训练过程中的不稳定。 我们提出了一种自适应鉴别器增强机制来显著稳定有限数据环境下的训练。该方法不需要对损失函数或网络架构进行任何修改,并适用于从头开始的训练以及现有GAN在其他数据集上的微调操作。 我们在多个数据集中证明,仅使用几千张训练图像就能够取得良好效果;通常情况下,与需要更多数量级图片的传统StyleGAN2相比,我们的模型能够达到相似的效果。我们希望这项技术将为生成对抗网络开辟新的应用领域。 另外值得注意的是,在广泛使用的CIFAR-10基准测试中,实际上它只是一个有限数据集的示例。我们在该数据集中实现了FID分数从5.59显著提高到2.4的成绩。
  • CBDNet-pytorch: PyTorch版本CBDNet
    优质
    CBDNet-pytorch是一个非官方维护的项目,提供了使用PyTorch框架实现的CBDNet代码库。该项目旨在为希望在PyTorch环境中工作的研究人员和开发者提供便利。 CBDNet-火炬CBDNet的非官方PyTorch实现。 更新2021.04.02:该代码可能存在一些实现错误,请谨慎使用。 欢迎提交拉请求。 2020.12.04:我们使用新的数据集训练了CBDNet模型,PSNR(DND基准)从38.06提升到了39.63。 快速开始指南: - 下载数据集和预训练的模型。 - 将文件解压缩到data文件夹和save_model文件夹中,如下所示: ~/ data/ SIDD_train/ Syn_train/ DND/ images_srgb/ 保存模型路径为:~/ save_model/ checkpoint.pth.tar 训练模型: python tr
  • 高效像分割算法:Efficient Graph-based Image Segmentation(MATLAB
    优质
    本研究提出了一种高效的基于图论的图像分割算法,并提供了MATLAB实现。该方法能够快速准确地进行图像分割,在保持细节的同时,有效提升处理速度和质量。 该文件实现了参考文献[1]中描述的图像分割算法,并且证明了其结果既不过于细致也不过于粗糙。参考文献[2]提供了有关此算法的工具箱资源,但并未包含适用于Matlab环境中的版本,因此本段落件旨在填补这一空白。 要复制屏幕截图的结果,请运行:test_GraphSeg 参考资料: [1] 高效的基于图的图像分割,Pedro F. Felzenszwalb 和 Daniel P. Huttenlocher,《国际计算机视觉杂志》,第 59 卷,第2期,2004年9月 [2] http://people.cs.uchicago.edu/~pff/segment/ 致谢: 作者感谢张彦的2D/3D图像分割工具箱。
  • VoiceFilter: Google AI VoiceFilter系统在PyTorch
    优质
    VoiceFilter是基于Google AI开发的一款去人声噪音的AI工具,在此我们提供了该系统的非官方PyTorch版本实现。 嗨,大家好!我是MINDs Lab, Inc.的Seung-won。自从我发布这个开源文件已经有一段时间了,并且我没有预料到这个存储库会在这么长的时间里引起如此大的关注。我要感谢所有给予支持的人,同时也要感谢Quanquan Wang先生(《VoiceFilter》论文的第一作者)在他的文章中提到我的项目。 实际上,在没有相关领域主管的情况下,我仅仅用了三个月时间就开始研究深度学习和语音分离,并完成了这个项目。当时我对幂律压缩以及如何正确验证测试模型的方法一无所知。从那时起,我在深度学习和语音处理上投入了更多的时间(我还发表了一篇论文),并注意到一些明显的错误。这些问题是由GitHub用户提出的;请参考相关讨论。 尽管如此,我必须提醒大家,该存储库可能非常不可靠,并且使用此代码需要您自担风险(如LICENSE中所述)。