Advertisement

TableNet的PyTorch实现: OCR_tablenet版本

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
OCR_tablenet是基于PyTorch框架对TableNet模型的实现,专为表格识别与结构化设计,适用于文档分析和信息提取任务。 表格网该库由一个Pytorch实施组成。要进行培训或预测,请首先通过运行以下代码安装需求:`pip install -r requirements.txt`。为了训练模型,您只需要使用可以根据需要配置的train.py文件即可。 marmot.py和tablenet.py是继承自Pytorch Lightning模块的组件,分别对应LightningDataModule和LightningModule类。进行预测时,可以利用已经预先训练好的权重,并通过以下命令执行: `python predict.py --model_weights= --image_path=` 或者使用默认图像直接运行: `python predict.py` 以简化操作过程。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • TableNetPyTorch: OCR_tablenet
    优质
    OCR_tablenet是基于PyTorch框架对TableNet模型的实现,专为表格识别与结构化设计,适用于文档分析和信息提取任务。 表格网该库由一个Pytorch实施组成。要进行培训或预测,请首先通过运行以下代码安装需求:`pip install -r requirements.txt`。为了训练模型,您只需要使用可以根据需要配置的train.py文件即可。 marmot.py和tablenet.py是继承自Pytorch Lightning模块的组件,分别对应LightningDataModule和LightningModule类。进行预测时,可以利用已经预先训练好的权重,并通过以下命令执行: `python predict.py --model_weights= --image_path=` 或者使用默认图像直接运行: `python predict.py` 以简化操作过程。
  • TableNet非官方
    优质
    TableNet非官方实现版是一款基于深度学习技术的数据表格处理工具,尽管不是官方发布版本,但其在数据提取和转换方面的功能强大且灵活,适合需要高效处理复杂表格数据的研究者和技术人员使用。 ICDAR 2019论文的非正式实施:TableNet是一种用于从扫描文档图像进行端到端表检测和表格数据提取的深度学习模型。 概述: TableNet是由TCS Research年度团队在2019年提出的一种现代深度学习架构。其主要目标是通过手机或相机从扫描的表格中准确地提取信息。 他们提供了一种解决方案,包括精确识别图像中的表格区域,并随后检测和提取这些表格行与列的信息。 体系结构: 该模型基于Long等人提出的用于语义分割的语言设计。编码器-解码器网络被用作全卷积网络(FCN)架构以进行表提取。在使用TableNet之前,需要先通过Tesseract OCR对图像进行预处理和修改。 运行方法: 首先安装所需的依赖项:`pip install -r requirements.txt` 然后下载Marmot数据集,并按照说明文档中的指示操作来运行模型。
  • AnimeGANv2-PyTorch: AnimeGANv2PyTorch
    优质
    AnimeGANv2-PyTorch是基于PyTorch框架实现的AnimeGANv2代码库,用于将照片风格转换成日式漫画风格,提供模型训练和预处理工具。 PyTorch实现 从原始存储库转换权重(需要TensorFlow 1.x) ``` git clone https://github.com/TachibanaYoshino/AnimeGANv2 python convert_weights.py ``` 推理: ``` python test.py --input_dir [image_folder_path] --device [cpu/cuda] ``` 这是经过转换的模型的结果样式(从左到右:输入图像,原始TensorFlow结果,PyTorch结果)。 脸部模型是从带有L2 + VGG + GAN损失和CelebA-HQ图像中提取出来的。有关推断,请参见test_faces.ipynb文件。 注意:不包含训练代码,在RTX3090 + PyTorch1.7.1上进行了测试,由于转换后的权重结果略有不同。
  • TransGAN-PyTorch: [WIP] PyTorchTransGAN
    优质
    TransGAN-PyTorch是一个正在开发中的项目,致力于提供一个基于PyTorch框架的TransGAN实现。此代码库旨在为研究者和开发者提供灵活且高效的生成对抗网络实验环境。 TransGAN-PyTorch 是 PyTorch 实现的 TransGAN 论文原始文件。安装方法是通过 pip 安装软件包: ``` pip install transgan-pytorch ``` 使用时,需要导入 torch 和 TransGAN 模块,并实例化一个 TransGAN 对象。代码示例如下: ```python import torch from transgan_pytorch import TransGAN tgan = TransGAN(...) z = torch.rand(100) # 随机噪声 pred = tgan(z) ```
  • FixMatch-pytorch:非官方PyTorch
    优质
    FixMatch-pytorch是由社区维护的一个非官方项目,提供了用PyTorch框架实现的FixMatch半监督学习算法。此代码库旨在为机器学习爱好者和研究者提供一个易于使用的实验平台。 这是FixMatch的非官方PyTorch实现。Tensorflow的官方实现在另一处提供。 该代码仅在使用RandAugment的情况下适用于FixMatch。 结果如下: CIFAR10数据集: 标签数量:40,250,4000 论文(RA)的结果为:86.19±3.37, 94.93±0.65, 95.74±0.05 本代码实现结果为:93.60, 95.31, 95.77 CIFAR100数据集: 标签数量:400,2500,10000 论文(RA)的结果为:51.15±1.75, 71.71±0.11, 77.40±0.12 本代码实现结果为:57.50, 72.93, 78.12 使用以下选项进行训练--amp --opt_level O2 --wdecay 0.001。 用法: 通过CIFAR-10数据集的4000个标记数据来训练模型。
  • PointNet2_PyTorch: PointNet++PyTorch
    优质
    简介:PointNet2_PyTorch是PointNet++的PyTorch版实现,适用于点云理解任务,支持多种数据集与模型架构,便于研究和开发。 Pointnet2/Pointnet++ PyTorch 项目状态:未维护。由于时间有限,我没有更新此代码的计划,并且不会响应问题。 该项目是用 PyTorch 编写的 Pointnet2/Pointnet++ 版本,支持多 GPU 使用和 PyTorch 版本 >= 1.0.0 的环境。对于旧版本的 PyTorch 支持,请参考官方发布的模型定义和超参数(在 tensorflow 中)。 注意:Pointnet++ 所使用的自定义操作目前仅在使用 CUDA 的 GPU 上受支持。该项目已通过 Python {3.6, 3.7} 版本进行测试,安装依赖项时请运行 `pip install -r requirements.txt` 命令,并且该 repo 已经用 PyTorch {1.4, 1.5} 进行了测试。它可能适用于比 1.5 更新的版本,但这不能保证。
  • FastSpeech2PyTorch:快速
    优质
    本项目提供FastSpeech2的PyTorch实现,旨在加速文本到语音转换过程,适用于研究和开发。 Fastspeech 2 FastSpeech 非官方PyTorch实现。此仓库基于FastSpeech的实现进行开发,在此版本中我尝试复制论文中的详细设置,并在必要时做出一些调整以优化模型性能,欢迎提出任何建议与改进意见。 音频预处理采用Nvidia的tacotron 2方法完成,并使用特定声码器来合成语音信号。以下是项目详情: 代码要求:所有代码均基于Python 3.6.2编写。 安装Pytorch: 在安装pytorch之前,请通过运行以下命令检查您的Cuda版本: ```bash nvcc --version ``` 然后按照官方指导进行PyTorch的安装,例如使用pip install torch torchvision。在此仓库中,我将Pytorch 1.6.0用于支持bucketize功能(此函数在之前的pytorch版本中不存在)。 其他依赖库:请通过运行以下命令来安装项目所需的额外包: ```bash pip install -r requirements.txt ``` 为了使用TensorBoard进行日志记录,请确保已正确配置了相关环境。
  • PytorchDCGAN:DCGANPytorch
    优质
    本项目提供了一个基于PyTorch框架的深度卷积生成对抗网络(DCGAN)的实现方案。通过利用PyTorch的强大功能和灵活性,该项目能够高效地训练生成模型以产生高质量的图像数据。 派托克-DCGAN 是 DCGAN 的 Pytorch 实现。可以通过更改 DB 变量来选择不同的数据集。若想使用已保存的模型生成图像,请将 LOAD_MODEL 设置为 True 并将 EPOCHS 设定为 0。支持的数据集包括 LSUN 教堂、西莉亚和 MNIST 数据集。
  • PyTorch-NetVlad:NetVladPyTorch,含匹兹堡训练
    优质
    PyTorch-NetVlad是基于PyTorch框架实现的NetVLAD模型代码库,包含了用于匹兹堡数据集训练的特定版本,适用于视觉词袋模型研究。 在pytorch-NetVlad实现的代码中包括了用于匹兹堡数据集上训练模型的部分。下面是与表1右列第三行的结果对比: R @ 1 | R @ 5 | R @ 10 84.1 | 94.6 | 95.5 pytorch-NetVlad(alexnet)| 68.6 | 84.6 | 89.3 pytorch-NetVlad(vgg16)| 85.2 | 94.8 | 97.0 在训练模式和默认设置下运行main.py的分数应该与上述结果相似。此外,可以获取上述实验中使用的模型状态。 使用此检查点,并通过以下命令可以获得上面显示的结果: python main.py --mode=test --split=val --resume=vgg16_netvlad_checkpoint 这需要P数据集以及至少v0.4.0版本的依赖关系设置完成。
  • Attention-Sampling-PyTorch: 研究PyTorch
    优质
    Attention-Sampling-PyTorch提供了我们最新研究中提出的注意力采样方法的PyTorch代码实现。此项目便于研究人员和开发者理解和实验最新的深度学习技术。 这是论文的PyTorch实现:该存储库基于用TensorFlow编写的原论文代码进行了移植,并使用了PyTorch 1.4.0版本进行重构。其中最具有挑战性的部分是将从高分辨率图像中提取补丁的功能重写,原本这部分功能是由特殊的C/C++文件完成的,在这里我将其改为了本地Python实现。由于可能需要嵌套的for循环操作,这可能会降低效率和速度。虽然尝试通过并行执行来提高补丁提取过程的速度,但是增加了很多开销,并且实际上运行得更慢。 此外,我还希望正确实现了计算期望值的部分,这部分使用了一个自定义的backward()函数,在实现过程中我尽量避免了错误的发生。 该代码库已经针对原始文件中提到的任务进行了测试:包括Mega-MNIST和交通标志检测任务。通过定性分析表明结果与原工作具有可比性,但也有用户反馈说在这一版本中的错误较高。