ProtTrans: 提供先进蛋白质预训练的Transformer模型-ITADN社区

优质

简介：ProtTrans是一种先进的基于Transformer架构的模型，专门用于蛋白质的预训练。它能够有效提升生物信息学领域中各类任务的表现，为药物设计和生物学研究提供强大支持。 ProtTrans 提供了最先进的蛋白质预训练模型，并通过使用数千个来自Summit的GPU以及各种Transformers模型中的Google TPU进行了培训。欲了解更多关于我们的工作，请查阅我们的论文。此存储库将定期更新，以支持生物信息学界，特别是我们SASAR项目在Covid-19研究方面的进展。目录： - 预言 - 蛋白质序列生成 - 可视化 - 基准测试 - 期望成绩 - 二级结构预测（第3季度） - 二级结构预测（Q8） - 膜结合与水溶性（Q2） - 亚细胞定位（Q10） - 社区和贡献 - 遇到问题？ - 发现错误？ - 特别要求 - 团队成员

预训练的Transformer语言模型

优质

预训练的Transformer语言模型是基于自注意力机制的深度学习架构，广泛应用于自然语言处理任务中，通过大规模文本数据进行预训练以捕捉语义信息。 Transformer是一种预训练语言模型。

Swin Transformer预训练模型的参数

优质

Swin Transformer是一款先进的视觉Transformer模型，用于图像识别任务。本文将介绍其内部所使用的预训练模型及其关键参数配置。这段文字包含三个文件名：swin_base_patch4_window7_224.pth、swin_small_patch4_window7_224.pth 和 swin_tiny_patch4_window7_224.pth。

SRN-DeblurNet: PyTorch实现及预训练模型提供

优质

简介：SRN-DeblurNet是一款用于图像去模糊任务的深度学习模型，基于PyTorch框架开发，并提供了经过大量数据训练得到的预训练模型。为了训练SRN-DeblurNet模型，我严格按照原始论文中的所有配置进行操作。在测试PSNR值时，我把GOPRO数据集的测试部分分为两半：一半用于验证，另一半用于最终测试，并得到了29.58db PSNR的结果（而原论文报道的数据为30.26db）。我已经提供了预训练模型。值得注意的是，在没有进行伽玛校正的情况下也可以对GOPRO中的模糊图像进行训练。我尝试将该模型应用到真实世界中的人脸图像上，但发现其推广效果不佳。欢迎任何讨论或更正意见。

Vision-Transformer-PyTorch：包含预训练模型的Pytorch版Vision Transformer(...)

优质

Vision-Transformer-PyTorch项目提供了一个用PyTorch实现的视觉变换器（ViT）框架，并包含了多种预训练模型，适用于图像识别等任务。视觉变压器-火炬视觉变压器的Pytorch实现提供预先训练的pytorch权重，这些是从原始jax/亚麻权重转换而来的。这是与相关项目的合作成果，并介绍了论文中的PyTorch实施方法。我们提供了从预训练的jax/flax模型转化来的预训练pytorch权重。我们也提供了微调和评估脚本。安装环境：使用命令`conda create --name vit --file requirements.txt`创建新的虚拟环境，然后激活该环境以开始工作。可用模델包括多种视觉变压器模型，这些是从原始jax/flax wieghts转换而来的。您可以下载并将文件放在“weights/pytorch”下以使用它们；或者您也可以直接从我们这里获取并将其存放在“weights/jax”目录中以便于使用。我们会在线帮助用户进行权重的转化。支持的数据集目前包括ImageNet2012、CI等三个数据集。

Bio_Embeddings: 从蛋白质序列提取蛋白质嵌入

优质

Bio_Embeddings旨在开发创新算法，用于从大规模蛋白质序列数据中高效地学习和提取蛋白质嵌入表示。这种方法有望革新生物信息学与药物发现领域。了解bio_embeddings的资源：通过嵌入技术从序列快速预测蛋白质结构及功能。阅读当前文档的相关内容。与我们交流探讨：可以直接留言或联系项目团队成员进行深入讨论。我们在ISMB 2020和LMRL 2020会议上介绍了bio_embeddings管道。您可以查阅相关资料了解更多信息。查看管道配置文件，以获取更多细节。项目目标：通过提供单一、一致的界面以及接近零的学习门槛，促进基于语言模型的生物序列表示法在迁移学习中的应用；可重复的工作流程支持多种表示深度（不同实验室训练的不同模型，在不同的数据集上进行训练）为用户处理复杂性问题（例如CUDA OOM抽象），并提供有据可查的警告和错误消息。该项目包括：基于生物学序列（如SeqVec，ProtTrans，UniRep等）上训练的开放模型的一般Python嵌入器；一条管道：将序列转换成矩阵表示形式（每个氨基酸对应一个位置向量）或矢量表示形式（整个序列简化为单一向量），适用于后续机器学习模块。

GoogleNews-vectors-negative300.bin.gz: 预先训练的word2vec模型

优质

GoogleNews-vectors-negative300.bin.gz是一款基于Google新闻数据集训练而成的预训练Word2Vec模型，提供300维词向量表示。词向量预训练模型的官方下载需要科学上网工具支持。为了方便大家下载，在这里提供一个便捷通道，欢迎大家前来获取谷歌预训练词向量资源。

PyTorch下的InsightFace: 预先训练模型的移植

优质

本项目介绍了如何在PyTorch框架下成功移植预先训练好的InsightFace模型，为开发者提供面部识别应用的便捷部署方案。 Pytorch InsightFace 将来自预训练的ResNet模型移植到pytorch。 | 模型 | LFW（%） | CFP-FP（%） | AgeDB-30（%） | MegaFace（%） | |------------|-----------|-------------|---------------|--------------| | iresnet34 | 99.65 | 92.12 | 97.70 | 96.70 | | iresnet50 | 99.80 | 92.74 | 97.76 | 97.64 | | iresnet100 | 99.77 | 98.27 | 98.28 | 98.47 | 安装： ``` pip install git+https://github.com/nizhib/pytorch-insightface ``` 用法： ```python import torch from imageio import imread from torchvision import transforms import insightface embedder = insightface ```

蛋白质二级结构预测：基于机器学习的蛋白质-SS预测

优质

本研究聚焦于利用机器学习技术提升蛋白质二级结构（SS）预测精度。通过分析和建模氨基酸序列信息，开发高效准确的预测模型，促进生物信息学领域的发展与应用。蛋白质二级结构预测可以通过分析其氨基酸序列来进行。首先将所有氨基酸序列合并，并采用20种不同类型的氨基酸及其对应的3个或8个二级结构（分别用E、H和t表示，或者使用另外的8类）。通过滑动窗口技术，在不同的窗口大小下进行处理：例如在21和13的位置上寻找中间位置的氨基酸作为目标结构。每个窗口中的每一个氨基酸都被转换成一个热编码，并且将所有这些单个热编码连接起来形成一个21x20矩阵，这被视为一种黑白图像输入给模型。尝试了使用CNN、RNN、LSTM或GRU进行预测，但对精度的影响不大。基准测试的结果如下： - 预测3种二级结构：准确率为73% - 预测8种二级结构：准确率为52% 该研究依赖于一些特定的库和工具，包括火狐（Torch）、大熊猫、脾气暴躁的Matplotlib 和海生scikit学习。测试是在Python 3.8.3 x64环境下进行的。此方法可以应用于不同的数据集以提高预测精度。

OpenPose官方提供的Caffe预训练模型文件-附件资源

优质

本资源提供OpenPose项目的Caffe框架下的预训练模型文件，便于用户快速上手人体关键点检测，促进姿态估计研究与应用。 openpose官方提供的预训练caffe模型文件可以作为附件资源获取。

是否确定退出登录?

ProtTrans: 提供先进蛋白质预训练的Transformer模型

全部评论 (0)