Advertisement

ProtTrans: 提供先进蛋白质预训练的Transformer模型

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
简介:ProtTrans是一种先进的基于Transformer架构的模型,专门用于蛋白质的预训练。它能够有效提升生物信息学领域中各类任务的表现,为药物设计和生物学研究提供强大支持。 ProtTrans 提供了最先进的蛋白质预训练模型,并通过使用数千个来自Summit的GPU以及各种Transformers模型中的Google TPU进行了培训。欲了解更多关于我们的工作,请查阅我们的论文。此存储库将定期更新,以支持生物信息学界,特别是我们SASAR项目在Covid-19研究方面的进展。 目录: - 预言 - 蛋白质序列生成 - 可视化 - 基准测试 - 期望成绩 - 二级结构预测(第3季度) - 二级结构预测(Q8) - 膜结合与水溶性(Q2) - 亚细胞定位(Q10) - 社区和贡献 - 遇到问题? - 发现错误? - 特别要求 - 团队成员

全部评论 (0)

还没有任何评论哟~
客服
客服
  • ProtTrans: Transformer
    优质
    简介:ProtTrans是一种先进的基于Transformer架构的模型,专门用于蛋白质的预训练。它能够有效提升生物信息学领域中各类任务的表现,为药物设计和生物学研究提供强大支持。 ProtTrans 提供了最先进的蛋白质预训练模型,并通过使用数千个来自Summit的GPU以及各种Transformers模型中的Google TPU进行了培训。欲了解更多关于我们的工作,请查阅我们的论文。此存储库将定期更新,以支持生物信息学界,特别是我们SASAR项目在Covid-19研究方面的进展。 目录: - 预言 - 蛋白质序列生成 - 可视化 - 基准测试 - 期望成绩 - 二级结构预测(第3季度) - 二级结构预测(Q8) - 膜结合与水溶性(Q2) - 亚细胞定位(Q10) - 社区和贡献 - 遇到问题? - 发现错误? - 特别要求 - 团队成员
  • Transformer语言
    优质
    预训练的Transformer语言模型是基于自注意力机制的深度学习架构,广泛应用于自然语言处理任务中,通过大规模文本数据进行预训练以捕捉语义信息。 Transformer是一种预训练语言模型。
  • Swin Transformer参数
    优质
    Swin Transformer是一款先进的视觉Transformer模型,用于图像识别任务。本文将介绍其内部所使用的预训练模型及其关键参数配置。 这段文字包含三个文件名:swin_base_patch4_window7_224.pth、swin_small_patch4_window7_224.pth 和 swin_tiny_patch4_window7_224.pth。
  • SRN-DeblurNet: PyTorch实现及
    优质
    简介:SRN-DeblurNet是一款用于图像去模糊任务的深度学习模型,基于PyTorch框架开发,并提供了经过大量数据训练得到的预训练模型。 为了训练SRN-DeblurNet模型,我严格按照原始论文中的所有配置进行操作。在测试PSNR值时,我把GOPRO数据集的测试部分分为两半:一半用于验证,另一半用于最终测试,并得到了29.58db PSNR的结果(而原论文报道的数据为30.26db)。我已经提供了预训练模型。 值得注意的是,在没有进行伽玛校正的情况下也可以对GOPRO中的模糊图像进行训练。我尝试将该模型应用到真实世界中的人脸图像上,但发现其推广效果不佳。欢迎任何讨论或更正意见。
  • Vision-Transformer-PyTorch:包含Pytorch版Vision Transformer(...)
    优质
    Vision-Transformer-PyTorch项目提供了一个用PyTorch实现的视觉变换器(ViT)框架,并包含了多种预训练模型,适用于图像识别等任务。 视觉变压器-火炬视觉变压器的Pytorch实现提供预先训练的pytorch权重,这些是从原始jax/亚麻权重转换而来的。这是与相关项目的合作成果,并介绍了论文中的PyTorch实施方法。我们提供了从预训练的jax/flax模型转化来的预训练pytorch权重。我们也提供了微调和评估脚本。 安装环境:使用命令`conda create --name vit --file requirements.txt`创建新的虚拟环境,然后激活该环境以开始工作。 可用模델包括多种视觉变压器模型,这些是从原始jax/flax wieghts转换而来的。您可以下载并将文件放在“weights/pytorch”下以使用它们;或者您也可以直接从我们这里获取并将其存放在“weights/jax”目录中以便于使用。我们会在线帮助用户进行权重的转化。 支持的数据集目前包括ImageNet2012、CI等三个数据集。
  • Bio_Embeddings: 从序列嵌入
    优质
    Bio_Embeddings旨在开发创新算法,用于从大规模蛋白质序列数据中高效地学习和提取蛋白质嵌入表示。这种方法有望革新生物信息学与药物发现领域。 了解bio_embeddings的资源: 通过嵌入技术从序列快速预测蛋白质结构及功能。 阅读当前文档的相关内容。 与我们交流探讨:可以直接留言或联系项目团队成员进行深入讨论。 我们在ISMB 2020和LMRL 2020会议上介绍了bio_embeddings管道。您可以查阅相关资料了解更多信息。 查看管道配置文件,以获取更多细节。 项目目标: 通过提供单一、一致的界面以及接近零的学习门槛,促进基于语言模型的生物序列表示法在迁移学习中的应用; 可重复的工作流程 支持多种表示深度(不同实验室训练的不同模型,在不同的数据集上进行训练) 为用户处理复杂性问题(例如CUDA OOM抽象),并提供有据可查的警告和错误消息。 该项目包括: 基于生物学序列(如SeqVec,ProtTrans,UniRep等)上训练的开放模型的一般Python嵌入器; 一条管道:将序列转换成矩阵表示形式(每个氨基酸对应一个位置向量)或矢量表示形式(整个序列简化为单一向量),适用于后续机器学习模块。
  • GoogleNews-vectors-negative300.bin.gz: word2vec
    优质
    GoogleNews-vectors-negative300.bin.gz是一款基于Google新闻数据集训练而成的预训练Word2Vec模型,提供300维词向量表示。 词向量预训练模型的官方下载需要科学上网工具支持。为了方便大家下载,在这里提供一个便捷通道,欢迎大家前来获取谷歌预训练词向量资源。
  • PyTorch下InsightFace: 移植
    优质
    本项目介绍了如何在PyTorch框架下成功移植预先训练好的InsightFace模型,为开发者提供面部识别应用的便捷部署方案。 Pytorch InsightFace 将来自预训练的ResNet模型移植到pytorch。 | 模型 | LFW(%) | CFP-FP(%) | AgeDB-30(%) | MegaFace(%) | |------------|-----------|-------------|---------------|--------------| | iresnet34 | 99.65 | 92.12 | 97.70 | 96.70 | | iresnet50 | 99.80 | 92.74 | 97.76 | 97.64 | | iresnet100 | 99.77 | 98.27 | 98.28 | 98.47 | 安装: ``` pip install git+https://github.com/nizhib/pytorch-insightface ``` 用法: ```python import torch from imageio import imread from torchvision import transforms import insightface embedder = insightface ```
  • 二级结构测:基于机器学习-SS
    优质
    本研究聚焦于利用机器学习技术提升蛋白质二级结构(SS)预测精度。通过分析和建模氨基酸序列信息,开发高效准确的预测模型,促进生物信息学领域的发展与应用。 蛋白质二级结构预测可以通过分析其氨基酸序列来进行。首先将所有氨基酸序列合并,并采用20种不同类型的氨基酸及其对应的3个或8个二级结构(分别用E、H和t表示,或者使用另外的8类)。通过滑动窗口技术,在不同的窗口大小下进行处理:例如在21和13的位置上寻找中间位置的氨基酸作为目标结构。每个窗口中的每一个氨基酸都被转换成一个热编码,并且将所有这些单个热编码连接起来形成一个21x20矩阵,这被视为一种黑白图像输入给模型。 尝试了使用CNN、RNN、LSTM或GRU进行预测,但对精度的影响不大。基准测试的结果如下: - 预测3种二级结构:准确率为73% - 预测8种二级结构:准确率为52% 该研究依赖于一些特定的库和工具,包括火狐(Torch)、大熊猫、脾气暴躁的Matplotlib 和海生scikit学习。测试是在Python 3.8.3 x64环境下进行的。 此方法可以应用于不同的数据集以提高预测精度。
  • OpenPose官方Caffe文件-附件资源
    优质
    本资源提供OpenPose项目的Caffe框架下的预训练模型文件,便于用户快速上手人体关键点检测,促进姿态估计研究与应用。 openpose官方提供的预训练caffe模型文件可以作为附件资源获取。