Advertisement

胰蛋白酶:硅基胰蛋白酶消化工具

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
本工具采用硅基技术优化胰蛋白酶,用于高效、精确地进行蛋白质样品的酶解处理,适用于生物化学和分子生物学研究。 在计算机胰蛋白酶消化过程中: 用法:python trypsin.py --input input_filename --output output_filename --miss 1 笔记: 该脚本是在Python 2.7下编写的。 Biopython是先决条件。 此处共享的胰蛋白酶消化脚本遵循脯氨酸规则,这意味着如果脯氨酸(P)后接赖氨酸(K)或精氨酸(R),则不会进行剪切。 程序输出一个文本格式文件,该文件的第一列包含蛋白质ID,第二列包含相应的胰蛋白酶肽。 如何使用: 将您的fasta文件和此脚本复制到同一文件夹中。 打开命令终端并cd到该文件夹。 输入:python trypsin.py --input input_filename --output output_filename --miss 1 三个参数是: -input:您的fasta文件的名称,其中包含要消化的内容。 -output:输出结果文件名。 -miss:允许漏切的数量,默认为1。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 优质
    本工具采用硅基技术优化胰蛋白酶,用于高效、精确地进行蛋白质样品的酶解处理,适用于生物化学和分子生物学研究。 在计算机胰蛋白酶消化过程中: 用法:python trypsin.py --input input_filename --output output_filename --miss 1 笔记: 该脚本是在Python 2.7下编写的。 Biopython是先决条件。 此处共享的胰蛋白酶消化脚本遵循脯氨酸规则,这意味着如果脯氨酸(P)后接赖氨酸(K)或精氨酸(R),则不会进行剪切。 程序输出一个文本格式文件,该文件的第一列包含蛋白质ID,第二列包含相应的胰蛋白酶肽。 如何使用: 将您的fasta文件和此脚本复制到同一文件夹中。 打开命令终端并cd到该文件夹。 输入:python trypsin.py --input input_filename --output output_filename --miss 1 三个参数是: -input:您的fasta文件的名称,其中包含要消化的内容。 -output:输出结果文件名。 -miss:允许漏切的数量,默认为1。
  • 于GNNs的质-质相互作用研究
    优质
    本研究利用图神经网络(GNNs)技术深入探究蛋白质间的相互作用机制,旨在提升对复杂生物系统理解及药物设计效率。 探索图注意力网络(GAT)架构和图卷积网络(GCN)架构来对蛋白质-蛋白质相互作用数据集中的节点进行分类。在PyTorch中实现。 运行方法: 1. 安装requirements.txt文件中列出的依赖项。 2. 要运行训练脚本,请使用以下命令:python train.py --model_type= --input_dir= --output_dir=
  • Bio_Embeddings: 从质序列提取质嵌入
    优质
    Bio_Embeddings旨在开发创新算法,用于从大规模蛋白质序列数据中高效地学习和提取蛋白质嵌入表示。这种方法有望革新生物信息学与药物发现领域。 了解bio_embeddings的资源: 通过嵌入技术从序列快速预测蛋白质结构及功能。 阅读当前文档的相关内容。 与我们交流探讨:可以直接留言或联系项目团队成员进行深入讨论。 我们在ISMB 2020和LMRL 2020会议上介绍了bio_embeddings管道。您可以查阅相关资料了解更多信息。 查看管道配置文件,以获取更多细节。 项目目标: 通过提供单一、一致的界面以及接近零的学习门槛,促进基于语言模型的生物序列表示法在迁移学习中的应用; 可重复的工作流程 支持多种表示深度(不同实验室训练的不同模型,在不同的数据集上进行训练) 为用户处理复杂性问题(例如CUDA OOM抽象),并提供有据可查的警告和错误消息。 该项目包括: 基于生物学序列(如SeqVec,ProtTrans,UniRep等)上训练的开放模型的一般Python嵌入器; 一条管道:将序列转换成矩阵表示形式(每个氨基酸对应一个位置向量)或矢量表示形式(整个序列简化为单一向量),适用于后续机器学习模块。
  • 质数据集——portein.txt
    优质
    protein.txt是一个包含各种蛋白质相关信息的数据文件,包括氨基酸序列、结构特性等关键数据,为生物学和医学研究提供重要资源。 protein.txt是一个用制表符分隔的文本段落件,其中包含欧洲蛋白质消费数据(Protein Consumption in Europe)。该数据集提供了25个欧洲国家对9类食物的蛋白质消耗情况,由25行10列组成。每一行记录代表一个国家的蛋白质消费数据。
  • NGL: WebGL浏览器
    优质
    NGL是一款基于WebGL技术的蛋白质结构可视化工具,它能够高效地渲染复杂的生物分子模型,并提供丰富的交互功能以支持科学研究与教育。 NGL Viewer 是一款用于分子可视化的Web应用程序,能够展示蛋白质、DNA/RNA等多种形式的分子结构。它支持以下功能: - 分子结构显示(mmCIF, PDB, PQR, GRO, SDF, MOL2, MMTF) - 密度体积数据查看(MRC/MAP/CCP4,DX/DXBIN,CUBE,BRIX/DSN6,XPLOR/CNS) - 用户交互功能(鼠标选择、语言切换、动画播放和图像导出) - 坐标轨迹显示(DCD 和 PSF, NCTRAJ 和 PRMTOP, TRR/XTC 和 TOP,远程访问MDSrv) 此外,NGL Viewer 可以作为独立文件或通过API嵌入到其他应用中使用。由于它是一组静态Web文件,因此无需复杂的安装过程。在开发过程中,在本地提供服务会非常有用。 当将NGL Viewer 作为一个库来使用时,请包含自包含的build dist/ ngl.js 文件即可。
  • 质二级结构预测:于机器学习的质-SS预测
    优质
    本研究聚焦于利用机器学习技术提升蛋白质二级结构(SS)预测精度。通过分析和建模氨基酸序列信息,开发高效准确的预测模型,促进生物信息学领域的发展与应用。 蛋白质二级结构预测可以通过分析其氨基酸序列来进行。首先将所有氨基酸序列合并,并采用20种不同类型的氨基酸及其对应的3个或8个二级结构(分别用E、H和t表示,或者使用另外的8类)。通过滑动窗口技术,在不同的窗口大小下进行处理:例如在21和13的位置上寻找中间位置的氨基酸作为目标结构。每个窗口中的每一个氨基酸都被转换成一个热编码,并且将所有这些单个热编码连接起来形成一个21x20矩阵,这被视为一种黑白图像输入给模型。 尝试了使用CNN、RNN、LSTM或GRU进行预测,但对精度的影响不大。基准测试的结果如下: - 预测3种二级结构:准确率为73% - 预测8种二级结构:准确率为52% 该研究依赖于一些特定的库和工具,包括火狐(Torch)、大熊猫、脾气暴躁的Matplotlib 和海生scikit学习。测试是在Python 3.8.3 x64环境下进行的。 此方法可以应用于不同的数据集以提高预测精度。
  • Peptagram:质组学实验的HTML5互动可视
    优质
    Peptagram是一款基于HTML5开发的交互式在线工具,专为蛋白质组学实验的数据可视化而设计,帮助科研人员更直观地分析和理解复杂的肽段数据。 PEPTAGRAM 是一个单页 HTML5 网络应用程序,用于可视化蛋白质组学分析,并支持在多个实验之间进行图形比较。 生成的 HTML5 应用程序具有以下特点: - 可立即使用:可以在任何现代 Web 浏览器上运行。 - 跨平台:每个人都有网络浏览器可以访问。 - 自包含:只需提供一个 zip 目录,通过电子邮件发送即可发布。 - 发布简便:可安装在任意服务器上,甚至可以直接部署到 Dropbox 上。 关于 PEPTAGRAM 的更多信息,请参考相关文档。PEPTAGRAM 由一组 Python 脚本组成,用于将蛋白质组学数据转换为 HTML5 可视化效果,并需要 Python 版本 2.7 或更高版本支持运行环境。 对于开发人员来说,若要使用 PEPTAGRAM 模块,请执行以下命令: - 使用 pip 安装:`pip install peptagram` - 或者下载软件包后通过如下命令安装: `python setup.py install` 希望以上信息对您有所帮助。
  • 用于质质谱数据可视的软件
    优质
    本软件是一款专为蛋白质质谱数据分析设计的专业可视化工具,它能够高效处理和展示复杂的质谱数据,帮助研究人员快速准确地识别和分析蛋白质。 一种用于蛋白质质谱数据可视化的软件由荣双梅和苏忠城开发。质谱分析方法在蛋白质组学研究中被广泛应用。然而,不同类型的质谱仪产生的初始数据格式存在差异,这严重阻碍了对蛋白质的鉴定与定量研究。
  • GE Healthcare质纯手册(中文版)
    优质
    《GE Healthcare蛋白质纯化手册》(中文版)为生命科学研究者和生物制药工程师提供了详尽的蛋白质分离与纯化的技术指南,涵盖实验步骤、技巧及案例分析。 《蛋白质纯化手册》(GE Healthcare 中文版)是一本详细介绍如何使用GE Healthcare提供的设备和技术进行高效蛋白质纯化的指南。该手册涵盖了从基本的实验操作到高级技术应用,包括各种色谱方法、层析介质的选择以及数据分析等内容,旨在帮助研究人员和工程师优化其工作流程并提高工作效率。 这本书对于从事生物制药、学术研究或工业生产的专业人士来说是一份宝贵的资源。通过遵循书中的指导原则,读者可以掌握蛋白质分离与纯化的关键步骤和技术细节,从而更好地解决实际工作中遇到的问题,并推动相关领域的科学研究与发展。
  • DNA至转换器:将DNA序列转变为质序列的程序
    优质
    DNA至蛋白转换器是一款创新软件工具,专门用于解析基因信息,能够高效准确地将DNA序列转化为对应的氨基酸序列。它简化了生物信息学研究中的复杂计算过程,为遗传工程和分子生物学的研究提供了有力支持。 项目简介 根据以下强制性要求编写一个计算机程序(可使用任何脚本语言)来将分配给您的DNA序列(以.fasta格式提供;请参阅附录),转换为蛋白质序列: 1. 蛋白质的最小长度应为44个氨基酸。 2. 对于蛋白质的最大长度没有限制。 3. 如果输入文件不是.fasta格式,则程序需抛出消息“输入文件不是.fasta格式”。 4. 若给定的文件包含非DNA字符,程序则需要引发一条消息:“输入文件不包含DNA序列数据”。 提交内容应包括: - 您编写的代码 - 一个.txt、.doc或.pdf文档,其中包含: - 发现的蛋白质总数 - 在不同长度范围下发现的蛋白质数量:44至100个氨基酸;100至500个氨基酸;超过500个氨基酸 项目管理员 :red_heart: 祝您编码愉快 :man::laptop: 请记得给代码点赞,如果您喜欢的话。