Advertisement

Descriptastorus:用于化学机器学习的描述符计算及可选存储

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
Descriptastorus是一款高效的工具,专门设计用于加速化学机器学习中的描述符计算,并提供灵活的数据存储选项,助力科研人员快速推进研究进程。 DescriptaStorus 提供快速随机访问功能,适合用于机器学习以及索引分子文件的场景。它提供了一种机制来为新分子生成新的描述符,并且验证了在不同的软件/硬件环境中可以重现相同的存储内容。此外,还包含一个简单的脚本,可以根据原始数据创建自己的描述符文件。 使用 DescriptaStorus 的基本方法有三种: 1. 使用脚本来制作 DescriptaStore。 2. 将新数据追加到现有的存储中。 3. 通过 DescriptaStore 访问属性。 要开始使用,您需要安装以下库: - rdkit - scikit-learn 可以通过如下命令进行安装: ``` pip install git+https://github.com/bp-kelley/descriptastorus.git ``` 此外,请确保您的环境中已经安装了 kyotocabinet 库。Kyotocabinet 是读写 InChIKey 和名称索引所必需的。 在 setup.py 文件中可能会有其他要求,但实际需要的是 Python 2 / 3 环境和 R 软件包的支持。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Descriptastorus
    优质
    Descriptastorus是一款高效的工具,专门设计用于加速化学机器学习中的描述符计算,并提供灵活的数据存储选项,助力科研人员快速推进研究进程。 DescriptaStorus 提供快速随机访问功能,适合用于机器学习以及索引分子文件的场景。它提供了一种机制来为新分子生成新的描述符,并且验证了在不同的软件/硬件环境中可以重现相同的存储内容。此外,还包含一个简单的脚本,可以根据原始数据创建自己的描述符文件。 使用 DescriptaStorus 的基本方法有三种: 1. 使用脚本来制作 DescriptaStore。 2. 将新数据追加到现有的存储中。 3. 通过 DescriptaStore 访问属性。 要开始使用,您需要安装以下库: - rdkit - scikit-learn 可以通过如下命令进行安装: ``` pip install git+https://github.com/bp-kelley/descriptastorus.git ``` 此外,请确保您的环境中已经安装了 kyotocabinet 库。Kyotocabinet 是读写 InChIKey 和名称索引所必需的。 在 setup.py 文件中可能会有其他要求,但实际需要的是 Python 2 / 3 环境和 R 软件包的支持。
  • 工具
    优质
    机器学习算法的可视化工具旨在通过图形界面展示复杂的数据和模型,帮助用户更直观地理解和优化机器学习过程。 该工具用于可视化各种机器学习算法的过程和结果,使理解算法更加容易。
  • Dragon
    优质
    Dragon计算描述符是一款专为化学信息学设计的强大工具,用于高效计算分子的各种描述符,助力药物发现和材料科学的研究与开发。 这款工具非常实用,可以计算1480多个描述符,并且无需安装即可使用。
  • 我们评估了五种基分子法(包括随森林(RF))
    优质
    本研究对比分析了五种利用分子描述符的机器学习方法的效果,重点探讨了随机森林算法在预测模型中的应用与优势。 我们评估了五种基于分子描述符的机器学习算法:随机森林 (RF)、支持向量回归 (SVR)、深度学习模型 (DNN)、梯度提升树 (GBM) 以及 Adaboost 提升树 (ADA),同时还包括三种图神经网络方法:信息传递神经网络 (D-MPNN) 和 Attentive FP。
  • 个人EMC模拟
    优质
    本工具为个人学习设计,提供真实的EMC存储系统操作体验和故障处理场景,助力用户深入了解存储架构与技术。 EMC存储模拟器适合个人学习使用。
  • -TensorBoard(12)
    优质
    本教程详细讲解了如何使用TensorBoard进行机器学习模型的可视化,包括模型结构、训练过程和性能指标的展示,帮助理解和优化机器学习项目。 人工智能基础视频教程零基础入门课程 本课程适合完全没有编程经验的初学者学习。共包含15章内容: 第一章:介绍人工智能开发及未来前景(预科) 第二章:线性回归深入解析与代码实现 第三章:梯度下降、过拟合和归一化详解 第四章:逻辑回归详细讲解及其应用案例 第五章:分类器项目实例分析以及神经网络算法简介 第六章:多分类问题解决方案,决策树及随机森林分类方法介绍 第七章:各类模型的评估标准与聚类技术基础 第八章:密度聚类和谱聚类方法概述 第九章:深度学习入门、TensorFlow安装指导及其基本应用实例 第十章:深入讲解TensorFlow框架特性以及使用TensorBoard进行可视化分析的方法 第十一章:DNN(深层神经网络)手写数字识别案例解析 第十二章:利用TensorBoard工具实现模型训练过程的可视化展示 第十三章:卷积神经网络(CNN)原理及其在图像分类任务中的应用实例 第十四章:深入探讨卷积神经网络架构,以AlexNet为例讲解其设计思想与实践技巧 第十五章:Keras深度学习库简介及实战演练
  • 传统法概
    优质
    传统机器学习算法概述:本文介绍了经典机器学习的核心理论与常用技术,包括监督、非监督和半监督学习方法,以及回归、分类和支持向量机等模型。 该资源由本人编写,主要内容涵盖了传统机器学习中的k近邻、朴素贝叶斯、支持向量机(SVM)、感知机以及逻辑回归算法,并对其思想及优缺点进行了总结。由于这份文档仅为个人学习时的笔记,请读者见谅并欢迎指出其中的问题。
  • 号在
    优质
    本文章介绍了数学符号在机器学习领域的重要作用,阐述了各类数学符号的应用场景及其对算法设计和理论分析的影响。 这里总结了机器学习中常用的数学符号,帮助自己方便记忆。
  • 大数据法综
    优质
    本文综述了在大数据背景下机器学习算法的发展趋势与研究进展,涵盖了监督学习、无监督学习及深度学习等领域的新颖技术与应用案例。 随着产业界数据量的急剧增长,大数据概念引起了广泛的关注与热情。企业的需求和关注点发生了显著变化:企业的重点从传统的计算速度转向了对数据处理能力的要求;计算机行业也由追求高速运算转变为专注于信息行业的开发,软件发展则更多地聚焦于如何高效处理数据而非单纯的数据采集与存储。机器学习算法在学术研究中具有重要的理论价值,在实际应用中也有很高的实用价值。然而,由于大数据的海量性、多样性和快速变化的特点,传统的基于小规模数据集的机器学习方法已不再适用许多场景。因此,针对大数据环境下的机器学习算法的研究成为当前学界和业界共同关注的重点。 本段落主要探讨了目前用于处理大规模数据集中所使用的机器学习技术的发展现状,并进行了总结分析;此外还特别介绍了几种并行计算的方法作为解决大数据挑战的有效手段之一;文中也指出了在进行此类研究过程中遇到的一些关键问题,最后提出了未来大数据环境下机器学习领域可能的研究方向。
  • 文献综
    优质
    本论文为读者提供了一篇全面的机器学习领域文献综述,涵盖了算法发展、应用案例及未来趋势等关键方面。 机器学习文献综述探讨了该领域的最新进展、关键技术和未来发展方向。通过对现有研究的分析,可以更好地理解当前机器学习面临的挑战以及潜在的研究机会。这类综述通常涵盖了监督学习、无监督学习、强化学习等多个方面,并可能包括深度学习等前沿技术的应用和创新点。