
Molecules_Dataset_Collection: 收集分子数据集以验证性质推测
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Molecules_Dataset_Collection项目致力于搜集广泛的分子数据集,用于测试和验证对分子特性的预测模型。
收集分子及其性质的数据集:它是什么?受到启发式分子(SMILES)和理化特性数据集的选择目标是什么? 数据集中包含的SMILES已通过将数据集聚集在同一位置进行整理。这些经过处理的数据集合在这里可以使用,用于验证各种机器学习模型在推断分子性质上的效果。
为了确保一致性,在所有数据集中进行了正则化处理以输出异构、规范和kekulise SMILES(如果无法成功进行此操作,则会保留原始SMILES并用空格替换)。这些数据集包括:
1. **量子力学**:QM9,包含通过DFT建模的小分子的几何形状、能量、电子及热力学性质。
2. **物理化学**:ESOL和FreeSolv,涉及溶剂化自由能与溶解度预测等任务。
3. **生物物理学(亲脂性)**:PCBA, HIV, BACE,用于评估药物活性以及相关生物学效应的研究中使用。
4. **生理学**:BBBP、Tox21、ToxCast、SIDER和ClinTox,这些数据集涵盖了血脑屏障渗透率预测及毒性研究等方面。
全部评论 (0)
还没有任何评论哟~


