
Matlab中的互信息计算代码-adjusted_mutual_information: 用于快速并行计算聚类间调整后的互信息的R代码...
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
这段代码实现了一个用MATLAB编写的函数,能够高效地并行计算两个数据集间的调整互信息(AMI),用于评估无监督学习中聚类结果的一致性。
该存储库包含用于在R中快速且并行地计算聚类之间的调整后的相互信息(AMI)、归一化的相互信息(NMI)以及调整后的兰德指数(ARI)的代码。
NMI和ARI被广泛使用,并被视为成熟的分区协议度量标准。而调整后的互信息是由相关研究提出的一种衡量方法,它通过校正随机预期分区重叠的基线值来提供归一化的互信息度量。这可以通过计算观察到的群集大小分布的分区之间的期望互信息(EMI)实现。
该存储库中的代码提供了AMI、NMI和ARI的快速且高效的并行化计算,适用于特定生物学应用:评估将微生物宏基因组序列数据聚集成操作分类单元(OTU)时分区的一致性。所提供的数据是针对大约100万个序列集合进行处理的结果,在这些集合中根据完整链接或平均链接方法被分成了不同的OTU。
两个分区分别以每行代表一个项目的形式保存,R脚本提供了更多详细信息。值得注意的是,该代码具有通用性,并可应用于任何类型的聚类数据;将序列分类为OTU只是一个应用示例而已。
全部评论 (0)
还没有任何评论哟~


