本研究探讨了一种先进的特征选择算法,利用互信息原理在大数据中挑选出最具代表性的变量。通过MATLAB等工具实现高效的信息论特征提取,推动机器学习与数据挖掘领域的进步。
描述:以下基于MI的特征选择方法的代码(Matlab/C++ Mex)包括:
- 最大相关性 (maxRel)
- 最小冗余最大相关性(MRMR)
- 最小冗余 (minRed)
- 二次编程特征选择 (QPFS)
- 互信息商(MIQ)
- 最大相关最小总冗余 (MRMTR) 或扩展 MRMR (EMRMR)
- 光谱松弛全局条件互信息 (SPEC_CMI)
- 条件互信息最小化 (CMIM)
- 条件 Infomax 特征提取 (CIFE)
参考文献:
Nguyen X. Vinh、Jeffrey Chan、Simone Romano 和 James Bailey,2014年8月24日至27日在纽约市举行的第20届ACM SIGKDD知识发现和数据挖掘会议(KDD14)上发表。