Advertisement

MATLAB独立性检验代码-CausalExplorer_1.5:用于因果发现与变量选择的MATLAB算法库

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
CausalExplorer_1.5是一款专为因果关系分析设计的MATLAB工具包,支持独立性检验、因果结构学习及变量筛选等功能,助力科研人员深入探究数据背后的因果机制。 CausalExplorer_1.5版本(2019年11月)更新内容包括重建所有P代码文件,并与Matlab R2017b(版本9.3)兼容。 在之前的1.4版中,发行时包含适用于Matlab R14的平台独立版本用户手册。新添加了MMPC、PMMPC、MMMB、HITON_PC和HITON_MB等算法,并改进了TPDA与MMHC的实现方式。此外,还增加了更多执行示例以及离散化实用工具。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • MATLAB-CausalExplorer_1.5MATLAB
    优质
    CausalExplorer_1.5是一款专为因果关系分析设计的MATLAB工具包,支持独立性检验、因果结构学习及变量筛选等功能,助力科研人员深入探究数据背后的因果机制。 CausalExplorer_1.5版本(2019年11月)更新内容包括重建所有P代码文件,并与Matlab R2017b(版本9.3)兼容。 在之前的1.4版中,发行时包含适用于Matlab R14的平台独立版本用户手册。新添加了MMPC、PMMPC、MMMB、HITON_PC和HITON_MB等算法,并改进了TPDA与MMHC的实现方式。此外,还增加了更多执行示例以及离散化实用工具。
  • MATLAB-JMI分析
    优质
    本项目提供了一套基于MATLAB实现的独立性检验工具,特别聚焦于计算变量间的偏最小互信息(JMI),适用于复杂数据集的相关性分析。 该文件夹包含了我们所有仿真的代码。我们的模拟使用了以下R包:“FOREACH”,“doSNOW”,“FNN”,“HHG”,“minerva”,“energy”,“copula”,“ks”以及“mJMI”。提供了一个名为installpackages.r的脚本来安装这些包。“mJMI_0.1.0.zip”是我们的R包,它实现了相互信息估计和p值计算来进行独立性测试。可以直接在R环境下安装此包。 文件夹内还包含一个子文件夹“估计效率”,用于针对不同方法、模型以及样本数量来计算MSE的代码。“mJMI”的相关代码位于该子目录下的“R”子目录中,而其他方法如“经验规则KDE”,“lscvKDE”和“插入KDE”的代码也分别放置在不同的语言编写的不同子文件夹下。此外,“Python”子目录包含“混合KSG”和“基于copula的KSG”的相关代码。“Matlab”子目录则存放了名为“MirroredKDE”的方法。 另一个重要的子文件夹是“测试能力”,该文件夹内包含了用于计算不同模型、噪声水平以及多种独立性统计效能所需的代码。
  • MATLAB及HSIC:基希尔伯特-施密特Python实
    优质
    本项目提供了一套MATLAB和Python工具,用于执行独立性检验。其中MATLAB部分采用传统方法,而Python模块则实现了基于希尔伯特-施密特独立性的HSIC算法,适用于复杂数据集的分析与研究。 希尔伯特-施密特独立性标准(HSIC)的原始MATLAB代码已被转换为Python版本。在Windows上使用Python 2.7与Anaconda 4.3.0进行64位测试。 ### 使用方法 导入所需的模块: ```python from HSIC import hsic_gam ``` 应用HSIC: ```python testStat, thresh = hsic_gam(x, y, alph=0.05) ``` ### 函数描述 #### 输入参数 - `hsic_gam()`函数的输入参数如下: - `X`:第一个变量的数据。(n,dim_x) numpy数组。 - `Y`:第二个变量的数据。(n,dim_y) numpy数组。 - `alpha`:测试水平。 #### 输出结果 - `testStat`: 独立性检验统计量。 - `thresh`: 在给定的alpha下,拒绝独立性的阈值。 ### 结果解释 如果`testStat < thresh`,则x和y不具有统计上的独立关系;否则它们是独立的。 ### 作者 Shoubo Hu 如有疑问或需要进一步的帮助,请直接联系作者。
  • VISSA:-MATLAB
    优质
    VISSA: 变量选择方法 是一个基于MATLAB的工具箱,专注于提供高效的算法以进行统计模型中的变量选择。它帮助研究人员和工程师在数据分析中筛选出最相关的影响因素,适用于回归分析、机器学习等多个领域。 一种称为变量迭代空间收缩方法(VISSA)的变量选择方法被提出。该方法的相关研究发表在《分析》期刊第139期中,文章标题为“一种使用加权二进制矩阵抽样迭代优化变量空间的新颖变量选择方法”,作者包括邓登峰、尹玉华、梁玉中和易建中,出版年份是2014年,页码范围从4836到4845。
  • 卡方分析:计卡方值临界值 - MATLAB
    优质
    本项目提供了使用MATLAB进行卡方检验以评估两个分类变量之间独立性的工具。通过计算观测数据的卡方统计量并与给定显著性水平下的临界值比较,来判断变量间是否存在显著关联。 在统计学领域内,独立性卡方检验是一种常用的方法来研究两个分类变量间是否存在关联关系。该方法基于频数表,并通过计算卡方统计量并与临界值比较的方式判断这种相关性的显著程度。 MATLAB提供了名为`chi2test`的函数以方便地执行此类分析。下面我们将详细探讨这一过程: 1. **数据准备**:首先需要一个交叉表或频数分布,其中包含两个分类变量的联合频率。 假设我们有一个关于性别(男性和女性)与是否参加某种活动的数据集。 2. **计算期望频数**:对于每个单元格,在假设两变量间无关联的情况下估计预期出现的频率。这可以通过将行总计乘以列总计再除以样本总数得出。 3. **卡方统计量的计算**: 接下来,通过分别对实际观察值与理论期望值差平方再除以期望频数,并汇总所有单元格的结果来得到卡方统计量(χ²)。 4. **确定自由度**:这由表格中的单元数量减去行和列的数量决定。对于2x2的表来说,自由度为1;更大的表则按公式(行数-1)*(列数-1)计算。 5. **查找临界值**: 根据确定的自由度及选定的显著性水平(通常设为0.05),从卡方分布表中查得相应的临界值,以此作为拒绝原假设的标准。 6. **比较并作出结论**:如果计算出的卡方统计量大于该临界值,则可以认为两个变量间存在显著关联;反之则不能排除它们彼此独立的可能性。 在MATLAB环境中使用`chi2test`函数时,可以通过以下方式来执行上述步骤: ```matlab chi2Stat = chi2test(data, numOfInterval); ``` 其中的`numOfInterval`参数为可选项,用于指定连续性校正中使用的间隔数。当满足条件n/k >= 5且k >= 100时(这里n代表样本总数,而k表示单元格的数量),可以进行这种调整以适应数据分布特征。 此外,该函数还会返回p值——这表示在原假设为真的情况下观察到当前或更极端结果的概率。若此概率小于预设的显著性水平,则应拒绝零假说。 `chi2test`函数的功能使MATLAB成为评估分类变量间独立性的强大工具,在社会学、生物学和市场营销等领域中有着广泛的应用价值,帮助研究人员及数据分析师基于事实证据做出决策。
  • Matlab格兰杰 - Granger:含显著频域格兰杰关系Matlab
    优质
    这段简介描述的是一个在MATLAB环境中运行的程序代码,用于执行包含显著性检验功能的频域格兰杰因果分析。该工具能够帮助研究人员和工程师识别时间序列数据之间的潜在因果关系,并提供统计上的证据以支持这些发现。通过使用频域方法,用户可以获得更深入的理解关于变量间动态互动的本质及其频率特性。 格兰杰因果检验的Matlab代码用于频域中的格兰杰因果关系分析及显著性测试。
  • Fisher精确P值方2x2列联表行/列-MATLAB
    优质
    本文章介绍了利用MATLAB软件进行Fisher精确概率测试的方法,该方法适用于分析2x2列联表中的行列独立性问题。提供详细代码示例和理论基础。 这是一种用于离散数据的非参数统计检验方法,旨在确定两个变量之间是否存在非随机关联。Mid-P值在普通精确检验与大样本方法之间的保守性方面提供了一个合理的折衷方案,并且通常表现出良好的性能,略微偏向于保守一侧。目前许多领先的统计学家都推荐使用这种方法。 输入的数据包括观察计数的数据矩阵(2x2表)和用于计算p值的替代假设选择: - ne 表示双尾测试(默认) - gt 表示右尾:备择假设为变量间存在正相关 - lt 表示左尾:备择假设为变量间存在负相关 输出结果是P值,可以通过以下方式使用: ``` P = FisherExtest(Observed, ne) ```
  • 特征工具箱:MATLAB特征- matlab
    优质
    特征选择工具箱是一款专为MATLAB设计的功能库,提供多种算法进行特征选择和降维处理,旨在提升机器学习模型性能和简化数据集结构。 特征选择库 (FSLib 2018) 是一个广泛适用的 MATLAB 特征选择工具包。该库包含以下方法: - ILFS - 信息系统 - ECFS - 先生 - 救济f - mutinffs - fsv - 拉普拉斯 - mcfs - 射频 - L0 - 费舍尔 - UDFS - 有限责任公司 如果您使用我们的工具箱(或其中包含的方法),请考虑引用以下文献: Roffo, G.、Melzi, S.、Castellani, U. 和 Vinciarelli, A., 2017 年。无限潜在特征选择:基于概率潜在图的排名方法。arXiv 预印本 arXiv:1707.07538。 Roffo, G.、Melzi, S. 和 Cristani, M., 2015 年。无限特征选择。在 IEEE 计算机视觉国际会议论文中。
  • PSO特征(MATLAB)
    优质
    本简介介绍了一种基于粒子群优化(PSO)的特征选择算法,并提供了相应的MATLAB实现代码,旨在提高机器学习模型性能。 运行文件PSO即可启动程序。该程序包含相应的中文解释,并提供了四个相关数据集:前缀为data的是数据文件,前缀为target的是标签文件。 注意:本程序使用MATLAB 2016a版本及内置的SVM功能编写。如果已安装林志仁版的SVM插件,则可能会导致程序运行失败。解决方法是将MATLAB路径设置恢复到默认状态后重新运行程序。
  • 光谱数据特征
    优质
    本研究探讨了光谱数据分析中的变量选择和特征选择算法,旨在提高模型预测精度,减少噪声影响,为化学计量学及机器学习领域提供新的视角和方法。 光谱的变量选择或特征选择算法用于从大量光谱数据中挑选出对模型构建最有价值的信息,以提高预测准确性和模型解释性。这些方法能够有效减少冗余和噪音信息的影响,优化计算资源利用,并有助于更好地理解复杂体系中的关键成分及其相互作用机制。