Advertisement

Kernel Density Estimator是一种高效可靠的核密度估计方法,特别适用于一维数据,并为MATLAB开发。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该方法提供了一个可靠且速度极快的单维数据核密度估计器。其核心假设采用高斯核函数,并具备自动选择带宽的特性。与其他许多实现不同,该实现并未受到多模态密度问题的影响,即使问题中存在具有广泛分离模式的多模态密度分布。值得注意的是,由于我们始终不预设数据的参数模型(例如经验法则所使用的模型),因此多模态密度的估计不会导致性能下降。输入参数包括:数据——用于构建密度估计的向量;n——网格点数间隔,位于 [MIN, MAX] 范围内,必须是 2 的幂次方;如果 n 不是 2 的幂,则将其向上取整至 2 的下一个幂,默认值为 n=2^12;MIN, MAX——定义用于构建密度估计的区间 [MIN, MAX]。默认情况下,MIN 和 MAX 的值分别设置为 MIN=min(data)-Range/10 和 MAX=max(data)+Range/10,其中 Range 定义为 max(data)-min(data)。输出结果为:带宽——最佳带宽值。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 器:Kernel Density Estimator-MATLAB
    优质
    本项目提供了一种高效的MATLAB工具,用于进行一维数据的核密度估计。该工具实现了多种内核函数选择和优化带宽的方法,为数据分析提供了强大的支持。 这是一个可靠且高效的一维数据核密度估计器;它假设使用高斯核并自动选择带宽。与许多其他实现不同,此实现不受多模态密度中广泛分离模式问题的影响(参见示例)。对于多模态密度的估计不会恶化,因为我们不假定任何参数模型来描述数据(例如经验法则所使用的模型)。 输入: - 数据:用于构建密度估计的数据向量; - n:定义均匀离散化区间 [MIN, MAX] 的网格点数。n 必须是 2 的幂;若不是,则向上取整至最近的 2 的幂,即 n=2^ceil(log2(n))。 - MIN 和 MAX:构建密度估计的区间的最小值和最大值,默认设置为 MIN=min(data)-Range/10, MAX=max(data)+Range/10(其中 Range=max(data)-min(data))。默认情况下,n 设置为 2 的 12 次幂。 输出: - 带宽:用于核密度估计的最优带宽。
  • 快速多元器-Kernel Density Estimator for High Dimensions(matlab...)
    优质
    本项目提供了一个高效的Matlab工具箱,用于在高维度空间中进行快速多元核密度估计。该工具箱通过优化算法显著提升了计算速度和准确性,适用于大规模数据集的统计分析和机器学习应用。 一个m文件中的高维快速自适应核密度估计提供了最佳的精度与速度权衡,并通过参数“gam”进行控制;对于处理大数据的应用程序来说,使用较小的“gam”值可以提高运行效率;通常情况下,“gam”的默认设置为 n^(1/2),其中n代表数据点的数量。 用法如下:[pdf,X1,X2]=akde(X,grid,gam) 输入参数: - X: 数据以 n 乘 d 的向量形式表示; - 网格:用于计算概率密度函数的维度为d,包含m个点,默认仅适用于二维数据;有关如何在更高维度中构建它的示例,请参阅相关文档。 - gam(可选):成本与精度权衡参数,其中gam应小于n。默认值设置为ceil(n^(1/2));较大的“gam”值可能会提高准确性但会降低速度;为了加速代码运行,可以使用较小的“gam”。 输出: - pdf: 在网格上的估计密度值; - X1,X2:仅在二维数据中提供,默认的网格。
  • 随机分形搜索(SFS):元启式算- MATLAB
    优质
    简介:随机分形搜索(SFS)是一种创新的元启发式算法,旨在提供高效和可靠的解决方案。本文通过MATLAB实现并展示了SFS在解决复杂优化问题中的优越性能。 这段代码介绍了一种新的算法,它为解决与分形扩散特性相关的优化问题提供了新颖的视角。该算法能够在最少的迭代次数内找到误差最小(或接近最小)且接近全局最优解的结果,在准确性、收敛速度以及操作简便性方面都有所提升。
  • Gap Statistic算算二集最优聚类 - MATLAB
    优质
    本MATLAB项目提供了一个实现Gap统计量算法的工具箱,用于确定二维数据集进行聚类分析时的最佳类别数。 一个小的“工具箱”(仅包含三个文件),用于通过 Tibshirani、Walther 和 Hastie 的间隙统计算法(2001 年)来估计二维数据集中的最佳聚类数。代码已完全注释,以便您理解起来没有问题。如果您有任何疑问,请随时联系我。更多详细信息可以在包中包含的 READ ME 文件里找到。 祝健康长寿、繁荣昌盛。
  • KDE——非参
    优质
    简介:KDE高斯核密度估计是一种用于概率分布函数估计的统计技术,采用非参数方法来平滑数据点,适用于探索性数据分析和假设检验。 KDE(核密度估计)是非参数估计的一种方法,它使用高斯核函数来进行概率密度的估算,在独立成分分析以及确定控制限的过程中有广泛应用。
  • 散点图-Density Scatter-MATLAB
    优质
    本项目提供了一个MATLAB工具箱用于创建密度散点图,能够有效地展示大规模数据集中的分布情况和潜在模式。 散点图的点可以根据密度进行着色。
  • SimHash:文本相似
    优质
    SimHash是一种用于快速评估文档之间相似性的算法。通过将文本转换为哈希值,该技术能够高效地捕捉到不同文档之间的语义接近程度,在信息检索和数据去重中发挥重要作用。 SimHash是一种高效的文本相似度去重算法,适用于大批量文档的相似度计算。其主要步骤包括:对文本进行分词处理,得到N维特征向量(默认为64维);设置分词权重(使用tf-idf方法);计算特征向量的哈希值;将所有特征向量加权累加(目前仅采用非加权累加方式);根据累加结果进行二进制化处理,大于零置一,小于零置零;最终生成文本指纹。
  • WonderTrader款采C++心模块构建全市场全品量化交易平台框架-C/C++
    优质
    WonderTrader是基于C++打造的一款高性能、多功能的量化交易系统开发平台,专为实现跨市场及多资产类别的自动化交易策略而设计。 WonderTrader是一个基于C++核心模块的量化交易开发框架,适用于全市场各种类别的交易,并具备高效率与高可用性。 面向专业机构的整体架构设计使它能够管理数十亿级别的实盘规模。从数据处理、回测分析到实际交易和运营调度,涵盖所有环节。 WonderTrader依赖于高速C++核心框架以及高效易用的应用层框架(wtpy),旨在构建一个集研发、交易、运营与调度为一体的全自动量化交易平台场景。 在开发接口方面,它提供了高效的数据库接口。每个策略可以根据需求灵活选择使用不同的引擎:CTA引擎适合标的较少且计算较快的策略;SEL引擎适用于需处理大量数据及复杂逻辑的情况;HFT引擎则针对高频或低延迟交易设计。
  • SSVKernel(x,tin): 带有自应局部带宽 - MATLAB
    优质
    这段代码实现了一个名为SSVKernel的MATLAB函数,用于执行带有自适应局部数据带宽选择机制的核密度估计。该工具能够有效提升复杂数据分布下的密度估计准确性。 要做的第一件事是运行教程代码 `tutorial.m`。 文档提供了一个函数 `ssvkernel` 用于返回优化的内核密度估计,使用具有本地适应数据的带宽高斯核函数。 例子: ```matlab x = 0.5-0.5*log(rand(1,1e3)); t = linspace(0,3,500); [y,t,optw] = ssvkernel(x,t); % 此示例生成内核密度估计值 y 的向量,使用在向量 t 中指定的点和局部自适应带宽 optw。 ``` 此外还提供了 `sskernel` 用于优化固定内核带宽以及 `sshist` 直方图优化。