Kernel Density Estimator是一种高效可靠的核密度估计方法，特别适用于一维数据，并为MATLAB开发。

5星

浏览量: 0

大小:None

文件类型：None

简介：
该方法提供了一个可靠且速度极快的单维数据核密度估计器。其核心假设采用高斯核函数，并具备自动选择带宽的特性。与其他许多实现不同，该实现并未受到多模态密度问题的影响，即使问题中存在具有广泛分离模式的多模态密度分布。值得注意的是，由于我们始终不预设数据的参数模型（例如经验法则所使用的模型），因此多模态密度的估计不会导致性能下降。输入参数包括：数据——用于构建密度估计的向量；n——网格点数间隔，位于 [MIN, MAX] 范围内，必须是 2 的幂次方；如果 n 不是 2 的幂，则将其向上取整至 2 的下一个幂，默认值为 n=2^12；MIN, MAX——定义用于构建密度估计的区间 [MIN, MAX]。默认情况下，MIN 和 MAX 的值分别设置为 MIN=min(data)-Range/10 和 MAX=max(data)+Range/10，其中 Range 定义为 max(data)-min(data)。输出结果为：带宽——最佳带宽值。

全部评论 (0)

还没有任何评论哟~

客服

一维数据核密度估计器：高效可靠的Kernel Density Estimator-MATLAB开发

优质

本项目提供了一种高效的MATLAB工具，用于进行一维数据的核密度估计。该工具实现了多种内核函数选择和优化带宽的方法，为数据分析提供了强大的支持。这是一个可靠且高效的一维数据核密度估计器；它假设使用高斯核并自动选择带宽。与许多其他实现不同，此实现不受多模态密度中广泛分离模式问题的影响（参见示例）。对于多模态密度的估计不会恶化，因为我们不假定任何参数模型来描述数据（例如经验法则所使用的模型）。输入： - 数据：用于构建密度估计的数据向量； - n：定义均匀离散化区间 [MIN, MAX] 的网格点数。n 必须是 2 的幂；若不是，则向上取整至最近的 2 的幂，即 n=2^ceil(log2(n))。 - MIN 和 MAX：构建密度估计的区间的最小值和最大值，默认设置为 MIN=min(data)-Range/10, MAX=max(data)+Range/10（其中 Range=max(data)-min(data)）。默认情况下，n 设置为 2 的 12 次幂。输出： - 带宽：用于核密度估计的最优带宽。

高维快速多元核密度估计器-Kernel Density Estimator for High Dimensions(matlab...)

优质

本项目提供了一个高效的Matlab工具箱，用于在高维度空间中进行快速多元核密度估计。该工具箱通过优化算法显著提升了计算速度和准确性，适用于大规模数据集的统计分析和机器学习应用。一个m文件中的高维快速自适应核密度估计提供了最佳的精度与速度权衡，并通过参数“gam”进行控制；对于处理大数据的应用程序来说，使用较小的“gam”值可以提高运行效率；通常情况下，“gam”的默认设置为 n^(1/2)，其中n代表数据点的数量。用法如下：[pdf,X1,X2]=akde(X,grid,gam) 输入参数： - X: 数据以 n 乘 d 的向量形式表示； - 网格：用于计算概率密度函数的维度为d，包含m个点，默认仅适用于二维数据；有关如何在更高维度中构建它的示例，请参阅相关文档。 - gam（可选）：成本与精度权衡参数，其中gam应小于n。默认值设置为ceil(n^(1/2))；较大的“gam”值可能会提高准确性但会降低速度；为了加速代码运行，可以使用较小的“gam”。输出： - pdf: 在网格上的估计密度值； - X1,X2：仅在二维数据中提供，默认的网格。

随机分形搜索(SFS)：一种可靠且高效的元启发式算法- MATLAB开发

优质

简介：随机分形搜索(SFS)是一种创新的元启发式算法，旨在提供高效和可靠的解决方案。本文通过MATLAB实现并展示了SFS在解决复杂优化问题中的优越性能。这段代码介绍了一种新的算法，它为解决与分形扩散特性相关的优化问题提供了新颖的视角。该算法能够在最少的迭代次数内找到误差最小（或接近最小）且接近全局最优解的结果，在准确性、收敛速度以及操作简便性方面都有所提升。

Gap Statistic算法：估算二维数据集最优聚类数目的一种方法 - MATLAB开发

优质

本MATLAB项目提供了一个实现Gap统计量算法的工具箱，用于确定二维数据集进行聚类分析时的最佳类别数。一个小的“工具箱”（仅包含三个文件），用于通过 Tibshirani、Walther 和 Hastie 的间隙统计算法（2001 年）来估计二维数据集中的最佳聚类数。代码已完全注释，以便您理解起来没有问题。如果您有任何疑问，请随时联系我。更多详细信息可以在包中包含的 READ ME 文件里找到。祝健康长寿、繁荣昌盛。

KDE高斯核密度估计——非参数方法

优质

简介：KDE高斯核密度估计是一种用于概率分布函数估计的统计技术，采用非参数方法来平滑数据点，适用于探索性数据分析和假设检验。 KDE（核密度估计）是非参数估计的一种方法，它使用高斯核函数来进行概率密度的估算，在独立成分分析以及确定控制限的过程中有广泛应用。

密度散点图-Density Scatter-MATLAB开发

优质

本项目提供了一个MATLAB工具箱用于创建密度散点图，能够有效地展示大规模数据集中的分布情况和潜在模式。散点图的点可以根据密度进行着色。

SimHash：一种高效的文本相似度计算方法

优质

SimHash是一种用于快速评估文档之间相似性的算法。通过将文本转换为哈希值，该技术能够高效地捕捉到不同文档之间的语义接近程度，在信息检索和数据去重中发挥重要作用。 SimHash是一种高效的文本相似度去重算法，适用于大批量文档的相似度计算。其主要步骤包括：对文本进行分词处理，得到N维特征向量（默认为64维）；设置分词权重（使用tf-idf方法）；计算特征向量的哈希值；将所有特征向量加权累加（目前仅采用非加权累加方式）；根据累加结果进行二进制化处理，大于零置一，小于零置零；最终生成文本指纹。

WonderTrader是一款采用C++核心模块构建的高效且可靠的全市场全品种量化交易平台开发框架-C/C++开发

优质

WonderTrader是基于C++打造的一款高性能、多功能的量化交易系统开发平台，专为实现跨市场及多资产类别的自动化交易策略而设计。 WonderTrader是一个基于C++核心模块的量化交易开发框架，适用于全市场各种类别的交易，并具备高效率与高可用性。面向专业机构的整体架构设计使它能够管理数十亿级别的实盘规模。从数据处理、回测分析到实际交易和运营调度，涵盖所有环节。 WonderTrader依赖于高速C++核心框架以及高效易用的应用层框架（wtpy），旨在构建一个集研发、交易、运营与调度为一体的全自动量化交易平台场景。在开发接口方面，它提供了高效的数据库接口。每个策略可以根据需求灵活选择使用不同的引擎：CTA引擎适合标的较少且计算较快的策略；SEL引擎适用于需处理大量数据及复杂逻辑的情况；HFT引擎则针对高频或低延迟交易设计。

SSVKernel(x,tin): 带有自适应局部数据带宽的核密度估计 - MATLAB开发

优质

这段代码实现了一个名为SSVKernel的MATLAB函数，用于执行带有自适应局部数据带宽选择机制的核密度估计。该工具能够有效提升复杂数据分布下的密度估计准确性。要做的第一件事是运行教程代码 `tutorial.m`。文档提供了一个函数 `ssvkernel` 用于返回优化的内核密度估计，使用具有本地适应数据的带宽高斯核函数。例子： ```matlab x = 0.5-0.5*log(rand(1,1e3)); t = linspace(0,3,500); [y,t,optw] = ssvkernel(x,t); % 此示例生成内核密度估计值 y 的向量，使用在向量 t 中指定的点和局部自适应带宽 optw。 ``` 此外还提供了 `sskernel` 用于优化固定内核带宽以及 `sshist` 直方图优化。