
半监督学习与SVM算法,用于数据科学作业。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
半监督学习的SVM数据科学分配方案,涉及对支持向量机作为核心分类器的半监督分类器的构建。该数据集的生成过程完全在代码中进行自动化。依赖关系如下:首先,基于马斯克莱恩分类问题的数据集,包含大量未标记数据和少量标注数据。通过该数据集,人类专家能够准确地标记出未标记数据集中任意样本的信息,其标注费用与新增标注样本的数量成正比关系。本方案旨在降低标注成本的同时,显著提升分类器的准确性。具体而言,该解决方案将为标签数据集中置信度最高的结果标签进行添加,而置信度最低的标签则表明分类器需要借助人工专家的辅助。这些真实生成的标签随后会被集成到数据集中,并伴随增加相应的成本。值得注意的是,人类专家的提示次数必须限制在初始标记样本的数量之内,并且标记数据的数量不能超过原始数据集的两倍。如果算法达到100%的准确率,或者没有对任何样本进行标记添加操作,则算法将自动终止运行。为了便于理解和验证,我们提供一个示例设置:数据集包含10000个样本,划分成3个不同的类别,每个类别下又包含2个子类;同时具备3个具有信息性的特征。迭代次数设定为100次。此外, 剩余的未标记数据量也受到限制.
全部评论 (0)
还没有任何评论哟~


