
UDA:无监督数据扩充技术
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
UDA是一种先进的无监督学习方法,专门用于增强机器训练的数据集。通过生成和利用合成数据,它能够有效提高模型在各种任务上的性能和泛化能力。
无监督数据增强(UDA)是一种半监督学习方法,在语言和视觉任务上取得了最新的成果。仅使用20个标记示例的UDA在IMDb上的表现优于以前使用25,000个标记样本训练的方法,其错误率为4.32,而BERT则为4.51。
在CIFAR-10(带有4,000个标注实例)和SVHN(带有1,000个带标签的示例)上使用UDA能够将现有方法的误差率降低超过30%。对于ImageNet数据集,仅用10%标记的数据就取得了显著改进。
具体来说,在CIFAR-10和SVHN上的比较如下:
模型 | CIFAR-10 | SVHN
ICT(之前的最佳技术)| 7.66±.17 | 3.53±.07
UDA | 4.31±.08 | 2.28±.10
对于ImageNet,ResNet-50的前一位准确率和前五位准确性分别为55.09% 和77.26%,而使用UDA后则提升到了68.78% 和88.80%。
无监督数据增强通过减少对带有标签样本的需求,并更好地利用未标记的数据,从而提高了模型的性能。
全部评论 (0)
还没有任何评论哟~


