
迁移学习将得到更为详尽的阐述。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
在传统的机器学习框架下,学习的核心在于,基于充足的训练数据集,构建一个分类模型;随后,利用由此建立的模型对待测文档进行分类和预测。尽管如此,机器学习算法在当前Web挖掘研究中仍然面临着一个至关重要的挑战:许多新兴领域的训练数据获取极其困难。Web应用领域正以惊人的速度发展,不断涌现出大量新的领域,涵盖传统新闻、网页、图像乃至博客和播客等多种形式。 传统的机器学习方法需要为每个领域标注大量的训练数据,这无疑会耗费巨大的人力和物力成本。若缺乏足够的标注数据,则诸多与学习相关的研究与应用将难以开展。此外,传统的机器学习模型通常假设训练数据与测试数据遵循相同的概率分布。然而,在实际应用中,这种同分布假设往往难以成立。例如,训练数据的时效性可能导致其过时,从而迫使我们重新标注大量的训练数据以满足模型的训练需求;但新数据的标注工作本身就伴随着高昂的人力物力成本。 从另一个角度审视问题时,如果拥有了大量的、分布不一致的训练数据,单纯地丢弃这些数据无疑是极度浪费的。因此,如何有效地利用这些数据成为了迁移学习所要解决的关键问题。
全部评论 (0)
还没有任何评论哟~


