
Noise-label-generation-and-relabeling:根据设定的噪声率,为数据集创建噪声标签,并利用重新标注方法进行...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
生成噪声标签以及进行重新标记,旨在为数据集创建带有噪声的标签,并利用重新标记算法对这些噪声标签进行修正。具体而言,`f1.test.py`脚本针对`all_tickets.csv`数据集生成了包含杂音的标签,同时利用“body”特征以及“urgency”和“ticket_type”作为预测标签。我们推测紧急程度的标签可能存在一定的噪声,因此在紧急程度维度上引入了额外的噪音。随后,将48000个数据点划分为训练集和测试集,其中左侧的数据被分配为测试数据集。在为紧急标签生成嘈杂标签之后,将“body”、“ticket_type”以及相关信息复制到`train_data.csv`文件中。此外,我们还对其他数据集进行了类似的测试流程。在`category.py`中,我们生成了重新标记后的标签(relabel),并将它们写入名为`relabel.csv`的文件中。除了门票数据集之外,我们还对其他数据集进行了验证以评估模型的性能。 票情绪训练tes
全部评论 (0)
还没有任何评论哟~


