
恶意软件分类数据集
5星
- 浏览量: 0
- 大小:None
- 文件类型:CSV
简介:
本数据集包含各类恶意软件样本及其特征信息,旨在为研究人员提供一个全面分析与研究恶意软件的基础平台。
为了有效地分析和分类大量的文件数据,并利用已知的恶意软件样本进行训练,参赛者需要预测每个新的恶意软件样本属于哪一类(家族)。这是一个多分类问题,包含9个类别,用数字0到8来标识。
近年来,恶意软件行业已经成为一个涉及大量资金并且高度组织化的领域。许多大型企业集团投入巨资开发反恶意软件机制以查找和阻止肆意妄为的恶意软件开发者。与此同时,这些恶意软件给使用计算机系统的用户带来了诸多不必要的烦恼以及经济损失。
数据集由训练部分和测试部分组成,总共有超过10万个样本,并包含70个字段信息。其中,“id”字段是每个样本唯一的标识符,“label”表示该样本所属的恶意软件类别。从整个数据集中抽取5万条作为训练集,8千条作为测试集,并对某些敏感的信息进行脱敏处理。
特别需要注意的是,特征主要来源于asm文件信息,例如“linecount_asm”代表asm文件中的行数,“size_asm”则表示asm文件大小。其他与asm相关的特征字段都以“asm_commands”为前缀,这些可以理解为在asm中使用的特定命令。
全部评论 (0)
还没有任何评论哟~


