
Microsoft恶意软件分类挑战:超越Microsoft Malware Classification Challenge...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
微软恶意软件分类挑战是由微软发起的一个数据科学竞赛,旨在通过改进恶意软件的分类和识别来增强计算机安全。参与者需利用提供的大量恶意软件样本进行训练,创建模型以准确预测新型威胁的类别。此挑战促进了先进算法和技术的发展,有助于保护全球用户免受网络犯罪侵害。
微软恶意软件分类挑战(BIG 2015)的基准已被超越,我的解决方案在排行榜上的得分为0.1826662。该方案很简单,但数据准备过程较为繁琐。它仅利用.byte文件来预测类别,并通过计算两字节代码(从00到FF以及??)的频率来进行预测。
要在使用这些文件之前进行以下步骤:
- 从训练和测试7z中提取.byte文件。
- 将.byte文件压缩为.byte.gz格式并移动至train_gz/ test_gz目录下。这两个步骤会花费大量时间,大约6小时左右。
完成以上操作后,您将拥有10868个训练文件以及10873个gz格式的测试文件。
最后运行以下命令:
python data_consolidation.py
全部评论 (0)
还没有任何评论哟~


