
利用机器学习进行Android恶意软件检测:N-gram Opcode与RandomForest的应用
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究运用N-gram Opcode特征结合RandomForest算法,探索其在Android恶意软件检测中的效能,旨在提升移动设备安全性。
原理方面,按照一定的标准将指令分为MRGITPV七类,并依据Android4.1.2源码下的dalvik-bytecode.html进行了整理。所有字节码到其分类的映射规则都位于/infrastructure/map.py文件中。
在样本收集过程中发现,恶意软件(来自virusShare)通常规模较小,最大为5.8M;而良性软件(来自应用宝)则大多较大,最大可达20M。因此,在特征提取时采用的是每种n-gram是否出现的二元表示方式:如果该n-gram在样本中出现,则标记为1;否则标记为0。
对于分类来说,共有154个良性样本(类别记为1)、180个恶意样本(类别记为0)和14个测试样本(暂且类别设为2)。检测方法的框架是:首先将apk文件反编译成smali代码以提取dalvik指令集;然后生成3-gram特征向量;最后使用机器学习算法训练分类器。
该项目源码系个人毕业设计作品,所有代码均经过测试验证无误后上传。在答辩评审中获得了平均分96的高评价,可以放心下载使用。请注意,在下载和使用时,请确认功能符合预期需求,并确保遵守相关法律法规及学术道德规范。
全部评论 (0)
还没有任何评论哟~


