
UD120-FinalProject: 利用机器学习分析安然数据以揭露欺诈行为
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目运用机器学习技术深入分析安然公司财务数据,旨在识别并揭示其中潜在的欺诈行为模式,推动企业透明度与诚信建设。
ud120-finalproject 使用机器学习通过安然数据集识别公司欺诈行为。
在使用Enron Datasets.ipynb文件的功能时,我们关注的是以下几点:
- 被起诉的人;
- 被定居但不认罪的个体;
- 因证明无罪而获得豁免的数据点;
该数据集中包含大量电子邮件信息。根据类型的不同,这些数据可以分为数值、类别和时间序列等几类:
1. 数值:代表数字形式的数据。
2. 类别:有限数量的离散值(如性别);
3. 时间序列:包括日期或时间戳的形式;
文字型数据也包含在内。整个enron_data 集合可以表示为 enron_data [“姓氏第一中间人”] = {features_dict},其中 features_dict 包含了与特定个体相关联的特征。
需要注意的是,在安然的数据集中,非POI到POI(即关注的人)的分布非常不对称。在146个数据点中仅有11个人或数据被标记为POI或者涉嫌欺诈行为。
我们的目标是将数据集中的每个人都准确地分类为POI 或者 非 POI 。此外,如果可能的话,我们希望能够给每个人分配一个概率值来评估他们成为POI的机会。
全部评论 (0)
还没有任何评论哟~


