本数据集包含超过104万条记录,采用CSV格式存储,专为金融欺诈检测设计,涵盖多种交易类型与特征信息,助力模型训练及算法优化。
该数据集展示了移动货币交易的全面表示,并经过精心设计以反映现实世界金融活动中的复杂性以及欺诈行为的研究目的。此数据来源于名为PaySim的模拟器,利用了非洲某国实际财务日志中汇总的数据来填补公开可用金融数据集中用于检测欺诈研究方面的空白。它涵盖了多种类型的交易,包括现金存入、兑现输出、借记、支付和转账等,并为评估各种欺诈检测方法提供了一个全面的环境。
**数据集结构**
- **step:** 表示现实世界中的时间单位,1 步等于 1 小时;整个模拟历时744步,相当于30天。
- **type:** 包括CASH-IN、CASH-OUT、BIT-OUT、PAYMENT 和 TRANSFER等交易类型。
- **amount:** 表示以当地货币单位表示的每笔交易金额。
- **nameOrig:** 发起该笔交易的客户名称。
- **oldbalanceOrg:** 代表发起方在进行特定操作前账户中的余额。
- **newbalanceOrig:** 指的是执行完相关操作后,发起方账户的新余额。
- **nameDest:** 接收这笔交易的客户的标识符(或称目的地)。
- **oldbalanceDest:** 表示接收方在收到资金前的账户余额。对于以M表示商家身份的客户而言,此字段不适用。
- **newbalanceDest:** 收到转账后的新收款人账户余额;同样地,如果交易涉及的是一个标识为“M”的实体,则该信息不被提供。
- **isFraud:** 标识由欺诈代理执行的那些企图通过诸如提现或转移等操作来耗尽客户资金的行为。
- **isFlaggedFraud:** 用于标记账户间未经授权的大额转账行为,任何单笔金额超过20万单位货币的交易都被视为非法。