Advertisement

UCI_Credit_Card.csv 数据集介绍 该数据集包含了2005年4月至2005年9月期间台湾地区信用卡客户逾期还款的信息

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
简介:UCI_Credit_Card.csv数据集记录了2005年4月至9月间,台湾地区信用卡客户的逾期还款情况,包含多种属性信息。 SAS 信用卡 UCI 数据集包含台湾地区2005年4月至9月期间的信用卡客户数据,涵盖了客户的默认付款情况、人口统计因素、信用记录以及账单信息等。 该数据集中共有25个变量: - ID:每个客户的唯一标识符; - LIMIT_BAL:以新台币表示的给定信用额度(包括个人和家庭/辅助信用额); - 性别:性别分类,1代表男性,2代表女性; - 教育程度:分为五类,具体为研究生院、大学、高中及其他类别; - 婚姻状况:包含已婚、单身和其他婚姻状态的选项; - 年龄:以岁数表示客户的年龄; - PAY_0至PAY_6:分别代表2005年9月至4月期间每个月的还款情况,用数字表示延迟月份(例如 -1 表示正常付款,1 表示逾期一个月); - BILL_AMT1和BILL_AMT2:对应于2005年9月与8月的账单金额。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • UCI_Credit_Card.csv 2005420059
    优质
    简介:UCI_Credit_Card.csv数据集记录了2005年4月至9月间,台湾地区信用卡客户的逾期还款情况,包含多种属性信息。 SAS 信用卡 UCI 数据集包含台湾地区2005年4月至9月期间的信用卡客户数据,涵盖了客户的默认付款情况、人口统计因素、信用记录以及账单信息等。 该数据集中共有25个变量: - ID:每个客户的唯一标识符; - LIMIT_BAL:以新台币表示的给定信用额度(包括个人和家庭/辅助信用额); - 性别:性别分类,1代表男性,2代表女性; - 教育程度:分为五类,具体为研究生院、大学、高中及其他类别; - 婚姻状况:包含已婚、单身和其他婚姻状态的选项; - 年龄:以岁数表示客户的年龄; - PAY_0至PAY_6:分别代表2005年9月至4月期间每个月的还款情况,用数字表示延迟月份(例如 -1 表示正常付款,1 表示逾期一个月); - BILL_AMT1和BILL_AMT2:对应于2005年9月与8月的账单金额。
  • UCI_Credit_Card_Default:此涵盖2005420059及人口统计特征...
    优质
    该数据集收录了2005年4月至9月间,台湾地区信用卡用户的逾期还款记录及其个人背景信息,旨在研究信用违约的相关因素。 UCI_Credit_Card_Default 数据集包含了2005年4月至2005年9月期间台湾地区信用卡客户的默认付款、人口统计学因素、信用数据、支付历史以及账单报告的相关信息。我们利用逻辑回归进行预测,并通过机器学习和Keras框架进行了三层深度学习模型的构建,以进一步提高预测效果。由于该数据集中存在类别不平衡的问题,我们将采用SMOTE方法对样本进行过采样处理后重新运行上述两个模型。
  • 违约:自2005...
    优质
    本数据集收录了自2005年以来台湾地区的信用卡用户还款记录,特别关注客户的违约情况,为信用风险评估提供重要参考。 此数据集包含了2005年4月至2005年9月期间台湾地区信用卡客户的默认付款情况、人口统计因素、信用数据、支付历史以及账单详情。该数据可用于研究不同人口统计学变量类别对拖欠还款概率的影响,并确定哪些变量是预测逾期付款的最强指标。
  • 20052015英国车祸统计
    优质
    该数据集涵盖了2005年至2015年间英国各类交通事故的数据记录,包括事故时间、地点、伤亡情况及原因分析等信息。 标题中的“英国车祸数据(2005-2015)”指的是一份包含从2005年至2015年间在英国发生的交通事故详细记录的数据集合,这些信息可能由政府机构、研究组织或类似Kaggle这样的平台提供。这份数据集旨在用于分析和学习。 描述部分概述了该数据集的主题——“英国车祸数据(2005-2015)”,涵盖了十年间的事故报告。这类报告通常包括事故发生的时间、地点、类型以及导致事故的各种因素等信息。 标签中提到的“交通事故”和“Kaggle”暗示这个数据集可能来自Kaggle平台的一个比赛或项目,该平台是一个专注于数据科学与机器学习竞赛的全球知名在线社区。因此,此数据集可以被用来训练模型以预测事故、评估交通风险或者优化管理策略。 压缩包文件名为“UK Car Accidents 2005-2015.zip”,内含一个或多个表格形式的数据文件(如CSV格式),每一条记录代表一次具体的交通事故。这些字段可能包括: - **日期和时间**:事故的具体发生时刻,有助于分析季节性、昼夜模式等。 - **地理位置**:事故发生地点的精确坐标,便于绘制热点图。 - **类型与严重程度**:碰撞种类(正面、侧面等)、事故等级(轻微、重大或致命)。 - **伤亡情况**:受伤和死亡人数统计,帮助评估安全措施的效果。 - **天气及路况信息**:道路状况(干燥、湿滑等)、能见度以及天气条件,这些都是影响事故发生的重要因素。 - **参与者详情**:包括驾驶员的年龄、性别、饮酒状态及驾照持有情况等;乘客或行人的相关信息也涵盖在内。 - **车辆特征**:车型、行驶速度和是否违反交通规则等等,有助于理解交通事故中车辆角色的影响。 - **道路设施信息**:事故地点附近是否存在信号灯或者行人横道等,这些因素可能影响事故发生概率。 - **时间序列数据**:工作日或周末、节假日以及上下班高峰期的记录,揭示了车流量与事故之间的关联。 这份数据集对于研究人员、政策制定者、数据科学家及机器学习爱好者来说非常有价值。它有助于发现潜在的交通事故模式,并提出改进交通安全措施的建议;同时也能用于训练预测模型以提前预警可能发生的危险情况。此外,该数据还可以作为教育工具帮助学生掌握数据分析和可视化技术,提高他们对交通安全管理问题的认识。
  • 20052016法国发生事故-
    优质
    该数据集收录了2005至2016年间在法国发生的所有类型的重大事故信息,包括交通事故、工业灾害等,为研究者提供详实的数据支持。 该数据集收录了2005年至2016年在法国发生的事故数据,每年的交通事故都会导致数千人死亡。我相信数据科学可以发挥重要作用,因此我决定为此做出贡献。此项目包括以下文件:caracteristics.csv、holidays.csv、places.csv、users.csv和vehicles.csv。
  • 中国铁交通20201231日): 本20201231日中国主要城市...
    优质
    本数据集收录了截至2020年底,中国各大城市的地铁线路、站点及运营里程等详尽信息,旨在为交通规划与研究提供全面的数据支持。 中国大陆的地铁交通数据集涵盖了截至2020年12月31日已开通运营的城市:北京、天津、上海、广州、长春、大连、武汉、重庆、深圳、南京、沈阳、成都、佛山、西安、苏州、昆明、杭州、哈尔滨、郑州、长沙、宁波、无锡、青岛、南昌、福州、东莞、南宁、合肥、石家庄,贵阳,厦门,乌鲁木齐,济南,兰州,常州,徐州,呼和浩特和太原。数据集包括各个城市的地铁线路记录信息,并以shapefile格式提供。 本数据集为开源形式,在条件限制下可能存在一些错误或遗漏,请大家批评指正。如果使用该数据进行相关研究,请务必在研究成果中注明引用来源,谢谢!
  • 新冠病毒理位置及202029日全国城市
    优质
    本数据集收录了新冠病毒疫情相关信息,包括各地的确诊、疑似和治愈病例等,并详细记录了各城市的地理位置与2020年2月9日的疫情数据。 新冠病毒数据集介绍: 1. 1.00000_full.json:地理位置数据集,用于绘制地理边界。 2. china_coordinates.csv:全国城市位置数据集,用于定位每个城市的位置。 3. DXYArea.csv:截至2020年2月9日的中国新冠病毒数据集。
  • 震记录 - 2001 1 1 日 2023 1 1 日 782 起震事件
    优质
    本数据集收录了从2001年1月1日至2023年1月1日期间的782次地震记录,详尽提供每次地震的关键参数。适合地震学研究及灾害预警分析。 数据集包含从2001年1月1日至2023年1月1日期间记录的782次地震事件。各列的具体含义如下: - title:地震标题名称。 - 震级:地震震级大小。 - date_time:地震发生的时间和日期。 - cdi:最大报告强度值,表示该区域感受到的最大破坏程度。 - mmi:仪器测量得出的最大的估计强度数值。 - 警报级别:“绿色”、“黄色”、“橙色”或“红色”,代表不同级别的预警信号。 - 海啸标志:发生于海洋中的地震事件标记为1;其他地区则为0。 - sig:描述了该次事件的重要程度,值越大表示其重要性越高。此数值是根据多种因素综合评估得出的,包括震级、最大MMI强度、报告数量以及预估影响等。 - net:数据提供方ID号,标识用于确定地震信息的主要网络来源。 - nst:为定位该次地震所用到的所有台站总数目。 - dmin:最近观测点与地震中心之间的水平距离(千米)。 - 间隙角差:相邻两个监测站点间最大的角度间距,表示方位差异。一般来说,这个值越小,则表明计算出的地震位置越准确可靠;若该差距超过180度,则意味着所得到的位置及深度数据存在较大不确定性。 - magType:用于确定首选震级的方法或算法类型。 - 深度:地震发生时地壳破裂开始处的具体深度(千米)。 - 纬度和经度坐标:提供了描述地球表面位置的精确地理信息,有助于定位事件发生的地点。 - 位置:具体的位置描述,通常指国内范围内的详细地址或区域名称。 - 大陆:记录了地震发生所在的大陆板块。
  • 2013414日416日新浪微博实时(已去除小号及无关
    优质
    该数据集收集了2013年4月14日至4月16日期间新浪微博上的实时发布内容,经过处理去除了与主题无关的信息和小号发布的帖子,为研究提供纯净的数据支持。 新浪微博于2013年4月14日12:00至4月16日12:00的实时数据已整理完成,并且已经剔除小号并过滤了部分微博内容,以确保数据的质量与实用性。这些数据集非常适合用于进行各种数据挖掘实验等研究活动。此外,该数据可以直接导入MySQL数据库中使用。