Advertisement

ArXiv数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
ArXiv数据集是由全球科研人员提交的未经同行评审的预印本文献集合,涵盖物理学、数学、计算机科学等领域的最新研究成果。 Arxiv网络数据集包含5242个节点和14484条边,数据规模为n*2。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • ArXiv
    优质
    ArXiv数据集是由全球科研人员提交的未经同行评审的预印本文献集合,涵盖物理学、数学、计算机科学等领域的最新研究成果。 Arxiv网络数据集包含5242个节点和14484条边,数据规模为n*2。
  • arxiv-metadata-oai-2019
    优质
    arxiv-metadata-oai-2019 数据集收录了2019年从ArXiv获取的科研论文元数据,涵盖物理学、数学、计算机科学等多个学科领域。 arxiv-metadata-oai-2019 包含一个名为 arxiv-metadata-oai-2019.json 的文件。
  • Arxiv网络中的社区检测结果
    优质
    本研究通过分析ArXiv数据库中的网络数据集,探索并展示了不同的社区检测方法及其应用成果,揭示了学术领域的结构特征和演化规律。 Arxiv网络数据集的社区检测结果显示,该数据集包含5242个节点和14484条边,对应的模块度值为0.7984。
  • SWAV: SwAV的PyTorch实现 - arXiv:2006.09882
    优质
    简介:SWAV是基于arXiv论文2006.09882的一种无监督视觉表示学习方法,通过聚类和置换不变损失优化特征向量,由Facebook AI团队实现于PyTorch框架。 该代码提供了使用PyTorch实现的SwAV预训练模型。SwAV是一种无需标签即可对卷积网络进行有效且简单的预训练方法。它与对比学习类似,在于通过比较图像的不同变换来获取特征表示,但不同于传统的对比学习,SwAV不需要计算特征之间的直接比较,从而避免了存储大型数据库或使用辅助动量网络的需要。具体而言,我们的模型在对数据集进行聚类的同时,确保同一张图片经过不同增强处理后得到的多个视图之间的一致性,并通过预测机制从一个视图推断另一个视图的类别分配来实现这一点。 此外,SwAV可以使用大批量或小批量的数据训练,并能很好地扩展到大规模数据集中。我们还发布了基于ResNet-50的最佳预训练模型以供研究者参考和应用。
  • ECG-
    优质
    本ECG数据集包含了多种心电图记录,旨在支持心脏疾病的研究与诊断模型开发,适用于医疗AI领域。 a01.csv a01er.csv a02.csv a01r.csv a03.csv a03er.csv a02er.csv a02r.csv a03r.csv a04er.csv a04r.csv a05.csv a04.csv a06.csv a07.csv a08.csv a09.csv a10.csv a11.csv a12.csv a13.csv a14.csv a15.csv a16.csv a18.csv a19.csv a20.csv b01.csv a17.csv b01er.csv b03.csv b02.csv b04.csv b01r.csv b05.csv c01.csv c02.csv c01r.csv c01er.csv c03.csv c02er.csv c03er.csv c04.csv c06.csv c05.csv c07.csv c03r.csv c08.csv c09.csv x01.csv c10.csv x03.csv x02.csv x04.csv x05.csv x07.csv x06.csv x08.csv x10.csv x09.csv x11.csv x12.csv x13.csv x14.csv x15.csv x16.csv x17.csv x18.csv x19.csv x20.csv x21.csv x22.csv x23.csv x24.csv x25.csv x26.csv x27.csv x28.csv x30.csv x31.csv x33.csv x32.csv x34.csv x29.csv x35.csv
  • USAir-
    优质
    USAir数据集包含了美国各城市间航班连接的信息,适用于网络分析、聚类及其他图论研究。 ### USAir数据集 #### 描述: 航空网络是指包含航空公司航线信息的数据集合,通常用于交通网络研究、路径优化或预测分析等领域。USAir数据集是学术界常用的案例之一,它包含了美国联合航空公司(USAir)在1987年的航班连接信息,有助于理解航空运输系统的结构和特性。 #### 详细知识点: 1. **数据集概述**: USAir数据集源自R. E. Beasley于1990年发表的一篇论文。该数据集中包含美国主要城市间的91个机场以及它们之间的118条非直达航线,每个节点代表一个机场,每条边则表示两个机场间存在航班服务。 2. **网络结构**: USAir数据集是一个典型的加权图,其中的边代表着航班连接,并且权重反映了两机场之间航班频次。通过此数据集可以分析航空网络的拓扑特性如节点度分布、聚类系数和平均路径长度等指标。 3. **交通流分析**: 数据集可用于研究乘客流量模式,识别最繁忙的航线,从而帮助航空公司优化路线布局以提升运营效率和服务质量。 4. **路径规划**: 基于USAir数据集可以设计算法来寻找最优路径方案(如最短路径、最小成本或时间延迟最低的路径),这些解决方案对于乘客行程规划和航空公司的调度具有实际应用价值。 5. **复杂网络理论的应用**: USAir数据集常被用于研究小世界网络和无标度网络特性,这有助于理解现实世界的网络组织模式,并为其他领域的研究提供参考框架。 6. **机器学习模型训练与测试**: 使用USAir数据集可以开发并验证预测航班延误、乘客流量等的机器学习模型。这些应用对于航空公司进行风险管理及决策支持至关重要。 7. **图论问题的应用**: 数据集中包含的问题可转化为旅行商问题(TSP)、最小生成树(MST)等问题,这些问题在物流配送和路线规划等领域具有广泛应用价值。 8. **数据可视化**: 通过绘制USAir网络图表可以直观展示机场之间的连接关系及其地理分布情况,有助于理解整个航空运输系统的密集程度与结构特征。 9. **数据预处理步骤**: 在进行深入分析前需要对原始数据集执行清洗工作(如去除异常值、填充缺失信息等),并将非数值型字段转换为适合计算的形式。 10. **编程语言和工具的应用**: 分析USAir数据集时常用的编程语言包括Python与R,借助pandas、networkx及ggplot2等库可以方便地读取、处理并可视化相关数据。 综上所述,USAir数据集不仅是对研究者而言的宝贵资源,同时也为航空公司策略制定和运营管理提供了重要参考价值。通过对该数据集的研究能够揭示出航空网络内部规律,并提出切实可行的问题解决方案。
  • 信用-
    优质
    本数据集汇集了大量关于个人及企业的信用信息,包括但不限于借贷记录、还款历史和信用评分等关键指标,旨在为学术研究与模型开发提供详实的数据支持。 small_loan.csv 文件包含了与小额贷款相关的数据。文件内不含任何联系信息如电话号码、QQ 号或链接地址。所有内容均围绕小额贷款的信息进行组织和呈现。
  • NCLT_python_;NCLT_nclt_
    优质
    NCLT Python 数据集是基于NCLT(NavTech Lidar Competition and Testing)项目收集的自动驾驶车辆相关传感器数据集。该数据集为研究人员提供了丰富的激光雷达、GPS和IMU等信息,便于进行定位与建图算法的研究与测试。 NCLT数据集的Python文件合集主要用于处理该数据集中文件的读取、下载以及格式转换等功能。
  • O2O-
    优质
    本数据集为O2O(线上到线下)模式下的业务交易记录与用户行为数据集合,涵盖餐饮、娱乐等行业的真实场景信息,旨在促进相关研究及应用开发。 O2O数据集是针对线上到线下(Online-to-Offline)业务领域设计的数据分析资源,在大数据时代具有重要的研究价值。这类数据集包含丰富的用户活动、交易记录以及地理位置信息,可用于深度学习、机器学习及数据挖掘等多种任务。 此数据集可能涵盖以下核心部分: 1. 用户信息:包括用户ID、年龄、性别和消费习惯等,有助于构建详细的用户画像。 2. 商户信息:如商户ID、类别、位置和评分等,用于分析商户的市场定位与吸引力。 3. 交易记录:包含订单详情(例如时间戳)、商品或服务类型及价格等数据,揭示消费者的购买行为模式。 4. 地理坐标:提供用户活动的位置参考点,有助于空间关联性研究。 5. 时间序列信息:按日期排序的数据集合,便于识别季节性和周期性的市场趋势。 此O2O数据集主要用于训练和测试模型,并支持多种应用: 1. 用户行为建模:通过分析用户的购买习惯、偏好及决策过程来优化推荐算法。 2. 商户评估:评价商户业绩,确定热门与冷门区域,为营销策略提供依据。 3. 时间序列预测:预计未来的交易量、用户流量或特定商品的需求趋势。 4. 地理位置研究:探索用户和商户之间的地理联系及商圈特性。 5. AB测试:通过模拟不同的优惠活动来评估其对消费者行为的影响。 该数据集为O2O业务的深入理解和优化提供了宝贵的资源,是数据科学家、机器学习工程师以及商业分析师的理想实践平台。通过对这些数据进行深入挖掘与模型构建,可以显著提升行业决策支持和业务效率。