Advertisement

funds_crawler: 使用Python轻松爬取12000多只基金的历史单位净值、累计净值及涨跌数据

  • 5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
funds_crawler是一款利用Python编写的工具,能够高效地收集超过一万两千只基金的历史单位净值、累计净值及其涨跌幅信息。 环境要求: 1. 确保 json 库 和 requests 库 可以正常导入。 2. `craw_fund_code.py` 文件会将爬取到的基金代码及名称输出至当前目录,文件名为 all_fund_code_name_type.txt。 3. `fund_data_crawler.py` 文件负责读取 all_fund_code_name_type.txt 并依次对每个基金进行数据抓取。所有基金的数据会被保存在本目录下的 fund_data 文件夹中。 4. 由于需要爬取的基金数量庞大,网络连接问题可能导致中间出现超时错误,这通常需要手动重新运行脚本来解决此类问题。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • funds_crawler: 使Python12000
    优质
    funds_crawler是一款利用Python编写的工具,能够高效地收集超过一万两千只基金的历史单位净值、累计净值及其涨跌幅信息。 环境要求: 1. 确保 json 库 和 requests 库 可以正常导入。 2. `craw_fund_code.py` 文件会将爬取到的基金代码及名称输出至当前目录,文件名为 all_fund_code_name_type.txt。 3. `fund_data_crawler.py` 文件负责读取 all_fund_code_name_type.txt 并依次对每个基金进行数据抓取。所有基金的数据会被保存在本目录下的 fund_data 文件夹中。 4. 由于需要爬取的基金数量庞大,网络连接问题可能导致中间出现超时错误,这通常需要手动重新运行脚本来解决此类问题。
  • 一款于获VBA脚本
    优质
    这是一款专为Excel设计的VBA脚本工具,能够自动抓取并更新基金的历史净值数据,帮助用户轻松进行数据分析和投资研究。 这是我编写的一个获取基金历史净值的Excel VBA脚本,大家可以尝试使用一下。经过测试发现,在较新版本的WPS Excel中效果较好,而在微软的Excel里可能会出现控件漂移的问题。如果有任何想法或需求,请随时与我联系。欢迎交流!
  • Excel获详细步骤
    优质
    本文将详细介绍如何使用Excel表格来追踪和分析基金的历史净值数据。通过一系列简单易懂的步骤,帮助用户轻松掌握从数据收集到处理的全过程。 通过Excel获取基金历史净值是数据分析中的常见任务,尤其是对于基金投资者而言,了解基金的历史表现有助于做出投资决策。以下是一个详细的步骤指南,教你如何利用Excel从天天基金网获取基金历史净值。 1. **新建Excel文档**:打开Excel并创建一个新的工作簿。 2. **从网站导入数据**:点击“数据”选项卡,并选择“从网站”。在弹出的窗口中,选择“高级”选项。 3. **输入接口URL**:在URL输入框中,需要填写天天基金网提供的历史净值获取接口。例如: `https://fundf10.eastmoney.com/F10DataApi.aspx?type=lsjz&code=006327&sdate=2021-12-08&edate=2023-05-18&per=20&page=1` 其中,`code`参数代表基金代码,而`sdate`和`edate`分别表示开始日期与结束日期。此外,`per`指每次获取的数据条数,而`page`则为页码。 4. **导入数据**:点击“确定”按钮后,Excel将尝试连接到该URL并导入数据。此时你会看到一个包含基金历史净值的表格。 5. **转换数据**:选择所导出的数据(通常命名为table0),然后在Power Query编辑器中进行下一步操作。 6. **建立自定义函数**:点击“视图”菜单中的“高级编辑器”,将`page=1`中的数字替换为`(page as number) as table => ... & Number.ToText(page)`,这将使我们能够动态更改页码。 7. **创建新源**:返回Power Query主界面,选择“主页”>“新建源”>“其他源”>“空查询”,以建立新的数据来源。 8. **输入页码范围**:在新建的查询中,输入数组表示的页数范围(例如`{1..100}`),这代表获取从第一页到第一百页的数据。按回车键应用更改。 9. **调用自定义函数**:选择之前创建的查询,在“转换”菜单下添加列并使用调用自定义函数,将之前的表格作为参数传递给该函数,并确认操作。 10. **展开数据集**:完成上述步骤后点击“关闭并上载”,或选择“加载至”,以将数据导入到Excel工作表中。此时你将会看到一个完整的基金历史净值表格。 11. **格式化日期**:可能需要对日期列进行格式化,使其显示为日期而非时间戳形式。右键单击该列,并在弹出的菜单中选择“设置单元格格式”,然后选择合适的日期类别和格式。 通过以上步骤,你可以成功获取并处理基金历史净值数据,从而进一步分析计算收益率或绘制图表等操作。此方法不仅适用于特定代码006327这只基金,同样可以应用于其他基金类型,只需替换相应的基金代码即可。掌握这个技巧能帮助你更便捷地获取和评估不同基金的市场表现,并为投资决策提供有力支持。
  • Python学习笔记:抓特定实战案例
    优质
    本教程提供了使用Python抓取特定基金历史净值数据的实际操作案例,适合对量化投资和数据分析感兴趣的读者参考。通过详细步骤解析如何利用相关库实现自动化数据获取。 本段落主要介绍了使用Python学习笔记来抓取某只基金的历史净值数据的案例,并通过具体的实例分析了如何利用selenium库进行数据抓取以及如何与mysql数据库交互的相关实现技巧,供需要的朋友参考。
  • 虫技术获、成分股代码、名称、比例、替代等相关信息
    优质
    本项目运用爬虫技术,高效采集基金的历史净值数据及其成分股的相关信息,包括股票代码、名称、持有比例与数量等,并支持现金替代功能,为投资者提供全面的投资参考。 在网上很难找到开放式基金的历史成分股、比例及数量以及现金替代的数据,而这些数据对于计算ETF的盘中净值非常重要。本代码通过爬取基金公司的网站来获取相关信息。
  • 使Python从雪球抓A股股票,包括总市、总资产、利润、市率和资产收益率
    优质
    本项目利用Python语言编写代码,自动化地从雪球网站获取A股市场中各上市公司的关键财务指标,如总市值、总资产、净利润等核心信息,并计算市净率与净资产收益率,为投资者提供全面且深入的数据分析支持。 使用Python从雪球爬取股票信息,获取A股大盘的ROE、PE、PB等数据,并提取A股总市值、总资产、总利润、市净率及净资产收益率等相关指标。
  • Excel版开放式查询工具
    优质
    Excel版开放式基金净值查询工具是一款专为投资者设计的数据分析辅助软件。利用此工具,用户可以便捷地获取并管理各类开放式基金的历史净值数据,进行深入的投资研究与决策支持。 这是Excel基金净值查询软件。打开后,只需更新一下数据即可获取最新信息。
  • TT_Fund:天天:北向资动向、变化、大盘走势公司概况
    优质
    TT_Fund是一款基于天天基金网的数据分析工具,提供北向资金流向、基金净值变动、大盘趋势以及各大基金公司的基本信息。帮助用户轻松掌握市场动态和投资机会。 ### 版本信息 版本:v1.0.20200424 启动方式:`scrapy crawl spider.name` 成功抓取的数据样式在data_temp文件夹内。 此程序从天天基金网采集数据,目前包含以下5个爬虫,基本上涵盖了整个基金市场情况。可以根据实际需要有选择性地进行爬取: 1. 北向资金每日流向 2. 北向资金每日前20大交易股 3. 基金公司情况 4. 基金排名及每日涨跌情况 5. 大盘(上证指数、深圳成指、创业板指)每日涨跌情况 ### 一、北向资金每日流向 文件名:beixiang.py (上海MarketType=1, 深圳MarketType=3) 字段含义: 爬取的数据基本上按照原网址格式,便于理解。根据天天基金网提示,需要注意以下两点: 1. 当日资金流入today_in包含两个部分:已经成交的和已申报未成交的。 2. 当日净买额today_ne
  • Python虫获股价
    优质
    本项目介绍如何使用Python编写爬虫程序来自动抓取并分析股票的历史价格数据,帮助投资者进行市场研究和决策。 使用 Python 的 Requests 库和 BeautifulSoup 库爬取数据并生成表格。
  • 今日
    优质
    今日历史数据爬取是指利用编程技术自动收集网络上的今日相关历史信息和数据,以便进行数据分析、研究或提供给用户查询,涵盖天气、事件等多个方面。 使用Python3及BeautifulSoup爬取历史上的今天网站,获取历史上的今天内容及其对应的网址。