
WebCrawler:一款简易的网页抓取工具,从根域名提取URL并保存至文件
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
WebCrawler是一款功能简洁的网页抓取软件,专注于从指定根域名中提取所有链接,并将其保存到本地文件中,方便数据收集与分析。
webCrawler 是一个简单的Web爬虫工具,用于从根域获取URL链接并将它们保存到文件中。用户可以通过swagger-ui或使用API交互客户端(如Postman)来与该应用进行互动。用户需要在上述端点发送POST请求,并且请求正文应包含 {url: } ,期望收到2XX的成功响应消息。
此工具是用Java-8编写的,采用Spring Boot框架开发,爬虫部分利用了jsoup库。抓取到的站点地图将被写入项目根目录下的*.txt文件中。
源代码可以在一个git存储库上下载、构建并运行测试。
全部评论 (0)
还没有任何评论哟~


