
课程设计基于Python,利用10000个网页构建搜索引擎。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该系统拥有极简的操作界面,所有代码和配置环境均已预先设置完成,提供便捷的“傻瓜式”引导。执行流程如下:首先,1.Spider.py负责从网页中抓取数据并进行分析;随后,2.index.py生成倒排索引以及idf文件;接着,3.app.py运行搜索引擎;最后,通过在默认浏览器输入 http://localhost:8080/ 进行检索。如果需要利用数据库,则需执行1.writeDB.py来写入倒排索引和idf(此步骤可能需要较长的时间)。此外,还可以使用summary.py来切换到从数据库检索功能,具体方法是通过import DB_search 模块中的 s 函数。请务必注意停用词列表stopwords.txt的配置。
全部评论 (0)
还没有任何评论哟~


