
Nutch在Linux环境下的分布式配置与应用。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
这是一份个人总结,详细记录了我在完全分布式环境中,在Cent-OS操作系统上部署Nutch-1.1的过程。该文档的内容经过精心设计,旨在为所有Linux系统以及当前各种版本的Nutch提供指导。以下是目录概述:目录介绍..............................................................20 集群网络环境的详细说明................................................ 21 /etc/hosts文件配置的步骤.............................................. 22 SSH无密码验证配置的指南 ................................................ 22.1 配置所有节点间的SSH无密码验证机制 ................................ 23 JDK安装及Java环境变量设置的说明 ........................................ 33.1 JDK 1.6 的安装过程 ................................................ 33.2 Java环境变量的设置方法 ............................................ 4 Hadoop集群配置的步骤和注意事项 ................................... 45 Hadoop集群启动的流程 ................................................... 6 Nutch分布式爬虫的搭建与运行 .................................. 96.1 Nutch配置文件的详细设置 ............................................ 96.2 执行Nutch分布式爬虫的具体操作 ........................................ 10 Nutch检索功能的介绍 .................................................. 137.1 在Windows环境下,Nutch单机搜索本地索引数据的方法 .................. 137.2 在Linux环境下,Nutch单机搜索本地索引数据的方法 .................. 147.2.1 通过WEB前端实现搜索功能 .................................. 147.2.2 通过命令行进行搜索操作 ............................ 157.3 在Linux环境下,Nutch搜索HDFS中存储的索引数据 ..................... 157.3.1 通过WEB前端实现搜索功能
全部评论 (0)


