
Hadoop-LZO-主分支
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Hadoop-LZO项目旨在为Apache Hadoop提供LZO压缩支持,优化数据处理性能。此主分支包含了最新的功能更新与错误修复。
1. 安装 Hadoop-gpl-compression 1.1:使用 wget 下载 hadoop-gpl-compression-0.1.0-rc0.tar.gz 文件。
- 解压后,将 hadoop-gpl-compression-0.1.0/lib/native/Linux-amd64-64/ 目录下的所有文件移动到 $HADOOP_HOME/lib/native/Linux-amd64-64/
- 将 hadoop-gpl-compression-0.1.0/hadoop-gpl-compression-0.1.0.jar 文件复制至 /usr/local/hadoop-1.0.2/lib/
2. 安装 lzo:
- 使用 apt-get 命令安装 gcc 和 lzop
3. 在本地测试,可以执行压缩及解压缩命令。
- 下载 hadoop-lzo 并进行解压
- 设置环境变量:export CFLAGS=-m64;export CXXFLAGS=-m64(适用于 Hadoop 0.20 版本)
- 编译生成的 build/hadoop-lzo-0.4.15.jar 文件复制到 /usr/local/hadoop-1.0.2/lib/
- 使用 bin/hadoop jar 命令测试解压程序,具体命令为:bin/hadoop jar /usr/local/hadoop-1.0.2/lib/hadoop-lzo-0.4.15.jar com.hadoop.compression.lzo.LzoIndexer /home/hadoop/project_hadoop/aa.html.lzo
全部评论 (0)


