本实验为《大数据技术原理及应用》课程设计,旨在通过林子雨教授指导,使学生掌握Linux系统基本命令和Hadoop平台的操作方法,加深对大数据技术的理解。
在大数据技术的学习过程中,Linux和Hadoop是两个重要的基石。由于其开源性和分布式计算能力,Hadoop通常部署于Linux操作系统之上,而后者提供了稳定且高度可定制化的底层支持环境。
本实验的主要目的是使学生熟悉基本的Linux命令操作以及Hadoop的基本使用方法,为后续的大数据处理实验奠定坚实的基础。
### Linux 操作
- **cd 命令**:用于目录切换。例如:
- `cd usrlocal` 切换到指定目录;
- `cd ..` 返回上一级目录;
- `cd` 回到用户主文件夹。
- **ls 命令**:列出当前或指定目录下的所有内容,如 `ls /usr` 可查看 `/usr/` 目录中的文件和子目录。
- **mkdir 和 rmdir命令**:
- 创建新目录使用 `mkdir tmpa`, 或者创建多级目录使用 `mkdir -p tmpa1/a2/a3`.
- 删除空的指定目录采用 `rmdir tmpa`.
- **cp 命令**:复制文件或整个目录,如将`~/.bashrc` 复制到 `/usr/bashrc1`, 或者复制一个完整目录使用 `-r` 参数。
- **mv命令**:移动和重命名文件或目录。例如:
- `mv /usr/bashrc1 /usr/test`
- `mv test usrtest2`
- **rm 命令**:删除文件或整个目录,如 `rm usrbashrc1` 或者使用 `-r` 参数删除一个包含子项的完整目录。
- 文件内容查看:
- 使用 `cat`, `tac`, `more`, `head -n 20 ~/.bashrc`, `tail -n 20 ~/.bashrc` 和 `tail +51 ~.bashrc` 查看文件。
- **touch 命令**:创建新的空白文件或更新现有文件的时间戳,如使用 `-m -t` 参数设置特定日期。
- 文件权限修改:
- 使用 `chown root tmphello` 更改所有者为root.
- 文件搜索和目录操作:
- 使用 `find ~ -name .bashrc` 在主目录下查找.bashrc文件.
- **tar 命令**:打包或解压缩,如使用 `-czvf test.tar.gz test` 打包并压缩一个目录。
### Hadoop 操作
- 启动Hadoop服务(包括启动HDFS和YARN等组件)。
- 在HDFS上执行基本操作:
- `hadoop fs -mkdir user/hadoop`
- 创建用户目录,如 `user/hadoop/test`.
通过上述实验步骤的练习,学生可以掌握Linux的基本运维技能以及Hadoop的基础应用能力。这将为进行大规模数据处理和分析做好充分准备,并且深入理解Linux与Hadoop结合使用对于大数据生态系统的重要性。