
使用Java编写的Hadoop、Hive和MapReduce示例。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
基于 Hadoop 的 Hive 数据仓库 Java API 简单调用的实例,为了简洁,这里不再详细阐述 Hive 的总体介绍。Hive 提供了三种用户界面:命令行接口 (CLI)、JDBC/ODBC 以及 Web UI。CLI 对应于 Shell 命令行,JDBC/ODBC 则类似于使用传统数据库 JDBC 方式连接,而 Web UI 通过浏览器访问 Hive。本文将重点介绍第二种用户接口,直接切入核心内容。
1、Hive 安装:
1) Hive 的安装过程请参考网络上现有的相关文档,在测试阶段仅需要在 Hadoop 一个节点上安装 Hive 即可。
2) 测试数据 `data` 文件以制表符 (`\t`) 分隔:
* `zhangsan` 1
* `lisi` 2
* `wangwu` 3
3) 将测试数据 `data` 文件上传至 Linux 目录下,我将其放置在 `/home/hadoop01/data`。
2、在使用 JDBC 开发 Hive 程序时,必须首先启动 Hive 的远程服务接口。可以使用以下命令启动该接口: `Java代码 收藏代码 hive --service hiveserver >/dev/null 2>/dev/null &` 通过 CLI、Client 或 Web UI 等 Hive 提供的人机交互方式与 Hive 进行通信,其中 CLI 和 Client 是最常用的两种方式。Client 是 Hive 的客户端程序,它连接至 Hive Server。在启动 Client 模式时,需要明确指定 Hive Server 所属的节点,并在该节点上启动 Hive Server 本身。Web UI 则通过浏览器实现对 Hive 的访问和操作。本文将探讨如何利用 HiveServer 来执行相关操作。
Hive 提供 JDBC 驱动程序,从而允许我们使用 Java 代码连接到 Hive 并执行类似关系型数据库的 SQL 查询等操作。与关系型数据库的操作类似,我们也需要打开 Hive 服务;在Hive 版本为0.11.0之前,只有HiveServer服务可用。因此, 在程序操作Hive之前, 需要在Hive安装服务器上启动HiveServer服务, 例如: `1 [wyp@localhost/home/q/hive-0.11.0]$ bin/hive --service hiveserver -p10002` 这表明已经成功地在端口为 10002 (默认端口为 10000) 上启动了 `hiveserver` 服务。此时, 你就可以通过 Java 代码连接到 `hiveserver`, 示例代码如下所示.
全部评论 (0)


