
Hive SQL语法概述
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本篇文档提供了一个关于Hive SQL语法的基础性介绍,涵盖了数据定义、数据操作及查询语言等核心概念,旨在帮助初学者快速上手使用Hive进行大数据处理。
在大数据处理领域,Hive是一个重要的工具,它允许用户使用SQL语法来操作存储于Hadoop集群中的结构化数据。通过将SQL语句转换为MapReduce任务,Hive适合执行大规模数据集的批处理作业,而不是实时查询或行级更新。
创建数据库是进行Hive操作的基础步骤之一。你可以利用`CREATE DATABASE`命令建立新的数据库实例。例如,“CREATE DATABASE mydb;”会生成一个名为mydb的新数据库。如果你想查看现有的所有数据库,则可以使用“SHOW DATABASES;”命令来实现这一目的。
在Hive中,表作为数据的主要组织形式存在。创建表的语法如下:
```sql
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
[CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]
[ROW FORMAT row_format]
[STORED AS file_format]
[LOCATION hdfs_path];
```
`CREATE TABLE`语句用来创建新的表,而使用`EXTERNAL`关键字则表明该表为外部表,并且其数据存储在HDFS的指定位置。通过添加描述信息可以利用`COMMENT`来增强对列或整个表格的理解性。“PARTITIONED BY”用于建立分区表,在处理大量数据时非常有用,因为它有助于提升查询性能。“ROW FORMAT”和“STORED AS”定义了数据的具体存储格式,如TEXTFILE、SEQUENCEFILE或者RCFILE。
创建一个简单的例子如下:
```sql
CREATE TABLE person (name STRING, age INT);
```
而外部表的建立示例如下:
```sql
CREATE EXTERNAL TABLE page_view (
viewTime INT,
userid BIGINT,
page_url STRING,
referrer_url STRING,
ip STRING COMMENT IP Address of the User,
country STRING COMMENT country of origination
)
COMMENT 这里写表的描述信息
ROW FORMAT DELIMITED FIELDS TERMINATED BY ,
STORED AS TEXTFILE
LOCATION
全部评论 (0)


