我是靠谱客的博主 怡然天空,这篇文章主要介绍Hive 数据库相关基本语法,现在分享给大家,希望可以做个参考。

创建数据库:

复制代码
1
2
3
4
5
6
hive> create database if not exists hive2; OK Time taken: 0.257 seconds hive> drop table hive2; OK Time taken: 0.224 seconds

创建存在的数据库,系统会报错:

复制代码
1
2
hive> create database hive2; FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. Database hive2 already exists

避免创建重复的数据库,系统报错,可以使用如下的语句:

复制代码
1
2
3
4
hive> create database if not exists hive2; OK Time taken: 0.031 seconds
删除数据库:

复制代码
1
hive> drop databses hive2;
数据库所在目录默认是hive.metastore.warehouse.dir 指定的目录,例如:

复制代码
1
2
3
4
5
<property> <name>hive.metastore.warehouse.dir</name> <value>/user/hive/warehouse</value> <description>location of default database for the warehouse</description> </property>

创建数据库时,如果不指定目录,数据将存储在 /user/hive/warehouse 这个子目录中,创建数据库时也可以指定目录,例如:

复制代码
1
2
3
hive> create database hive2 location '/user/hive/databaseDir/'; OK Time taken: 0.071 seconds

在hdfs中如下格式,是以 .db 结尾的
创建数据库时可以为数据库添加描述信息:

复制代码
1
2
3
hive> create database hive3 comment 'test database comment'; OK Time taken: 0.056 seconds
使用describe database database_name 能够查看描述语句以及数据库所在的文件目录位置:

复制代码
1
2
3
4
5
hive> describe database hive3; OK db_name comment location owner_name owner_type parameters hives test database comment hdfs://localhost:9000/user/hive/warehouse/hive3.db hadoop USER Time taken: 0.033 seconds, Fetched: 1 row(s)
创建数据库时可以指定键值对信息:
复制代码
1
2
3
hive> create database hive4 with dbproperties('creator' = 'root','date'= '2017-04-24'); OK Time taken: 0.066 seconds
同过describe database extended database_name 语句可以查看:

复制代码
1
2
3
4
5
6
hive> describe database extended hive4; OK db_name comment location owner_name owner_type parameters hive4 hdfs://localhost:9000/user/hive/warehouse/hive4.db hadoop USER {date=2017-04-24, creator=root} Time taken: 0.031 seconds, Fetched: 1 row(s)
hive 没有命令可以查看当前使用的是哪个数据库,这个很遗憾。但是可以通过设置
hive.cli.print.current.db=true 显示出当前使用的数据库。

复制代码
1
2
3
4
5
6
7
hive> set hive.cli.print.current.db=true; hive (default)> use hive2; OK Time taken: 0.024 seconds hive (hive2)> use default; OK Time taken: 0.027 seconds
删除数据库HQL:

复制代码
1
2
3
hive (default)> drop database if exists hive2; OK Time taken: 0.054 seconds
默认情况下,hive不允许删除非空的数据库:

复制代码
1
2
3
4
5
6
7
8
hive (default)> use hive4; OK Time taken: 0.022 seconds hive (hive4)> create table T1(name string,age int); OK Time taken: 0.15 seconds hive (hive4)> drop database hive4; FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. InvalidOperationException(message:Database hive4 is not empty. One or more tables exist.)

可以在语句后加上关键字cascade关键字,这样可以让hive先删除数据库中的表,然后再删除数据库:
复制代码
1
2
3
hive (hive4)> drop database hive4 cascade; OK Time taken: 2.202 seconds
提示符这里是不会自动刷新的,可以切到其他数据库,再切到hive4 的时候,将会报错:
复制代码
1
2
3
4
5
hive (hive4)> use default; OK Time taken: 0.026 seconds hive (default)> use hiv4; FAILED: SemanticException [Error 10072]: Database does not exist: hiv4
注意:数据库删除后,对应的目录也会被删除,hive4.db 目录不存在了


最后

以上就是怡然天空最近收集整理的关于Hive 数据库相关基本语法的全部内容,更多相关Hive内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(74)

评论列表共有 0 条评论

立即
投稿
返回
顶部