这些天看到很多人在使用Hive的过程遇到这样或那样的错误,看着那些少的可怜的错误日志出错,一直找不到原因。后来我给他们介绍了修改日志输出级别之后,错误原因很快得到定位。于是乎我写了这篇博文。希望那些在使用HQL的过程中遇到问题,通过这里介绍的方法进行调试而定位到错误,从而少走弯路。好了,废话不多说进入正文。
在很多程序中,我们都可以通过输出日志的形式来得到程序的运行情况,通过这些输出日志来调试程序,Hive也不例外。
在Hive中,使用的是Log4j来输出日志,默认情况下,CLI是不能将日志信息输出到控制台的。在Hive0.13.0之前版本,默认的日志级别是WARN,从Hive0.13.0开始,默认的日志级别是INFO。默认的日志存放在/tmp/<user.name>文件夹的hive.log文件中,全路径就是/tmp/<user.name>/hive.log。
在默认的日志级别情况下,是不能将DEBUG信息输出,这样一来出现的各种详细的错误信息都是不能数错的。但是我们可以通过以下两种方式修改log4j输出的日志级别,从而利用这些调试日志进行错误定位,具体做法如下:
[wyp@master ~]$ hive --hiveconf hive.root.logger=DEBUG,console
或者在${HIVE_HOME}/conf/hive-log4j.properties文件中找到hive.root.logger属性,并将其修改为下面的设置
hive.root.logger=DEBUG,console
不过,我们可以设定自己的log4j配置文件,通过修改-hiveconf hive.log4j.file=/home/iteblog/hive-log4j.properties
参数指定。这样设置对别人不会产生影响。
hive> set hiveconf:hive.root.logger=DEBUG,console;
这样你在进入CLI的时候将会得到一些类似下面的调试信息:
[wyp@master /home/q/hive-0.11.0-bin/conf]$ hive ................................为了篇幅,省略了很多............................ 13/12/25 15:14:54 DEBUG parse.VariableSubstitution: Substitution is on: hive ................................为了篇幅,省略了很多............................ 13/12/25 15:14:54 DEBUG security.Groups: Creating new Groups object 13/12/25 15:14:54 DEBUG util.NativeCodeLoader: Trying to load the c... library for your platform... using builtin-java classes where applicable 13/12/25 15:14:54 DEBUG security.JniBasedUnixGroupsMappingWithFallback: Falling back to shell based 13/12/25 15:14:54 DEBUG security.JniBasedUnixGroupsMappingWithFallback: Group mapping impl=org.apache.hadoop.security.ShellBasedUnixGroupsMapping 13/12/25 15:14:54 DEBUG security.UserGroupInformation: hadoop login 13/12/25 15:14:54 DEBUG security.UserGroupInformation: using local user:UnixPrincipal: wyp 13/12/25 15:14:54 DEBUG security.UserGroupInformation: UGI loginUser:wyp (auth:SIMPLE) ................................为了篇幅,省略了很多............................
下面举个日志调试的例子,在没有修改日志输出级别之前,有下面的查询所有表的HQL如下:
hive> show tables; FAILED: Error in metadata: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.metastore.HiveMetaStoreClient FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask hive>
得到上面的错误,我们从上面的错误输出只知道是元数据有问题。具体的错误也不知道,这时候如果我们修改了日志调试级别hive.root.logger=DEBUG,console,我们再来看看运行上面语句的错误输出:
hive> show tables; ................................为了篇幅,省略了很多............................ 13/12/25 15:23:58 INFO metastore.ObjectStore: ObjectStore, initialize called 13/12/25 15:23:58 ERROR Datastore.Schema: Failed initialising database. Access denied for user 'datalog5'@'l-datalog5.data.cn1' (using password: YES) org.datanucleus.exceptions.NucleusDataStoreException: Access denied for user 'datalog5'@'l-datalog5.data.cn1' (using password: YES) at org.datanucleus.store.rdbms.ConnectionFactoryImpl $ManagedConnectionImpl.getConnection(ConnectionFactoryImpl.java:536) at org.datanucleus.store.rdbms.RDBMSStoreManager.<init> (RDBMSStoreManager.java:290) at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method) ................................为了篇幅,省略了很多............................
通过上面的错误堆栈我们就可以将问题定位到是连接数据库出现了问题,这么一来错误的定位范围就大大减少了,我们可以查看书Hive-site.xml文件中连接数据库的配置是否正确等来解决上述问题。
本博客文章除特别声明,全部都是原创!原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载。
本文链接: 【Hive日志调试】(https://www.iteblog.com/archives/873.html)