impala版本:1.1.1
hive:0.10.0-cdh4.4.0
hadoop:hadoop-2.0.0-cdh4.2.2
数据存储在hadoop的HDFS,文件格式是RCFile,用impala创建external table方式关联文件。一直都正常运行,但因为数据量太大,业务应用访问太慢,需要将table分区,但没想分区太多。出现了异常,异常内容如下:
ERROR: AnalysisException: Failed to load metadata for table: my_table CAUSED BY: TableLoadingException: TableLoadingException: Failed to load metadata for table: my_table CAUSED BY: TTransportException: java.net.SocketTimeoutException: Read timed out CAUSED BY: SocketTimeoutException: Read timed out
或者
AnalysisException:Failed to load metadata for table:my_table
CAUSED BY:TableLoadingException:Failed to load metadata for table:my_table
CAUSED BY: TTransportExeption: null
查找原因,发现impala与hive都不能正常读取metadata信息。但进程仍正常。只好kill掉进程再重启
1)ps -ef|grep metastore
2)返回hive进程pid,执行kill -9 pid
3)./hive --service metastore
4)service impala-server stop
5)service impala-server start
6)impala-shell -r
可以获取到metadata数据,看到表信息
但是仍然不能访问my_table
查询hive的log,在/tmp/root/hive.log目录下(可以在hive-site.xml中修改路径)
发现报java.lang.OutOfMemoryError:GC overhead limit exceed
修改hive/conf/hive-env.sh,将export HADOOP_HEAPSIZE=** 改大,并重启hive就可以了。(据说也可以升级impala到1.2.4版本解决)
如果进入impala-shell,访问某些表时仍有如下错误:
ERROR: TApplicationException:get_table failed:out of sequence response
执行:invalidate metadata my_table;
再执行你的sql语句应该就可以了。
相关推荐
hive metastore是hive的元数据管理服务,实际应用中很多第三方框架需要访问metastore服务,如spark,impala等。同样hive metastore也提供了java接口。 使用 import org.apache.hadoop.hive.conf.HiveConf; import org...
Kudu是Cloudera开源的新型列式存储系统,Apache Hadoop生态圈的顶级项目之一,解决了传统Lamda架构处理Hadoop上快速变化数据的存储和处理技术过于复杂的问题,同时Kudu能够与Hadoop生态的其他组件比如Impala、Spark...
dbeaver-ce-21.2.0.exe; hadoop-common-2.6.0-cdh5.7.0.jar hive-jdbc-1.1.0-cdh5.4.5-standalone.jar ImpalaJDBC41.jar ImpalaJDBC42.jar
Impala 与Hive都是构建在Hadoop之上的数据查询工具各有不同的侧重适应面,但从客户端使用来看Impala与Hive有很多的共同之处,如数据表元数 据、ODBC/JDBC驱动、SQL语法、灵活的文件格式、存储资源池等。Impala与Hive...
一直在网上找不到impalajdbc的pom依赖,项目是maven的,所以整理了所用的pom
springboot+mybatis+impala/mysql整合Demo , 内嵌PageHelper插件已整合,需要根据pom.xml中的备注操作即可使用mysql和PageHelper, impala 不支持PageHelper插件
Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。并且impala兼容Hive的sql解析,实现了Hive的SQL语义的子集,功能还在不断的完善中。...
10-1+Impala+落地&优化:神策数据多维分析平台构建实战
Hadoop Impala connect hive2 jdbc related Hadoop Impala connect hive2 jdbc related
9-4+Impala+3.4在网易的优化实践
java通过jdbc操作impala hive的jar驱动包,Impala支持标准JDBC接口,允许从商业智能工具和用Java或其他编程语言编写的定制软件进行访问。JDBC驱动程序允许您从您编写的Java程序访问Impala
Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布式查询引擎(由Query Planner、Query ...
impala_jdbc_2.5.41.1061(最新) hive_jdbc_2.5.19.1053(最新) 均包含英文使用说明文档,兼容绝大多数的hive/impala版本 该资源来自cloudera,仅用于分享知识,学习和交流,请勿用于商业用途
包含基于 Impala 构建实时用户行为分析引擎.pdf和.开源大数据分析引擎Impala实战.pdf两份
impala jdbc hive只要新建 DriverManager 并将 Impala的JDBC Jar包加载进来就可以 这个方法也可以应用于其他支持JDBC连接的数据库,如Hive等
Hadoop databases: Hive, Impala, Spark, Presto For ORACLE DBAs
jdbc 连接impala或者jdbc连接hive所需的jar包。