Hive数据倾斜的表现()
A.Hive建表后数据无法导入
B.Hive无法启动
C.Hivesql语句运行异常直接退出
D.Hive运算任务为报错单长期卡在99%
A.Hive建表后数据无法导入
B.Hive无法启动
C.Hivesql语句运行异常直接退出
D.Hive运算任务为报错单长期卡在99%
第1题
B.Hive可以实现在大规模数据集上实现低延迟快速的查询
C.Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销
D.Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上
第4题
A.Map join使用内存计算引擎,效率非常高,我们可以使用Map join来提高SQL效率
B.存储节点和计算节点放在一起,能提高SQL效率的主要原因是减少网络OI
C.reducer的个数不是越多越好,要根据Map的个数进行设置
D.128M以内(块的大小)的数据不会有数据倾斜的情况,超过128M需要注意数据倾斜问题
第5题
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
第6题
A.查看此Reducertask的HDFS_BYTES_WRITTEN值是否比正常Reducertask大很多
B.查看此Reducertask输出到hdfs文件大小是否比正常Reducertask大很多
C.查看此task的FILE_BYTES_READ值是否比正常Reducertask大很多
D.查看此task的HDFS_BYTES_READ值是否比正常Reducertask大很多
第8题
A./hive/warehouse
B./user/hive/warehouse
C./usr/hive/warehouse
D./usr/hive/
第10题
A.Hive使用HQL查询语言
B.Hive使用HDFS进行数据存储
C.RDBS数据规模较大
D.Hive硬件配置要求一般,RDBMS要求较高
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!