下列说法正确的是
A、数据仓库Hive不需要借助于HDFS就可以完成数据的存储
B、Impala和Hive、HDFS、HBase等工具可以统一部署在一个Hadoop平台上
C、Hive本身不存储和处理数据,依赖HDFS存储数据,依赖MapReduce处理数据
D、HiveQL语法与传统的SQL语法很相似
A、数据仓库Hive不需要借助于HDFS就可以完成数据的存储
B、Impala和Hive、HDFS、HBase等工具可以统一部署在一个Hadoop平台上
C、Hive本身不存储和处理数据,依赖HDFS存储数据,依赖MapReduce处理数据
D、HiveQL语法与传统的SQL语法很相似
第1题
A.Hive hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能
B.Impala Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据
C.Kylin Kylin?是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维析(OLAP)能力以支持超大规模数据
D.HBase HBase是一个分布式的、面向列的开源数据库
第2题
第3题
A.hive的元数据可以存储在mysql中
B.hive的数据存储在hdfs上能够利用分布式存储的优势
C.hive支持随机查询
D.hive能够使用类SQL语言完成一定的数据分析需求
第4题
A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,二传统数据仓库数据应用单一,灵活性低
B.Hive基于HDFS存储,理论上存储可以无限扩容,而传统数据仓库存储量有上限
C.由于Hive的数据存储在HDFS上,所以可以保证数据的高容错,高可靠
D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快
第5题
A.Hadoop
B.Impala
C.Spark
D.BigTable
第6题
A.实时分析一般应用于电子商务和金融。需要在数据不断变化的情况下,进行快速的数据分析,并以非常短的延迟返回,才能达到不影响用户体验的目的
B.实时分析采用的架构包括,使用传统关系数据库的并行处理集群,或者采用实时计算架构,例如开源数据分析平台Storm
C.离线分析通常指分析时不需要联网的应用,例如机器学习,统计分析和推荐算法
D.离线分析的技术框架相对成熟,常用的分析框架是:HDFS做存储,MapReduce做计算框架,Hive作为数据仓库
第7题
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行的MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖
第8题
A、Hive最终将数据存储在HDFS中
B、Hive是Hadoop平台的数据仓库工具
C、HQL可以通过Map Reduce执行任务
D、Hive对HBase有强依赖
第11题
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!