题目内容
(请给出正确答案)
[单选题]
设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行()操作。
A.分桶
B.分区
C.索引
D.分表
单选题,请选择你认为正确的答案:
提交
查看答案
如搜索结果不匹配,请 联系老师 获取答案
A.分桶
B.分区
C.索引
D.分表
第3题
A.A.使用索引可以提高对表的检索速度,所以索引字段设置的越多 速度就会越快
B.B.建立索引的表对其进行dml操作速度要比没有建立索引的表快
C.C.索引可以提高对表的检索速度,对于经常用做查询条件的字段应 对其建立索引
D.D.以上都不正确
第4题
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
第5题
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!