下列关于开源大数据框架的不足的说法,错误的是()。
A.快速查询
B.事件批处理
C.流处理
D.内存计算
A.快速查询
B.事件批处理
C.流处理
D.内存计算
第2题
A.SparkStreaming是一个微批处理框架,事件需要积累到一定量时才进行处理
B.Streaming的执行逻辑是即时启动,运行完后再回收
C.SparkStreaming的吞吐量大约是Streaming的25倍
D.SparkStreaming事件处理时延比Streaming更高
第3题
A.A.Spark是一个基于内存迭代的框架
B.B.Spark是一个数据分析技术栈,包含了大数据的多种计算模式
C.C.Spark可以采用多种编程语言进行开发,比如Scal
D.D.Java
E.E.Spark计算过程中,数据不会落地到磁盘
第4题
A.MR框架过多的磁盘操作,缺乏对分布式内存的支持
B.MR框架无法高效地支持迭代式计算
C.MR框架无法高效地支持交互式数据挖掘任务
D.MR框架无法进行分析性计算任务
第5题
A.A.从追求因果关系到追求相关关系
B.B.从追求算法到追求数据
C.C.大数据的复杂计算和小数据的简单计算
D.D.大数据的简单计算和小数据的复杂计算
第6题
A.A.文件存储是以流的形式来操作数据的
B.B.文件存储可以将数据存储到SD卡中
C.C.文件存储可以将数据存储到内存中
D.D.Android中只能使用文件存储数据
第7题
A.实时分析一般应用于电子商务和金融。需要在数据不断变化的情况下,进行快速的数据分析,并以非常短的延迟返回,才能达到不影响用户体验的目的
B.实时分析采用的架构包括,使用传统关系数据库的并行处理集群,或者采用实时计算架构,例如开源数据分析平台Storm
C.离线分析通常指分析时不需要联网的应用,例如机器学习,统计分析和推荐算法
D.离线分析的技术框架相对成熟,常用的分析框架是:HDFS做存储,MapReduce做计算框架,Hive作为数据仓库
第8题
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
第9题
A.SparkSQL
B.Hive
C.Spark
D.MapReduce
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!