题目内容 (请给出正确答案)
[多选题]

Spark和Hadoop的差异主要体现在以下几点()

A.Spark引进了弹性分布式数据集RDD(ResilientDistributedDataset)的抽象,容错性高

B.Spark提供的数据集操作类型不仅限于Map和Reduce,大致分为:Transformations和Actions两大类

C.Spark程序由Python语言进行编写,不支持Java语言进行的程序编写

D.Spark把中间数据放到内存中,迭代运算效率高

查看答案
如搜索结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能会需要:
您的账号:
发送账号密码至手机
发送
更多“Spark和Hadoop的差异主要体现在以下几点()”相关的问题

第1题

基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有()。

A.MR

B.Spark

C.HDFS

D.HBase

点击查看答案

第2题

Spark大数据分析处理中的内存数据结构是()。

A.RDD弹性分布式数据集

B.Key-Value

C.Record

D.Document

点击查看答案

第3题

Spark中的RDD的说法正确的是()。

A.弹性分布式数据集

B.是Spark中最基本的数据抽象

C.代表一个可变的集合

D.代表的集合里面的元素可并行计算

点击查看答案

第4题

Apache软件基金会最重要的三大分布式计算系统开源项目包括()。

A.Hadoop

B.Spark

C.Storm

D.MapReduce

点击查看答案

第5题

RDD是含义是()

A.弹性分布式数据集

B.弹性运算数据集

C.可重复操作数据

D.远端数据定义

点击查看答案

第6题

Spark自带的资源管理框架是:()。

A.RDD具有血统机制(Lineage)

B.RDD默认存储在磁盘

C.RDD是一个只读的,可分区的分布式数据集

D.RDD是Spark对基础数据的抽象

点击查看答案

第7题

下面关于Hadoop的描述错误的是:()。

A.Hadoop是一个能够对大量数据进行分布式处理的软件框架

B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据

C.Hadoop只支持Java编程语言

D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上

点击查看答案

第8题

Hadoop是一个能够对大数据进行分布式处理的软件框架。()A、错B、对

Hadoop是一个能够对大数据进行分布式处理的软件框架。()

A、错

B、对

点击查看答案

第9题

在华为大数据解决方案中,hadoop底层包含()组件。

A.Flink

B.Hive

C.Miner

D.Spark

点击查看答案
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改
温馨提示
每个试题只能免费做一次,如需多次做题,请购买搜题卡
立即购买
稍后再说
警告:系统检测到您的账号存在安全风险

为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!

微信搜一搜
赏学吧
点击打开微信
警告:系统检测到您的账号存在安全风险
抱歉,您的账号因涉嫌违反赏学吧购买须知被冻结。您可在“赏学吧”微信公众号中的“官网服务”-“账号解封申请”申请解封,或联系客服
微信搜一搜
赏学吧
点击打开微信