下列关于spark中的RDD描述正确的有()。
A.RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象
B.Resilient:表示弹性的,弹性表示
C.Destributed:分布式,可以并行在集群计算
D.Dataset:就是一个集合,用于存放数据的
A.RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是spark中最基本的数据抽象
B.Resilient:表示弹性的,弹性表示
C.Destributed:分布式,可以并行在集群计算
D.Dataset:就是一个集合,用于存放数据的
第1题
A.对各种数据计算模型的统一抽象
B.RDD是一个读、写、分区记录的集合
C.Spark的计算过程主要是RDD的迭代计算过程
D.一个存储数据的数据结构
第2题
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生
第6题
A.A.RDD Object->ADGScheduler->TaskScheduler->Worker
B.B.ADGScheduler->RDD Object->TaskScheduler->Worker
C.C.RDD Object->TaskScheduler->ADGScheduler->Worker
D.D.Worker->ADGScheduler->TaskScheduler->RDD Object
第8题
A.RDD不能由多个分区(partition)组成
B.弹性、集中式内存集
C.RDD能生成ChildrenRDD
D.是一个容错的、并行的数据结构
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!