更多“Spark RDD 是惰性求值的, 如果需要对一个RDD 多…”相关的问题
第1题
RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。()
点击查看答案
第2题
RDD的转换操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。()
点击查看答案
第3题
有关RDD描述正确的是()。
A.一组分片是数据集的基本组成单位
B.计算是以分片为单位的
C.RDD的每次转换都会生成一个新的RDD
D.是一个分区的只读记录的集合
点击查看答案
第4题
RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。()
点击查看答案
第5题
RDD的行动操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。()
点击查看答案
第6题
SparkStreaming容错机制是指RDD中任意的Partition出错,都可以根据其父RDD重新计算生成如果父RDD丢失,则需要去磁盘中查找原始数据。()
点击查看答案
第7题
请问RDD的()操作用来计算RDD中所有元素个数。
A.count
B.num
C.length
D.number
点击查看答案
第8题
RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。()
点击查看答案
第9题
关于RDD,下列说法错误的是?()
A.RDD具有血统机制(Lineage)
B.RDD默认存储在磁盘
C.RDD是一个只读的,可分区的分布式数据集
D.RDD是Spark对基础数据的抽象
点击查看答案
第10题
请问RDD的()操作是根据键对两个RDD进行内连接。
A.join
B.zip
C.combineByKey
D.collect
点击查看答案