()是Google提出的用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。
A.MapReduce
B.GFS
C.BigTable
D.Chubby
A.MapReduce
B.GFS
C.BigTable
D.Chubby
第3题
A.一个reduce的输入数据可能来自于多个map的输出
B.一个MR处理可以不包括任何map
C.一个MR处理可以不包括任何reduce
D.一个map的输出结果可能会被分配到多个reduce上去
第4题
A.概念“Map(映射)”和“Reduce(归约)”,是它们的主要思想
B.提供数据划分和计算任务调度功能
C.使用了多种有效的错误检测和恢复机制
D.顺序处理数据、避免随机访问数据
E.平滑无缝的可扩展性
第5题
A.是一个分布式的、面向列的开源数据库
B.是一种编程模型,用于大规模数据集(大于1TB)的并行运算
C.是Hadoop集群当中的资源管理系统模块
D.将要储存的文件分散在不同的硬盘上,并记录他们的位置
第6题
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce
第7题
A.一个分布式文件系统和并行执行环境
B.让用户便捷的处理海量数据
C.优势在于处理数据少计算量高的任务
D.Apache软件基金会下面的一个开源项目
第8题
A.利用分布式文件系统、数据仓库、关系数据库等实现对结构化、半结构化和非结构化海量数据的存储和管理
B.利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析
C.构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全
D.把实时采集的数据作为流计算系统的输入,进行实时处理分析
为了保护您的账号安全,请在“赏学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!