试题列表
单选题
题型:单选题客观题分值2分难度:一般得分:2
1
下列哪个不属于YARN体系结构中ResourceManager的功能?
A
资源分配与调度
B
处理来自ApplicationMaster的命令
C
监控NodeManager
D
处理客户端请求
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
2
下列关于推荐系统的描述,哪一项是错误的?
A
推荐系统是自动联系用户和物品的一种工具
B
推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
C
推荐系统分为基于物品的协同过滤和基于商家的协同过滤
D
推荐系统是大数据在互联网领域的典型应用
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
3
下列关于Scala特性的描述,错误的是哪一项?
A
Scala具备强大的并发性,支持函数式编程,可以更好地支持分布式系统
B
Scala是Spark的主要编程语言
C
Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
D
Scala语法复杂,但是能提供优雅的API
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
4
下列关于Map和Reduce函数的描述,哪个是错误的?
A
Map将小数据集进一步解析成一批<key,value>对,输入Map函数中进行处理
B
Map每一个输入的<k1,v1>会输出一批<k2,v2>,
C
Reduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于不同k2的value
D
Reduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于同一个k2的value
学生答案:C
老师点评:Reduce输入的中间结果<k2,List(v2)>中的List(v2)表示是一批属于同一个k2的value。
题型:单选题客观题分值2分难度:一般得分:2
5
下列传统并行计算框架,说法错误的是哪一项?
A
共享式(共享内存/共享存储),容错性好
B
编程难度高
C
刀片服务器、高速网、SAN,价格贵,扩展性差
D
实时、细粒度计算、计算密集型
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
6
下列关于推荐系统的描述,有误的是?
A
混合推荐:结合多种推荐算法来提升推荐效果
B
基于统计的推荐:通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容
C
协同过滤推荐:应用最早和最为成功的推荐方法之一
D
专家推荐:人工推荐,由资深的专业人士来进行物品的筛选和推荐,需要较多的人力成本性
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
7
在Hadoop生态系统中,Kafka主要解决Hadoop 中存在哪些的问题?
A
延迟高,而且不适合执行迭代计算
B
Hadoop生态系统中各个组件和其他产品之间缺乏统一的、高效的数据交换中介
C
抽象层次低,需要手工编写大量代码
D
不同的MapReduce任务之间存在重复操作,降低了效率
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
8
下列关于Spark的描述,错误的是哪一项?
A
支持使用Scala、Java、Python和R语言进行编程,但是不可以通过Spark Shell进行交互式编程
B
提供了完整而强大的技术栈,包括SQL查询、流式计算、机器学习和图算法组件
C
可运行于独立的集群模式中,可运行于Hadoop中,也可运行于Amazon EC2等云环境中
D
使用DAG执行引擎以支持循环数据流与内存计算
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
9
下列关于Spark中RDD的说法,描述有误的是?
A
每个RDD可分成多个分区,每个分区就是一个数据集片段
B
RDD提供了一种高度受限的共享内存模型
C
一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合
D
RDD是可以直接修改的
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
10
关于HDFS Federation 的设计的描述,哪个是错误的?
A
HDFS Federation中,所有名称节点会共享底层的数据节点存储资源,数据节点向所有名称节点汇报
B
属于不同命名空间的块可以构成同一个“块池”
C
HDFS的命名服务能够水平扩展
D
设计了多个相互独立的名称节点
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
11
下列说法哪项有误?
A
Spark可以部署在资源管理器YARN之上,提供一站式的大数据解决方案
B
相对于Spark来说,使用Hadoop进行迭代计算非常耗资源
C
Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念
D
Spark将数据载入内存后,之后的迭代计算都可以直接使用内存中的中间结果作运算,避免了从磁盘中频繁读取数据
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
12
在Spark生态系统组件的应用场景中,下列哪项说法是错误的?
A
Spark Streaming是基于历史数据的数据挖掘
B
GraphX是图结构数据的处理
C
Spark Core应用在复杂的批量数据处理
D
Spark SQL是基于历史数据的交互式查询
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
13
关于Spark运行架构,下列说法错误的是?
A
DAG反映RDD之间的依赖关系
B
Application是用户编写的Spark应用程序
C
RDD是运行在工作节点(WorkerNode)的一个进程,负责运行Task
D
一个Job包含多个RDD及作用于相应RDD上的各种操作
学生答案:C
2025年秋江苏开放大学大数据库管理060602第三次过程性考核作业(7~10单元)本学期最新答案
觉得这篇文章对你有用的话,就打赏一下支持文章作者

请先 !