智慧树知到答案HADOOP大数据技术与项目实战最新答案

资源下载
下载价格15

绪论 单元测试

1、单选题:
下列对大数据的特点描述不正确的是( )
选项:
A:价值密度高
B:数据类型多样
C:速度要求快
D:数据体量巨大
答案: 【价值密度高】

第一章 单元测试

1、判断题:
云主机和物理机的寿命都是永久性的。( )
选项:
A:对
B:错
答案: 【错】

2、判断题:
对于实时性要求高的应用,需要应用实时处理架构。( )
选项:
A:错
B:对
答案: 【对】

3、判断题:
数据仓库是用来存储数据的而不是分析数据的。( )
选项:
A:对
B:错
答案: 【错】

4、判断题:
在DWS层中,用户行为日志数据分为公共字段和事件字段。( )
选项:
A:错
B:对
答案: 【对】

5、单选题:
项目实施流程中没有( )
选项:
A:数据仓库设计开发
B:数据导出
C:数据访问
D:下载数据
答案: 【下载数据】

6、单选题:
数据分析在企业中的作用( )
选项:
A:帮助企业经营者减少投入
B:干预经营者的决策
C:帮助企业经营者平衡企业的收益
D:直接的获取经营的利润
答案: 【直接的获取经营的利润】

7、单选题:
数据结构中哪项不是页面入口的来源( )
选项:
A:push
B:应用首页
C:登录页
D:详情页
答案: 【登录页】

8、多选题:
Hadoop的三大发行版本是 ( )
选项:
A:Apache
B:CDH
C:Java
D:HDP
答案: 【Apache;
CDH;
HDP】

9、多选题:
流量分析常见指标有哪些方面 ( )
选项:
A:访客分析
B:转化路径分析
C:受访分析
D:来源分析
答案: 【访客分析;
转化路径分析;
受访分析;
来源分析】

10、多选题:
网站流量数据分析的意义有哪些 ( )
选项:
A:从多方面提供网站分析的数据依据
B:帮助网站运营人员获取网站流量信息
C:提升网站用户体验
D:帮助提高网站流量
答案: 【从多方面提供网站分析的数据依据;
帮助网站运营人员获取网站流量信息;
提升网站用户体验;
帮助提高网站流量】

第二章 单元测试

1、判断题:
Hadoop是一种分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题。( )
选项:
A:错
B:对
答案: 【对】

2、判断题:
在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。( )
选项:
A:错
B:对
答案: 【对】

3、判断题:
在Hadoop分布式集群中,不需要对集群中的每一个节点都进行ip规划。( )
选项:
A:错
B:对
答案: 【错】

4、判断题:
利用HDFS操作命令可以将数据文件从本地上传到HDFS上,也可以将数据文件从HDFS下载到本地。( )
选项:
A:对
B:错
答案: 【对】

5、判断题:
在HDFS API操作中, closeFileSystem方法的功能是释放文件系统对象的资源。( )
选项:
A:错
B:对
答案: 【对】

6、判断题:
MapReduce词频统计案例中,执行map任务的最后阶段,会将缓冲区的数据全部写入到磁盘。( )
选项:
A:错
B:对
答案: 【对】

7、判断题:
Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系统,可用于海量日志采集、聚合和传输。( )
选项:
A:错
B:对
答案: 【对】

8、单选题:
能在网络中安全传输文件的软件是( )。
选项:
A:Xftp6
B:VMware
C:IDEA
D:Xshell
答案: 【Xftp6】

9、单选题:
创建了bigdata用户的命令是( )。
选项:
A:subigdata
B:useraddbigdata
C:bigdataALL
D:Sudoers
答案: 【useraddbigdata】

10、单选题:
论文( ),主要论证的核心是如何采用分布式的架构对海量数据进行分布式计算。
选项:
A:MapReduce
B:HDFS
C:BigTable
D:GFS
答案: 【MapReduce】

11、单选题:
假如我们设定hdfs块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成( )个分片
选项:
A:4
B:3
C:2
D:5
答案: 【4】

12、单选题:
在Linux命令行中,使用( )命令格式化hive元数据库
选项:
A:Format
B:Del
C:Clear
D:Schematool
答案: 【Schematool】

13、单选题:
在Hive中给表添加数据,使用( )方式给表添加数据效率更高。
选项:
A:insertinto
B:Add
C:append
D:Load
答案: 【Load】

14、单选题:
关系型数据库与HDFS之间相互数据迁移的工具是( )。
选项:
A:fsck
B:sqoop
C:fastcopy
D:distcp
答案: 【sqoop】

15、多选题:
Notepad++功能有( )。
选项:
A:语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组
B:可以连接虚拟机,对虚拟机中的文件进行编辑。
C:编写计算机程序代码
D:制作一般的纯文字说明文件
答案: 【语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组;
可以连接虚拟机,对虚拟机中的文件进行编辑。;
编写计算机程序代码;
制作一般的纯文字说明文件】

16、多选题:
Hadoop主要包含( )三大功能组件。
选项:
A:YARN
B:Hadoop
C:MapReduce
D:HDFS
答案: 【YARN;
MapReduce;
HDFS】

17、多选题:
Hadoop具有( )等优势。
选项:
A:高容错性
B:高效性
C:高可靠性
D:高扩展性
答案: 【高容错性;
高效性;
高可靠性;
高扩展性】

18、多选题:
下面说法正确的是( )。
选项:
A:JDK包含JRE和JVM
B:JDK是java语言的开发环境
C:java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。
D:JRE是java运行运行时类库
答案: 【JDK包含JRE和JVM;
JDK是java语言的开发环境;
java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。;
JRE是java运行运行时类库】

19、多选题:
在分布式文件系统HDFS当中提供了两种操作命令,是( )。
选项:
A:hadoop fs
B:hdfs fs
C:Hadoop dfs
D:hdfs dfs
答案: 【hadoop fs;
hdfs dfs】

20、多选题:
Hive是基于Hadoop技术的数据仓库工具,用来对数据进行( )
选项:
A:加载
B:转化
C:分析
D:提取
答案: 【加载;
转化;
提取】

21、多选题:
启动Hive服务之前需要启动的两个服务是( )。
选项:
A:hive–service metastore
B:hive–service hiveserver
C:hive–server metastore
D:hive–service hiveserver2
答案: 【hive–server metastore;
hive–service hiveserver2】

22、多选题:
Hive的复杂数据类型有( )。
选项:
A:STRUCT
B:MAP
C:Char
D:ARRAY
答案: 【STRUCT;
MAP;
ARRAY】

第三章 单元测试

1、多选题:
安装zookeeper成功的标志是,把3台虚拟机中的zookeeper全部启动,启动命令是zkServer.shstart,然后查看3台虚拟机中的zookeeper的状态,命令是zkServer.shstatus,如果安装正确,此时我们应该分别看到1个、多个( )。
选项:
A:leader
B:zookeeper
C:zkServer
D:follower
答案: 【】

2、多选题:
Kafka是一种高吞吐量的分布式发布订阅消息系统,是apache基金会开源的消息队列,该框架由( )编写而成。
选项:
A:Scala
B:Java
C:Python
D:C++
答案: 【】

3、判断题:
业务字段指的是每个移动端固定的、共有的字段;公共字段代表的是用户在app中执行过的所有操作。( )
选项:
A:错
B:对
答案: 【】

4、判断题:
在Flume过程中,Flume对接本地磁盘文件,通过tailDir类型实时监控当前数据文件中数据内容的变化。( )
选项:
A:错
B:对
答案: 【】

5、判断题:
ETL 拦截器主要用于过滤时间戳不合法和 Json 数据不完整的日志。( )
选项:
A:对
B:错
答案: 【】

6、判断题:
Flume分流标记拦截器主要是用于区分启动日志和事件日志。( )
选项:
A:对
B:错
答案: 【】

7、单选题:
以下关于flume的说法正确的是____。 ( )
选项:
A:Channel是Flume数据传输的基本单元
B:Source是Flume数据传输的基本单元
C:Event是Flume数据传输的基本单元
D:Sink是Flume数据传输的基本单元
答案: 【】

8、单选题:
Flume通过内部的采集数据传输机制进行快速的数据传输,传输完之后会将数据就存储到____中。( )
选项:
A:Source
B:HDFS
C:Channel
D:Kafka
答案: 【】

9、单选题:
可以使用____命令,启动Kafka的一个消费者。( )。
选项:
A:kafka-console-producer.sh
B:kafka-server-start.sh
C:kafka-console-consumer.sh
D:kafka-topics.sh
答案: 【】

10、单选题:
在Flume消费的整体流程中,第一部分是别名配置,在别名配置的过程当中,配置了两个数据流用来处理( )。
选项:
A:Flume数据消费脚本
B:ETL和分流标记拦截器
C:启动日志数据和事件日志数据
D:Flume环境变量
答案: 【

11、多选题:
在Flume数据传输的过程中,当source将数据传递给channel时,数据会先后经过( )两个拦截器。
选项:
A:ETL 拦截器
B:时间戳拦截器
C:Flume分流标记拦截器
D:UUID拦截器
答案: 【】

12、多选题:
Flume的安装与部署可以分为下列哪些步骤?
选项:
A:启动Flume数据消费脚本
B:解压到指定目录,进行环境变量的配置
C:在Flume的配置文件中修改指定配置
D:将Flume安装包上传至Linux操作系统
答案: 【】

第四章 单元测试

1、判断题:
在数据仓库中,ODS层的作用是保持数据原貌,不做任何修改,起到备份数据的作用( )
选项:
A:对
B:错
答案: 【】

2、判断题:
在数据仓库中,DWD层的作用是对数据进行清洗( )
选项:
A:错
B:对
答案: 【】

3、判断题:
在ADS层中,通过在启动日志中统计不同设备ID出现的次数来分析用户活跃?( )
选项:
A:错
B:对
答案: 【】

4、判断题:
在ADS层中,按照设备ID对日活表分组,登录次数为1,且在一周前登录的这种分析方式,分析沉默用户?( )
选项:
A:错
B:对
答案: 【】

5、判断题:
DWS层统计各个主题对象的当天行为,服务于DWT层的主题宽表。DWS层的宽表字段,是站在不同维度的角度去看事实表,重点关注事实表的度量值,通过与之关联的事实表,获得不同的事实表的度量值( )
选项:
A:错
B:对
答案: 【】

6、单选题:
在数据仓库项目中,我们在DWD层使用( )手段清洗数据
选项:
A:Kettle
B:SQL
C:Python
D:RDD
答案: 】

7、单选题:
在数据仓库中,用于数据清洗的是哪个层( )
选项:
A:DWT
B:DWD
C:DWS
D:ODS
答案: 【】

8、多选题:
数据仓库一般分为( )
选项:
A:DWD
B:ODS
C:DWT
D:ADS
E:DWS
答案: 【】

9、多选题:
在数据仓库DWD层中,需要清洗哪些数据( )
选项:
A:空值的去除
B:创建分区表
C:过滤核心字段
D:将用户行为宽表和业务表进行数据一致处理
答案: 【】

10、多选题:
在数据仓库中,ODS层做了什么业务( )
选项:
A:采用LZO压缩
B:保持数据原貌
C:创建分区表
D:空去除
答案: 【】

第五章 单元测试

1、单选题:
MySQL中,用于创建数据库的命令是( )。
选项:
A:create database 数据库名;
B:create table 数据库名;
C:drop database 数据库名;
D:use 数据库名;
答案: 【

2、单选题:
使用sqoop进行从Hive 到 MySQL数据库的数据迁移时,其命令为( )。
选项:
A:sqoop export
B:sqoop import
C:sqoop job
D:sqoop merge
答案: 【

3、单选题:
pyecharts中,柱状图类是( )。
选项:
A:Liquid
B:Line
C:Pie
D:Bar
答案: 【】

4、单选题:
pyecharts中,饼图类是( )。
选项:
A:Pie
B:Line
C:Liquid
D:Bar
答案: 】

5、单选题:
全局配置项可通过( )方法设置。
选项:
A:set_global_opts
B:reversal_axis
C:add_yaxis
D:set_series_opts
答案: 【

6、判断题:
使用pyecharts工具绘图时,可直接进行图表的绘制, 无需在程序中导入对应的图表类。( )
选项:
A:错
B:对
答案: 【】

7、判断题:
使用pyecharts工具绘图时,可以通过设置初始化配置项中的图表 ID,设置图表的唯一标识,以此来区分多个图表。( )
选项:
A:错
B:对
答案: 【】

8、判断题:
饼图常用于表示不同分类的占比情况,通过弧度大小来对比各种分类。( )
选项:
A:错
B:对
答案: 【】

9、多选题:
pyecharts中,全局配置项有( )。
选项:
A:图例配置项
B:提示框配置项
C:坐标轴配置项
D:标题配置项
答案: 【】

10、多选题:
pyecharts的标题配置项TitleOpts中,可进行的设置有( )。
选项:
A:副标题文本
B:标题位置
C:标题字体样式
D:主标题文本
答案: 【】

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者

评论0

请先

站点公告

开放大学课程作业代写,有需要扫码加微信

显示验证码

社交账号快速登录