智慧树知到答案R语言数据分析与挖掘最新答案

资源下载
下载价格15

第一章 单元测试

 

1、单选题:
下面哪些是R可以存储的数据对象?()。
选项:
A:数据框
B:列表框
C:其余选项都是
D:矩阵
答案: 【其余选项都是】

2、单选题:
关于attach( ) 函数说法正确的是?()。
选项:
A:把数据库加载到R的搜索空间
B:执行attach( ) 加载数据库后,可以直接访问该数据库中的一些对象
C:与detach( )的功能不同
D:其余选项均正确
答案: 【其余选项均正确】

3、单选题:
下面哪些方式可以查看到帮助文档?()。
选项:
A:?mean
B:help(mean)
C:?mean和help(mean)都不正确
D:?mean和help(mean)都正确
答案: 【?mean和help(mean)都正确】

4、单选题:
假设y<-c(1,2,3,-1,0,2), 那么关于语句 y[c(-2,-3)],说法正确的是___.()。
选项:
A:该语句选取y的第2和第3个元素
B:执行该语句不会改变y的长度
C:该语句存在语法错误
D:执行该语句将改变y的长度
答案: 【执行该语句不会改变y的长度】

5、单选题:
下面关于修改向量x<-c(1,2,-1,-3,-5) 的说法错误的是___.()。
选项:
A:执行语句x[1]<-0 后,x的值为 0,2,-1,-3,-5
B:执行语句x[c(1,5)]<-0 后,x的值为 0,2,-1,-3,0
C:执行语句x<-0 后,x的值为 0
D:执行语句x<-0 后,x的值为 0,0,0,0,0
答案: 【执行语句x<-0 后,x的值为 0,0,0,0,0】

第二章 单元测试

1、单选题:
若从正态分布总体中抽样得到一组样本,样本的值为 1, -1, 2, 3, 4, 5, 1, 2, 4, 3,那么样本的中位数为?( )。
选项:
A:3
B:2
C:2.5
D:4
答案: 【2.5】

2、单选题:
若从正态分布总体中抽样得到一组样本,样本的值为7, 7, 5, 2, 5, 4, 7, 9, 4, 8,那么样本的众数为?( )。
选项:
A:8
B:7
C:4
D:5
答案: 【7】

3、单选题:
最大值与最小值之间的差值称为?( )。
选项:
A:方差
B:极差
C:四分位差
D:范围
答案: 【极差】

4、单选题:
关于变异系数的说法正确的是?( )。
选项:
A:变异系数能够反映数据的离散程度
B:可以用样本的变异系数来比较多个样本的离散程度
C:其余选项都正确
D:变异系数越大,数据越分散
答案: 【其余选项都正确】

5、多选题:
若从正态分布总体中抽样得到一组样本,样本的值为 1, -1, 2, 3, 4, 5, 1, 2, 4, 3,4, 4, 那么下面哪些说法是正确的?.( )。
选项:
A:该样本只有一个众数
B:该样本的极差为6
C:该样本的标准差为3.16(只保留两位小数)
D:若要计算该样本的中位数,需要先对其进行排序
答案: 【该样本只有一个众数;
该样本的极差为6;
若要计算该样本的中位数,需要先对其进行排序】

第三章 单元测试

1、多选题:
分类变量用下面哪些图形来描述较为合适?( )。
选项:
A:饼图
B:箱线图
C:直方图
D:条形图
答案: 【】

2、多选题:
分类变量用哪些统计量来描述较为合适?( )。
选项:
A:极差
B:比率
C:频数
D:比例
答案: 】

3、多选题:
下面哪些图形用来描述数值变量的分布情况更为恰当?( )。
选项:
A:概率密度曲线
B:折线图
C:直方图
D:箱线图
答案: 【】

4、多选题:
下面哪些说法是正确的?( )。
选项:
A:可以用点图展示数值变量的分布形状
B:点图不可以用来展示数值变量的分布形状
C:在对数值变量离散化处理的情况下,可以使用条形图展示数值变量的分布形状
D:在不对数值变量进行任何处理的情况下,使用条形图展示数值变量的分布形状是恰当的
答案: 【】

5、多选题:
下面关于table( )函数说法正确的是?( )。
选项:
A:table( )函数能够用来制作一维列联表
B:table( )函数本质是实现分类变量的频数统计
C:table( )函数不能用来制作三维及以上的列联表
D:table( )函数可以用来制作交叉表
答案: 【】

6、多选题:
下面哪些图形用来描述分类变量的分布情况更为恰当?( )。
选项:
A:扇形图
B:柱状图
C:散点图
D:饼图
答案: 【】

7、单选题:
下面哪些图形用来描述分类变量与分类变量的关系更为恰当?( )。
选项:
A:箱线图
B:散点图
C:重叠直方图
D:并排柱状图
答案: 【】

8、单选题:
下面哪些图形用来描述分类变量与数值变量的关系更为恰当?( )。
选项:
A:重叠扇形图
B:散点图
C:箱线图
D:并排柱状图
答案: 【】

9、单选题:
下面哪些图形用来描述数值变量与数值变量的关系更为恰当?( )。
选项:
A:箱线图
B:并排柱状图
C:重叠扇形图
D:散点图
答案: 【

10、单选题:
下面哪些图形用来描述三个数值变量之间的关系更为恰当?( )。
选项:
A:箱线图
B:柱状图
C:气泡图
D:直方图
答案: 【】

第四章 单元测试

1、判断题:
合并连接是把两个表格组合在一起的数据操作方式.( )。
选项:
A:错
B:对
答案: 【】

2、判断题:
主键是数据表中观测样本的唯一标识.( )。
选项:
A:对
B:错
答案: 【】

3、判断题:
外键是另外一个数据表中观测样本的唯一标识.( )。
选项:
A:对
B:错
答案: 【】

4、判断题:
内连接是一种最简单的连接,内连接匹配两个数据表中键值相等的观测样本.( )。
选项:
A:对
B:错
答案: 【】

5、判断题:
外连接包括:内连接、左连接、右连接、全连接.( )。
选项:
A:错
B:对
答案: 【】

第五章 单元测试

1、判断题:
当两事件A和B互斥时,P(A∪B)有可能大于P(A)+P(B).( )。
选项:
A:对
B:错
答案: 【】

2、判断题:
设某地有甲乙两种报纸,该地成年人中有30%读甲报纸,15%读乙报纸,10%两种报纸都读,则成年人中有5%至少读一种报纸.( )。
选项:
A:错
B:对
答案: 【】

3、判断题:
设有1000件产品,其中850件是正品,150件是次品,从中依次抽取2件,2件都是次品的概率是0.025.( )。
选项:
A:错
B:对
答案: 【】

4、判断题:
随机变量可分为连续型随机变量和离散型随机变量.( )。
选项:
A:对
B:错
答案: 【】

5、判断题:
设X~N(0,1),则P(X<1.5)<0.9.( )。
选项:
A:错
B:对
答案: 【】

第六章 单元测试

1、判断题:
设从一个均值μ=10、标准差σ=0.6的总体中随机选取容量为n=36的样本。假定总体不是很偏,则样本均值在总体均值附近0.1范围内的近似概率大于0.7.( )。
选项:
A:错
B:对
答案: 【】

2、判断题:
设X~N(16,4),则10X~N(160,40).( )。
选项:
A:错
B:对
答案: 【】

3、判断题:
假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025~0.070之间的概率大于20%.( )。
选项:
A:错
B:对
答案: 【】

4、判断题:
卡方分布和t分布都是由正态分布导出的.( )。
选项:
A:对
B:错
答案: 【】

5、判断题:
某汽车电瓶商声称其生产的电瓶具有均值为60个月,标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否准确,为此随机抽取了50个该厂生产的电瓶进行寿命实验。假设厂商声称是正确的,则50个电瓶的平均寿命的抽样分布为N(60,6).( )。
选项:
A:对
B:错
答案: 【】

第七章 单元测试

1、单选题:
关于置信区间的构造,正确的是.( )。
选项:
A:置信区间的宽度不会受到样本量的影响
B:置信区间的宽度会受到总体方差或样本方差的影响
C:置信区间的宽度不会受到置信水平的影响
D:置信区间的宽度会受到样本均值的影响
答案: 【】

2、单选题:
关于两个正态总体方差之比的置信区间,正确的是.( )。
选项:
A:置信区间不可能包含0
B:置信区间的形式为:点估计标准误
C:置信区间有可能会包含0
D:置信区间的宽度不会受到样本量的影响
答案: 【】

3、单选题:
在构造总体均值的置信区间的过程中,首先需要确定分位数,关于分位数确定正确的是.( )。
选项:
A:分位数同时由样本量和总体方差是否已知决定
B:分位数只由总体方差是否已知决定
C:分位数不由样本量和总体方差是否已知决定
D:分位数只由样本量决定
答案: 【】

4、单选题:
关于两个总体均值之差的置信区间的形式说法正确的是.( )。
选项:
A:两个总体均值之差的点估计±分位数×标准误
B:两个总体均值之差的点估计±分位数×标准差
C:两个总体均值之差的点估计±标准误
D:两个总体均值之差的点估计±标准差
答案: 【】

5、单选题:
关于配对的两个总体均值之差的置信区间的说法正确的是.( )。
选项:
A:要先对配对样本做差值,得到差值序列
B:要先求各个样本的均值、标准差等统计量
C:要对配对样本标准化,得到标准化序列
D:要先对配对样本求和,得到求和序列
答案: 【】

6、判断题:
矩估计和似然估计都可用来估计总体的未知参数.( )。
选项:
A:错
B:对
答案: 【】

7、判断题:
无论样本量大小,样本比例的区间估计都是相同的.( )。
选项:
A:对
B:错
答案: 【】

8、判断题:
假设X是来自正态总体的一个样本,在已知和未知的情况下,的置信区间估计的结果都是相同的.( )。
选项:
A:错
B:对
答案: 【】

9、判断题:
假设X和Y是分别来自正态总体的两个样本,总体均值都已知且相等,那么构成总体方差之比的置信区间的F分位数的第一自由度和第二自由度总是相等的.( )。
选项:
A:错
B:对
答案: 【】

10、判断题:
标准误就是样本的标准差.( )。
选项:
A:对
B:错
答案: 【】

第八章 单元测试

1、单选题:
下面关于假设检验两类错误正确的是. ( )。
选项:
A:第一类错误是为真,拒绝

B:第一类错误是为假,接受

C:第一类错误是为真,拒绝

D:第一类错误是为假,接受

答案: 【

2、单选题:
下面关于假设检验两类错误正确的是.( )。
选项:
A:降低第一类错误的概率,会增加犯第二类错误的概率
B:降低第一类错误的概率,不会增加犯第二类错误的概率
C:降低两类错误的概率的方法是降低样本量
D:显著水平是第二类错误犯错的概率
答案: 【】

3、单选题:
对于一个总体均值的假设检验,应该选用哪个统计量来检验(已知样本量大于50). ( )。
选项:
A:T统计量
B:统计量

C:F统计量
D:Z统计量
答案: 【

4、单选题:
假设X是来自正态总体N(μ,100)的一个样本,样本均值为4,样本量为25,对于假设检验:μ=5的检验统计量的值为?( )。
选项:
A:-0.5
B:0.5
C:无法计算
D:-0.05
答案: 【】

5、单选题:
假设X是来自正态总体N(μ,100)的一个样本,样本均值为4,样本量为25,对于置信水平为0.05的假设检验:μ=5说法正确的是?已知(24)=-1.71。( )。
选项:
A:该检验是单侧检验
B:拒绝原假设
C:接受原假设
D:该检验应该构造Z统计量来检验
答案: 【

6、单选题:
假设X是来自正态总体N(μ,)的一个样本,样本均值为16,样本量为1000,对于置信水平为0.05的假设检验:μ=16说法正确的是?( )。
选项:
A:该检验应该构造Z统计量来检验
B:该检验应该构造F统计量来检验
C:该检验是单侧检验
D:该检验应该构造t统计量来检验
答案: 【

7、单选题:
假设X是来自正态总体N(μ,)的一个样本,样本方差为1,样本量为1000,对于置信水平为0.05的假设检验:1说法正确的是?( )。
选项:
A:该检验是双侧检验
B:该检验的统计量可能会小于0
C:该检验应该构造统计量来检验

D:该检验应该构造F统计量来检验
答案: 【

8、单选题:
假设X和Y是分别来自正态总体的样本,样本量分别为1000和800,假设总体方差相等,对于置信水平为0.05的假设检验 : 说法正确的是?( )。
选项:
A:该检验应该构造t统计量来检验
B:该检验是双侧检验
C:该检验的统计量不可能会小于0
D:该检验应该构造Z统计量来检验
答案: 【】

9、单选题:
假设X和Y是分别来自正态总体的样本,样本量分别为25和30,对于置信水平为0.05的假设检验 : 说法正确的是?( )。
选项:
A:检验前,要先检验方差是否相等
B:无需要做其他操作,可以直接用t检验来检验
C:无需要做其他操作,可以直接用Z检验来检验
D:检验前,不需要检验方差是否相等
答案: 【

10、单选题:
假设X和Y是分别来自正态总体的样本,样本量分别为未知,对于置信水平为0.05的假设检验 : 说法正确的是?( )。
选项:
A:用统计量检验,自由度为

B:用统计量检验,自由度为

C:用F统计量检验,自由度分别为

D:用F统计量检验,自由度分别为

答案: 【

第九章 单元测试

1、判断题:
拟合优度检验用来判断各类别的观察频数与某一期望频数或理论频数是否一致.( )。
选项:
A:对
B:错
答案: 【】

2、判断题:
在应用独立性检验时,要求样本量应足够大,特别是每个单元格的期望频数不能太小,否则会得出错误的结论.( )。
选项:
A:对
B:错
答案: 【】

3、判断题:
拟合优度检验可以检验分类变量是否服从某种分布律分布.( )。
选项:
A:对
B:错
答案: 【】

4、单选题:
拟合优度检验又称为___.( )。
选项:
A:一致性检验
B:分布检验
C:均值检验
D:方差齐性检验
答案: 【

5、单选题:
独立性检验 (test of independence)可以用来检验___.( )。
选项:
A:一个数值变量与一个类别变量是否独立
B:都不正确
C:两个数值变量是否独立
D:两个类别变量是否独立
答案: 【

第十章 单元测试

1、单选题:
方差分析对数据分布的假设前提___.( )。
选项:
A:总体服从均匀分布
B:总体服从指数分布
C:总体服从泊松分布
D:总体服从正态分布
答案: 【

2、单选题:
方差分析对各水平方差的假设条件应满足___.( )。
选项:
A:方差可以相等,也可以不等
B:方差相等
C:都不对
D:方差不等
答案: 【

3、单选题:
设因素有k个水平,若每个水平的均值用 表示,那么方差分析的原假设是___.( )。
选项:
A:H0:各水平的均值相等
B:H0:各水平的均值相等和H0:自变量与因变量无关都不可以
C:H0:自变量与因变量无关
D:H0:各水平的均值相等和H0:自变量与因变量无关都可以
答案:

4、单选题:
检验因素各水平是否服从正态分布的方法有__.( )。
选项:
A:Q-Q或P-P图
B:Shapiro-Wilk检验
C:都可以
D:K-S检验
答案:

5、单选题:
单因素方差分析的效应量反应___.( )。
选项:
A:处理效应平方和SSA与总平方和SST的比例
B:总平方和SST与处理效应平方和的SSA比例
C:总平方和SST与误差平方和SSE的比例
D:误差平方和SSE与总平方和SST的比例
答案: 【】

6、判断题:
无论总体是否服从正态分布,都可以使用非参数方差分析方法来实现方差分析.( )。
选项:
A:错
B:对
答案: 【】

7、判断题:
判断总体是否服从正态分布的方法除了图形法外,还可以使用检验的方法.( )。
选项:
A:错
B:对
答案: 【】

8、判断题:
在方差分析中,效应量是指随机误差与总体误差之比. 其值越大,拟合效果越差.( )。
选项:
A:错
B:对
答案: 【】

9、判断题:
对于方差分析而言,要比较任意两个水平的均值是否相等,可以使用LSD多重比较或t检验.( )。
选项:
A:对
B:错
答案: 【】

10、判断题:
方差分析是分析数值变量与分类变量之间关系的统计方法,可以在一个模型中包括任意多的分类变量.( )。
选项:
A:错
B:对
答案: 】

第十一章 单元测试

1、单选题:
将因变量的值扩大10,将自变量的值同时扩大100,则___.( )。
选项:
A:OLS估计量的方差不变
B:回归的不变

C:截距的估计值不变
D:斜率的估计值不变
答案: 【

2、单选题:
估计量具有抽样分布的原因是___.( )。
选项:
A:不同的人可能有不同的估计结果
B:在给定X的情况下,误差项的不同实现会导致Y的取值有所不同
C:经济数据是不精确的
D:在现实数据中你往往会重复得到多组样本
答案: 【】

3、单选题:
在其他因素相同的条件下,如果___,斜率估计量标准差较小.( )。
选项:
A:解释变量X有更多变差
B:样本容量更小
C:误差项的方差更大
D:截距估计值更小
答案: 【

4、单选题:
误差项的异方差会影响OLS估计量的___.( )。
选项:
A:无偏性
B:线性性
C:一致性
D:最优性
答案: 【

5、单选题:
如果一个假设在5%的显著水平下不能被拒绝,则它___.( )。
选项:
A:在1%的显著水平下一定不会被拒绝
B:在10%的显著水平下一定被拒绝
C:在10%的显著水平下一定不会被拒绝
D:在1%的显著水平下可能被拒绝
答案: 【

6、多选题:
一元线性回归的基本假设有___.( )。
选项:
A:随机误差的期望为0

B:任意两个样本的随机误差相互独立

C:随机变量X与Y之间存在线性关系
D:随机误差的方差相等

答案: 【

7、单选题:
是一元线性回归方程的回归系数的最小二乘估计,那么下面说法正确的是___.( )。
选项:
A:它的方差为:

B:的期望:

C:它的估计值为:

答案: 【

8、多选题:
关于一元线性回归模型的残差项,说法正确的是___.( )。
选项:
A:,即任意两个残差之间的协方差为0,注意

B:

C:

D:

答案: 【

9、多选题:
是一元线性回归方程的回归系数的最小二乘估计,那么下面说法正确的是___.( )。
选项:
A:表示,X每变动一个单位,Y变动个单位

B:是截距项,它表示Y的平均水平

C:表示,Y每变动一个单位,X变动个单位

D:是截距项,它表示X的平均水平

答案: 【

10、多选题:
是一元线性回归方程的回归系数的最小二乘估计,若X标准化和Y标准化后的向量为,且一元线性回归方程为,那么下面说法正确的是___.( )。
选项:
A:

B:

C:

D:回归方程穿过原点(0,0)

答案: 【

11、判断题:
回归分析前,要先通过相关系数或散点图观察变量之间是否存在线性关系.( )。
选项:
A:错
B:对
答案: 【】

12、判断题:
散点图也可以用来观察样本中是否存在离群点.( )。
选项:
A:错
B:对
答案: 【】

13、判断题:
判别一元线性回归是否显著不仅可以使用t检验,也可以使用F检验.( )。
选项:
A:错
B:对
答案: 【】

14、判断题:
在一元线性回归中,如果因变量与自变量存在明显的正相关关系,那么其回归系数将显著大于0( )。
选项:
A:对
B:错
答案: 【】

15、判断题:
用于建立回归模型的样本是否独立不会影响OLS对回归系数的估计结果( )。
选项:
A:错
B:对
答案: 【】

第十二章 单元测试

1、单选题:
虚拟变量陷阱(dummy variable trap)是以下哪个情形?( )。
选项:
A:不完全多重共线性
B:完全多重共线性
C:仅仅是理论所关心的
D:实际操作中不会发生的
答案: 【】

2、单选题:
关于不完全共线性,如下哪个说法是正确的?( )。
选项:
A:两个或者多个自变量是高度相关的
B:无法计算最小二乘估计量
C:即使样本容量n>100,最小二乘估计量也是有偏的
D:回归误差项是高度相关的
答案: 【】

3、单选题:
如果回归模型中遗漏了能够影响因变量的变量,会产生的后果是___.( )。
选项:
A:虽然无法度量出遗漏变量的作用,但是对模型中现存的变量进行估计不受影响
B:如果遗漏的变量和现存的变量相关,会使得当前的最小二乘估计量有偏
C:一定会使得当前模型的最小二乘估计量有偏
D:既然其他变量没有包括进来,所以当前模型的估计是正确的
答案: 【】

4、单选题:
如果模型有遗漏变量偏差,会使得哪一个最小二乘的假设条件不满足?.( )。
选项:
A:

B:模型不存在完全共线性
C:模型是同方差的
D:是独立同分布的

答案: 【

5、单选题:
考虑有两个自变量X1 和 X2的回归模型,这两个自变量都是Y的影响因素。如果先使用X1 对Y做回归,估计得到的回归系数很小,但是同时使用X1 ,X2 做回归,发现X1 前面的回归系数变大了很多。这意味的前面的一元线性回归存在___.( )。
选项:
A:完全共线性
B:异方差
C:虚拟变量陷阱
D:遗漏变量偏差
答案: 【

6、单选题:
下述模型使用个人的收入和教育水平来解释个人的储蓄:. 其中变量Edu是一个二元变量,如果是受过高等教育的个体,Edu=1,否则Edu=0。请问该研究中,基准组是___.( )。
选项:
A:受过高等教育的群体
B:低收入群体
C:高收入群体
D:未受过高等教育的群体
答案: 【

7、单选题:
下述模型使用个人的收入和教育水平来解释个人的储蓄:. 其中变量Edu是一个二元变量,如果是受过高等教育的个体,Edu=1,否则Edu=0。如果,我们把该系数解释为___.( )。
选项:
A:收入水平较低的群体储蓄更高
B:收入水平较高的群体储蓄更高
C:给定收入水平,受过高等教育的群体的平均储蓄比没受过高等教育的群体高个单位

D:给定收入水平,没受过高等教育的群体的平均储蓄比受过高等教育的群体高个单位

答案: 【

8、判断题:
多重共线性会导致回归系数不显著、回归系数正负号颠倒等与常识违背的现象。 ( )。
选项:
A:对
B:错
答案: 【】

9、判断题:
在多元回归分析中,回归系数可以直接用来评价自变量的重要性。 ( )。
选项:
A:错
B:对
答案: 【】

10、判断题:
如果根据来选择变量并建立多元线性回归模型,那么我们可能会得到一个复杂的模型。 ( )。
选项:
A:错
B:对
答案: 【】

第十三章 单元测试

1、单选题:
Logistic回归与多重线性回归比较( )
选项:
A:Logistic回归的自变量必须为二分类变量
B:Logistic回归的因变量为二分类变量
C:多重线性回归的因变量为二分类变量
D:多重线性回归的自变量必须为二分类变量
答案: 【】

2、多选题:
Logistic回归适用于因变量为( )
选项:
A:连续型定量变量
B:多分类有序变量
C:多分类无序变量
D:二分类变量
答案: 【】

3、单选题:
Logistic回归可用于( )
选项:
A:校正混杂因素
B:影响因素分析
C:预测
D:均可
答案: 【】

4、判断题:
Logistic回归模型的参数估计为加权最小二乘估计。( )
选项:
A:对
B:错
答案: 【】

5、判断题:
当因变量的取值在[0,1]变化,而自变量的取值范围超出了[0,1],甚至在整个实数轴上取值时,可以采用Logistic回归模型解决这个问题。( )
选项:
A:错
B:对
答案: 【】

6、单选题:
筛选危险因素常用的方法有( )
选项:
A:逐步法
B:都可
C:后退法
D:前进法
答案: 【】

7、单选题:
Logistic回归中自变量若为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛选时可用( )
选项:
A:软件自动筛选的逐步法
B:软件自动筛选的前进法
C:应将几个哑变量作为一个因素,整体进入回归方程
D:软件自动筛选的后退法
答案: 【】

8、判断题:
为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中学校,各选择初一年级一个班的全部学生进行调查,针对上述问题,可采用Logistic回归筛选影响因素。( )
选项:
A:对
B:错
答案: 【】

9、单选题:
Logistic回归中,若因变量交换赋值,则关于两个Logistic回归方程的下列解释中错误的是( )
选项:
A:优势比互为倒数
B:参数估计符号相同
C:参数估计绝对值相等
D:模型拟合检验与回归系数的假设检验结果相同
答案: 【】

第十四章 单元测试

1、单选题:
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )
选项:
A:关联规则发现
B:聚类
C:自然语言处理
D:分类
答案: 【

2、多选题:
Web内容挖掘实现技术( )
选项:
A:文本总结
B:文本聚类
C:关联规则
D:文本分类
答案: 【

3、单选题:
以下哪些算法是分类算法 ( )
选项:
A:EM
B:C4.5
C:K-Mean
D:DBSCAN
答案: 【】

4、单选题:
以下哪些算法是基于规则的分类器 ( )
选项:
A:KNN
B:ANN
C:Naive Bayes
D:C4.5
答案: 【】

5、判断题:
对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。( )
选项:
A:错
B:对
答案:

6、判断题:
分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法。( )
选项:
A:对
B:错
答案: 【】

7、单选题:
以下说法正确的是 :( )
选项:
A:我们不可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
B:一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的
C:如果增加模型复杂度, 那么模型的测试错误率总是会降低
D:如果增加模型复杂度, 那么模型的训练错误率总是会降低
答案: 【】

8、单选题:
对于神经网络的说法, 下面正确的是 :( )
选项:
A:增加神经网络层数, 总是能减小训练数据集的分类错误率
B:减少神经网络层数, 总是能减小测试数据集的分类错误率
C:都不对
D:增加神经网络层数, 可能会增加测试数据集的分类错误率
答案: 【

9、单选题:
对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,二是都设成0,下面哪个叙述是正确的?( )
选项:
A:神经网络不会开始训练,因为没有梯度改变
B:其他选项都不对
C:没啥问题,神经网络会正常开始训练
D:神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西
答案: 【

10、单选题:
如下哪些不是最近邻分类器的特点。 ( )
选项:
A:它使用具体的训练实例进行预测,不必维护源自数据的模型
B:分类一个测试样例开销很大
C:最近邻分类器基于全局信息进行预测
D:可以生产任意形状的决策边界
答案: 【

11、单选题:
以下两种描述分别对应哪两种对分类算法的评价标准?() (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。
选项:
A:Recall, ROC
B:Recall, ROC
C:Precision, Recall
D:Recall, Precision
答案: 【

第十五章 单元测试

1、多选题:
在有监督学习中, 我们如何使用聚类方法? ( )
选项:
A:我们可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
B:我们可以先创建聚类类别, 然后在每个类别上用监督学习分别进行学习
C:在进行监督学习之前, 我们不能新建聚类类别
D:我们不可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
答案: 【】

2、单选题:
以下描述错误的是?( )
选项:
A:聚类分析可以看做是一种非监督的分类
B:在决策树中,随着树中节点变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题
C:在聚类分析中,簇内的相似性越大,簇间的差别越大,聚类的效果越好
D:决策树是一种较好的分类算法
答案: 【】

3、单选题:
以下属于聚类算法的是( )。
选项:
A:K-Means
B:KNN
C:Apriori
D:决策树
答案: 【

4、多选题:
这些数据特性都是对聚类分析具有很强影响的。( )
选项:
A:稀疏性
B:高维性
C:规模
D:噪声和离群点
答案: 【】

5、多选题:
数据挖掘的挖掘方法包括:( )
选项:
A:回归分析
B:神经网络
C:聚类分析
D:决策树算法
答案: 【】

6、判断题:
在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。( )
选项:
A:对
B:错
答案: 【】

7、判断题:
聚类分析可以看作是一种非监督的分类。( )
选项:
A:对
B:错
答案: 【】

8、判断题:
K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。( )
选项:
A:对
B:错
答案: 【】

9、判断题:
如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。( )
选项:
A:对
B:错
答案: 【】

10、判断题:
聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。 ( )
选项:
A:对
B:错
答案: 【】

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者

评论0

请先

站点公告

本站已经将所有内容都转移到下方微信小程序里,如果有需要答案可以扫码下方微信小程序寻找

显示验证码

社交账号快速登录