智慧树知到答案中文信息处理与挖掘最新答案

资源下载
下载价格15

第一章 单元测试

1、多选题:
本课程将详细介绍的自然语言处理应用有哪些( )。
选项:
A:自动摘要
B:机器翻译
C:自动问答
D:情感分析
答案: 【自动摘要;
机器翻译;
自动问答;
情感分析】

2、单选题:
下列那个概念与自然语言处理无关。( )
选项:
A:Natural Language Understanding
B:Computer Vision
C:Computational Linguistics
D:Natural Language Processing
答案: 【Computer Vision】

3、判断题:
黏着型语言比较有代表性的语言是日语。( )
选项:
A:错
B:对
答案: 【对】

4、单选题:
自然语言中最小的有意义的构成单位是( )。
选项:
A:字
B:词
C:篇章
D:句子
答案: 【词】

5、单选题:
中文信息处理的第一步是( )。
选项:
A:词性标注
B:分词
C:确定上下文关系
D:构建句法树
答案: 【分词】

6、判断题:
如果打开校正功能,对于一些典型的语法错误、拼写错误以及用词错误就可以自动检测出来。( )
选项:
A:错
B:对
答案: 【对】

7、多选题:
就分词来讲,主要有三类分词方法( )。
选项:
A:基于规则的分词方法
B:基于统计的分词方法
C:基于语法的分词方法
D:基于词典的分词方法
答案: 【基于规则的分词方法;
基于统计的分词方法;
基于词典的分词方法】

8、多选题:
基于词典的分词方法从匹配的方法来讲,一般使用最大匹配法,而最匹配法又包括( )。
选项:
A:三向最大匹配算法
B:逆向最大匹配算法
C:正向最大匹配算法
D:双向最大匹配算法
答案: 【逆向最大匹配算法;
正向最大匹配算法;
双向最大匹配算法】

9、多选题:
词性标注的主要方法主要有( )。
选项:
A:基于规则的词性标注方法
B:基于字典的词性标注方法
C:统计与规则相结合的词性标注方法
D:基于统计的词性标注方法
答案: 【基于规则的词性标注方法;
统计与规则相结合的词性标注方法;
基于统计的词性标注方法】

10、多选题:
命名实体识别事实上就是识别出以下三类命名实体。( )
选项:
A:别名
B:地名
C:组织机构名
D:人名
答案: 【地名;
组织机构名;
人名】

第二章 单元测试

1、判断题:
概率论作为统计语言模型的数学基础,应用到自然语言处理领域,是由于:统计语言处理技术已经成为自然语言处理的主流,而在统计语言处理的步骤中,收集自然语言词汇(或者其他语言单位)的分布情况、根据这些分布情况进行统计推导都需要用到概率论。( )
选项:
A:对
B:错
答案: 【对】

2、多选题:
设E为随机试验,Ω是它的样本空间,对于E的每一个事件A赋予一个实数,记为P ( A ),如果集合函数P ( ⋅ )满足下列哪些条件,则实数P ( A )为事件A的概率。( )
选项:
A:非负性
B:规范性
C:唯一性
D:可列可加性
答案: 【非负性;
规范性;
可列可加性】

3、单选题:
设A、B是两个事件,且P(B)>0,则称P(A|B)为在已知事件B发生的条件下,事件A发生的( )。
选项:
A:概率
B:条件频率
C:似然估计
D:条件概率
答案: 【条件概率】

4、单选题:
某一事件B的发生有各种可能的原因n个,B发生的概率是各原因引起B发生概率的总和,也就是( )。
选项:
A:条件概率
B:全概率公式
C:先验概率
D:后验概率
答案: 【全概率公式】

5、判断题:
贝叶斯公式于1763年由贝叶斯(Bayes)给出,它是在观察到事件B已发生的条件下,寻找导致B发生的每个原因的概率。( )
选项:
A:对
B:错
答案: 【对】

6、单选题:
在自然语言处理中,以句子为处理单位时一般假设句子独立于它前面的其它语句,句子的概率分布近似地符合以下哪项( )。
选项:
A:贝叶斯法则
B:期望
C:最大似然估计
D:二项式分布
答案: 【二项式分布】

7、多选题:
在概率论和统计学中,一个离散性随机变量的期望值,是试验中每次可能结果的概率乘以其结果的总和,也被称为( )。
选项:
A:方差
B:期望
C:均值
D:数学期望
答案: 【期望;
均值;
数学期望】

8、判断题:
在概率论和统计学中,一个随机变量的方差,描述的是它的离散程度,也就是该变量离其期望值的距离.( )
选项:
A:错
B:对
答案: 【对】

9、单选题:
以下哪项表示信源 X 每发一个符号且不论发什么符号所提供的平均信息量。( )
选项:
A:熵
B:条件熵
C:联合熵
D:信息
答案: 【熵】

10、单选题:
哪一项常被用以衡量两个随机分布的差距。( )
选项:
A:条件熵
B:相对熵
C:熵率
D:联合熵
答案: 【相对熵】

第三章 单元测试

1、单选题:
以下哪一个属于序列标注问题( )。
选项:
A:命名实体识别
B:指代消解
C:英文词的形态还原
D:词频统计
答案: 【】

2、单选题:
在词法分析里,需要处理的最小单位是( )。
选项:
A:句子
B:词
C:短语
D:字
答案: 【】

3、单选题:
下列( )形式是最主要的信息载体( )。
选项:
A:视频
B:音频
C:图像
D:文字
答案: 【】

4、多选题:
词性标注的主要方法包括( )。
选项:
A:基于语义的标注方法
B:基于规则的方法
C:基于统计的和基于规则的相结合的方法
D:基于统计的方法
答案: 【】

5、单选题:
设输入句子“我爱人工智能”,经过词性标注等得到“我/PN爱/VV人工智能/NR”,其中,PN、VV和NR的含义分别是代词、动词、专有名词;( )是命名实体。
选项:
A:“人工智能”
B:“爱”
C:“我”、“人工智能”
D:“我”
答案: 【

6、单选题:
自然语言处理(NLP)通过词、句子、篇章的分析,理解内容。处理一个中文句子(汉字序列)时,在其NLP基本任务中,( )负责将输入的句子转换为单词序列。
选项:
A:词法分析
B:句法分析
C:分词
D:词性标注
答案: 【】

7、多选题:
自然语言处理过程可以有多个层次,包括( )。
选项:
A:语法分析
B:句法分析
C:词法分析
D:语义分析
答案: 【】

8、判断题:
语言是人类交流思想、表达情感最自然的工具,是思维的载体,也是人类区别其他动物的本质特性。( )
选项:
A:对
B:错
答案: 【】

9、判断题:
孤立语就是被孤立的语言。( )
选项:
A:错
B:对
答案: 【】

10、判断题:
用“信息熵”来衡量自由度,用“点间互信息”衡量一个词汇内部的凝聚程度。( )
选项:
A:错
B:对
答案: 【】

第四章 单元测试

1、判断题:
句法分析主要包括两类,分别是短语结构分析和依存关系分析。( )
选项:
A:错
B:对
答案: 【】

2、判断题:
重写规则表示取代或扩展的规则,箭头左边代表一个或几个成分构成的序列,右边符号代表单一的结构成分。( )
选项:
A:对
B:错
答案: 【】

3、多选题:
一个完整的语法表示,应该包括以下哪些元素( )。
选项:
A:非终结符号集合
B:一个特殊的非终结符句子
C:终结符号集合
D:重写规则
答案: 【】

4、判断题:
形式语法是指面向机器处理的语法,它规定语言中允许出现的结构的形式化说明。( )
选项:
A:错
B:对
答案: 【】

5、判断题:
依存树和句法树都属于语法表示方法,二者最大的不同在于句法树上都是终结符结点,依存树上还有非终结符结点。( )
选项:
A:错
B:对
答案: 【

6、单选题:
在引入点规则后,以下属于非活性边的是( )。
选项:
A:NP-> r a n 。
B:NP-> r a n
C:NP-> r a 。n
D:NP-> r 。a n
答案: 【】

7、判断题:
线图分析算法解决了从输入词串开始,一步步形成线图,使得在一条边可以覆盖全部结点。( )
选项:
A:对
B:错
答案: 【】

8、多选题:
在线图句法分析中需要用到的数据结构是( )。
选项:
A:活动边集(ActiveArc)
B:进程表(Agenda)
C:链表(LinkedList)
D:线图(Chart)
答案: 【】

9、多选题:
上下文无关文法(PCFG)在满足以下什么条件下,计算分析树的概率可以使用所有规则概率的乘积( )。
选项:
A:上下文无关性
B:祖先无关
C:位置不变性
D:兄弟无关
答案: 【】

10、多选题:
下列属于依存句法分析算法的是( )。
选项:
A:生成式分析方法
B:决策式分析方法
C:非确定性分析方法
D:判别式分析方法
答案: 【】

第五章 单元测试

1、判断题:
篇章(discourse)又称为语篇或文本.( )
选项:
A:对
B:错
答案: 【】

2、多选题:
篇章结构可以是篇章内部关系的不同结构化表达形式,主要包括下列哪些结构。( )
选项:
A:指代结构
B:功能结构
C:修辞结构
D:话题结构
答案: 【】

3、判断题:
话题的完整性从形式和内容两方面分别体现为篇章的两大基本特性,即篇章连贯性和篇章衔接性.( )
选项:
A:错
B:对
答案: 【】

4、多选题:
篇章的哪几个基本特征更是有力地促进了自然语言处理研究的发展。( )
选项:
A:衔接性
B:信息性
C:意图性
D:连贯性
答案: 【】

5、单选题:
篇章的 ( )基本特征已被自然语言处理领域的研究者广为接受。
选项:
A:6个
B:4个
C:5个
D:7个
答案: 【】

6、判断题:
而通过分析篇章的信息性和意图性,则可以挖掘篇章的语义特征。( )
选项:
A:对
B:错
答案: 【】

7、多选题:
下列属于Hobbs 定义的 12 类关系的有( )。
选项:
A:背景
B:结果
C:详述
D:并列
答案: 【】

8、判断题:
1898 年马建忠的《马氏文通》出版为标志创建了汉语复句理论。( )
选项:
A:对
B:错
答案: 【】

9、单选题:
( )是最早研究篇章衔接关系的理论体系。
选项:
A:修辞结构理论
B:汉语复句理论
C:浅层衔接理论
D:话题链
答案: 【】

10、单选题:
下图哪个例子能构成一个篇章
选项:
A:例2
B:例1
C:两者都能
D:两者都不能
答案: 【】

第六章 单元测试

1、单选题:
下列不属于基于情感词典的情感分析方法优点的是( )。
选项:
A:通用性强
B:简单易行
C:预测准确率高
D:有效反应文本结构特点,易于理解
答案: 【】

2、判断题:
词语级情感分析又称为方面级情感分析,是一种细粒度的情感分析,它包括方面的提取和方面的情感分析。( )
选项:
A:错
B:对
答案: 【】

3、多选题:
以下属于文本情感分析过程的是( )。
选项:
A:特征表示
B:特征选择
C:使用分类器进行情感分析
D:情感类别的输出
答案: 【】

4、判断题:
特征表示是指将文字表示的内容转换成计算机可以处理的数字化特征向量,常见的特征表示方法有one-hot、word2vec。( )
选项:
A:错
B:对
答案: 【】

5、判断题:
常见的特征选择方法包括{词频计数模型(N-gram)、词袋模型(TF-IDF)和深度学习方法等。( )
选项:
A:错
B:对
答案: 【】

6、多选题:
根据样本数据标签的有无或者多少,可以将机器学习算法主要分为( )
选项:
A:无监督方法
B:聚类方法
C:有监督方法
D:半监督方法
答案: 【】

7、判断题:
朴素贝叶斯是一种分类方法,可以在任何情况下使用此方法进行文本情感分析。( )
选项:
A:对
B:错
答案: 【】

8、多选题:
K近邻(KNN)算法是依据最邻近的几个样本的类别来决定待分类样本所属的类别,其中常用的距离公式包括( )
选项:
A:欧式距离
B:曼哈顿距离
C:切比雪夫距离
D:余弦距离
答案: 【】

9、判断题:
BERT使用的是Transformer编码器,由于Self-attention机制,所以模型上下层直接全部互相连接。( )
选项:
A:对
B:错
答案: 【】

10、判断题:
LSTM模型和RNN模型都是属于深度学习模型,都可用于情感分析任务中,但是LSTM 模型克服了梯度消失问题。( )
选项:
A:错
B:对
答案: 【】

第七章 单元测试

1、单选题:
不管是贤二机器僧,还是同学们所熟知的QQ小弟、微软小冰,在我们自然语言处理领域,都有一个共同的名字,那就是( )。
选项:
A:自动问答系统
B:机器翻译
C:问答
D:情感分析
答案: 【

2、判断题:
以直接而准确的方式回答用户自然语言提问的自动问答系统将构成下一代搜索引擎的基本形态。( )
选项:
A:错
B:对
答案: 【】

3、判断题:
问答系统的起源,可以追溯到1950年,A. M. Turning 提出的”图灵测试”。( )
选项:
A:错
B:对
答案: 【】

4、多选题:
根据问答系统处理的数据格式,将问答系统分为哪几个历史阶段( )。
选项:
A:基于自由文本的问答系统
B:基于机构化数据的问答系统
C:基于问题答案对的问答系统
D:基于知识图谱的问答系统
答案: 【】

5、多选题:
对应问答系统的处理流程,一般问答系统包括哪三个主要部分?( )。
选项:
A:信息核对
B:答案抽取
C:问题分析
D:信息检索
答案: 【】

6、多选题:
根据问答系统的发展、数据源、提问类型等,将问答系统分为哪几种?( )。
选项:
A:自然问答系统
B:面向知识图谱的问答系统
C:检索式问答系统
D:社区问答系统
答案: 【】

7、判断题:
衡量和分析问答系统得复杂性,可以从问题、数据、答案3个维度来评价,同时问答系统根据问题、数据、答案3个维度的不同而属于不同类别。( )
选项:
A:错
B:对
答案: 【】

8、多选题:
信息抽取的任务主要包括( )。
选项:
A:关系抽取
B:事件抽取
C:实体识别与抽取
D:实体消岐
答案: 【】

9、单选题:
区别于传统问答式检索系统仅能回答有限类型的问题,社区问答系统的特点是( )。
选项:
A:回答者不限定
B:问题类型不限定
C:问题的类型和答案的类型不限定
D:答案类型不限定
答案: 【】

10、单选题:
哪一个概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及。( )。
选项:
A:社区问答
B:大数据
C:知识图谱
D:知识图谱应用
答案: 【】

第八章 单元测试

1、多选题:
关于文本摘要说法正确的是( )
选项:
A:文本摘要必须保留原文中的重要信息。
B:文本摘要需尽可能简短精炼。
C:可以对多文档进行抽取文本摘要。
D:可以对单文档进行抽取文本摘要。
答案: 【】

2、多选题:
按照输出类型划分文本摘要主要分为哪几类( )
选项:
A:跨语言摘要
B:多文档摘要
C:抽取式摘要
D:生成式摘要
答案: 【】

3、多选题:
下面哪些是文本自动摘要经历的发展阶段( )
选项:
A:基于语言学的自动摘要
B:基于统计的自动摘要
C:基于神经网络的自动摘要
D:启发式自动摘要
答案: 【】

4、多选题:
与单文档摘要相比,多文档摘要有哪些特点( )
选项:
A:多文档摘要需注意减小句子之间的冗余度。
B:多文档摘要比单文档面临更多挑战。
C:多文档摘要要确定压缩比率 ,即从每个文档中抽取句子的比例。
D:从多个文档抽取出的句子要确定它们的顺序。
答案: 【】

5、多选题:
下面哪些项是影响句子重要性的因素( )
选项:
A:句子是否包括线索词
B:句子中词语的重要性
C:句子位置
D:句子的长度
答案: 【】

6、单选题:
关于生成式摘要常用的一个方法:基于深度学习之序列转换模型的方法说法错误的是( )
选项:
A:该方法使用的是编码器-解码器模型。
B:编码器会输出特征提取后的语义向量。
C:输入序列较长时,语义向量中先提取的信息并不会被后提取的信息稀释。
D:解码器通过语义向量和前面已经生成的摘要序列来预测当前时刻的单词。
答案: 【】

7、多选题:
下面关于ROUGE说法正确的是( )
选项:
A:ROUGE是一种基于召回率的相似性度量方法。
B:ROUGE要求由多个专家分别生成人工摘要,构成标准摘要集。
C:ROUGE是一种外部评价标准。
D:ROUGE既是评估自动文摘也是及机器翻译的一组指标。
答案: 【】

8、判断题:
按照输入类型划分,文本摘要分为抽取式摘要和生成式摘要。 ( )
选项:
A:对
B:错
答案: 【】

9、判断题:
多文档摘要不必关心多个文档中抽取处的句子之间的顺序。( )
选项:
A:对
B:错
答案: 【】

10、单选题:
5、抽取式摘要典型模型一共有以下步骤,请按照先后顺序将步骤进行排序()①摘要语句排序 ②语句重要性计算与排名 ③文档理解 ④语句选择
选项:
A:②③④①
B:④③②①
C:①②③④
D:③②④①
答案: 【】

第九章 单元测试

1、单选题:
机器翻译可以有多种实现方法。给定源语言句子,对目标语言句子的条件概率进行建模,再用大规模语料库训练模型的方法是( )。
选项:
A:基于实例的机器翻译
B:基于神经网络的机器翻译
C:基于统计的机器翻译
D:基于规则的机器翻译
答案: 【】

2、单选题:
基于神经网络的机器翻译中,近年引入的( )可以提高长句的翻译质量,它赋予句子中的每个词相同的权重。
选项:
A:突触
B:向量算法
C:神经元
D:注意力机制
答案: 【】

3、单选题:
在人工智能领域,机器翻译属于( )范畴。
选项:
A:智能机器人
B:模式识别
C:自然语言处理
D:问题求解
答案: 【

4、单选题:
近年,神经机器翻译逐渐成为机器翻译的主流技术;通常有两个模块,其中,( )模块把源语言句子转换成中间语义表示.
选项:
A:句法分析
B:规则匹配
C:解码器
D:编码器
答案: 【】

5、单选题:
基于规则的方法由上到下可以分成四个层次,即词汇转换、句法转换、( )和中间语言层。
选项:
A:语法分析
B:语义转换
C:语法转换
D:词法分析
答案: 【

6、多选题:
下列哪项是机器翻译所面临的的挑战( )。
选项:
A:译文选择
B:成本太高
C:译文调序
D:数据稀疏
答案: 【】

7、判断题:
机器翻译的英文是mad translation。( )
选项:
A:错
B:对
答案: 【】

8、判断题:
人类会翻译是因为人类具有翻译的能力,机器翻译就是为机器赋予这种能力。( )
选项:
A:对
B:错
答案: 【】

9、判断题:
人工翻译和机器翻译所涉及的领域知识是一致的。( )
选项:
A:错
B:对
答案: 【】

10、判断题:
机器翻译可以有多种实现方法。给定源语言句子,对目标语言句子的条件概率进行建模,再用大规模语料库训练模型的方法是基于统计的机器翻译
选项:
A:对
B:错
答案: 【】

0
觉得这篇文章对你有用的话,就打赏一下支持文章作者

评论0

请先

站点公告

开放大学课程作业代写,有需要扫码加微信

显示验证码

社交账号快速登录