22春学期（高起本1709、全层次1803-2103）《数据科学导论》在线作业答卷 (2)

周老师 · 发表于 2022-6-5 11:15:45

22春学期（高起本1709-1803、全层次1809-2103）《数据科学导论》在线作业-00002
试卷总分:100得分:100
一、单选题 (共 20 道试题,共 40 分)
1.聚类是一种()。
A.有监督学习
B.无监督学习
C.强化学习
D.半监督学习
答案:
2.一元线性回归中,实在值与预测值的差称为样本的()。
A.差错
B.方差
C.测差
D.残差
答案:
3.关于k近邻法,下列说法错误的是()。
A.不具有显式的学习过程
B.适用于多分类使命
C.k值越大，分类作用越好
D.一般选用大都表决的分类决议计划规矩
答案:
4.某产品的产值(X,件)与单位成本(Y,元/件)之间的回归方程为^Y=100-1.2X,这阐明()。
A.产值每添加一台，单位成本添加100元
B.产值每添加一台，单位成本削减1.2元
C.产值每添加一台，单位成本均匀削减1.2元
D.产值每添加一台，单位均匀添加100元
答案:
5.哪一项不归于标准化的方法()
A.最小-最大标准化
B.零-均值标准化
C.小数定标标准化
D.中位数标准化
答案:
6.维克托?迈尔-舍恩伯格在《大数据年代:日子、工作与思想的大革新》一书中,继续着重了一个观念:大数据年代的到来,使咱们无法人为地去发现数据中的微妙,与此一起,咱们更大概重视数据中的有关关系,而不是因果关系。其间,数据之间的有关关系能够经过以下哪个算法直接发掘( )
A.K-means
B.Bayes Network
C.C4.5
D.Apriori
答案:
7.在回归剖析中,自变量为(),因变量为()。
A.离散型变量，离散型变量
B.接连型变量，离散型变量
C.离散型变量，接连型变量
D.接连型变量，接连型变量
答案:
8.层次聚类合适规划较()的数据集
A.大
B.中
C.小
D.一切
答案:
9.BFR聚类是用于处理数据集()的k-means变体。
A.大
B.中
C.小
D.一切
答案:
10.手肘法的中心目标是()。
A.SES
B.SSE
C.RMSE
D.MSE
答案:
11.层次聚类对给定的数据进行()的分化。
A.聚合
B.层次
C.分拆
D.仿制
答案:
12.依据映射关系的不一样能够分为线性回归和()。
A.对数回归
B.非线性回归
C.逻辑回归
D.多元回归
答案:
13.以部属于相关剖析的是( )
A.CPU功能预测
B.购物篮剖析
C.自动判别鸢尾花种类
D.股市趋势建模
答案:
14.在k近邻法中,挑选较小的k值时,学习的"近似差错"会(),"估量差错"会()。
A.减小，减小
B.减小，增大
C.增大，减小
D.增大，增大
答案:
15.特征挑选的四个过程中不包含()
A.子集发生
B.子集评估
C.子集查找
D.子集验证
答案:
16.使用最小二乘法对多元线性回归进行参数估量时,其方针为()。
A.最小化方差#最小化规范差
B.最小化残差平方和
C.最大化信息熵
答案:
17.在一元线性回归中,经过最小二乘法求得的直线叫做回归直线或()。
A.最优回归线
B.最优散布线
C.最优预测线
D.最好散布线
答案:
18.BFR聚类用于在()欧氏空间中对数据进行聚类
A.高维
B.中维
C.低维
D.中高维
答案:
19.Apriori算法的加快过程依靠于以下哪个战略( )
A.抽样
B.剪枝
C.缓冲
D.并行
答案:
20.设X={1,2,3}是频频项集,则可由X发生()个相关规矩。
A.4
B.5
C.6
D.7
答案:
二、多选题 (共 10 道试题,共 20 分)
21.系统日志搜集的根本特征有()
A.高可用性
B.高牢靠性
C.可拓展性
D.高功率
答案:BC
22.间隔衡量中的间隔能够是()
A.欧式间隔
B.曼哈顿间隔
C.Lp间隔
D.Minkowski间隔
答案:BCD
23.Apriori算法的计算杂乱度受()影响。
A.撑持度阈值
B.项数
C.业务数
D.业务均匀宽度
答案:BCD
24.下面比如归于分类的是()
A.检测图画中是不是有人脸呈现
B.对客户依照借款危险巨细进行分类
C.辨认手写的数字
D.估量商场客流量
答案:BC
25.数据科学具有哪些性质()
A.有用性
B.可用性
C.未意料
D.可了解
答案:BCD
26.聚类的首要方法有()。
A.区分聚类
B.层次聚类
C.密度聚类
D.间隔聚类
答案:BC
27.k近邻法的根本要素包含()。
A.间隔衡量
B.k值的挑选
C.样本巨细
D.分类决议计划规矩
答案:BD
28.层次聚类的方法是()
A.聚合方法
B.分拆方法
C.组合方法
D.对比方法
答案:B
29.多层感知机的学习过程包括()。
A.信号的正向传达
B.信号的反向传达
C.差错的正向传达
D.差错的反向传达
答案:
30.啥状况下结点不必区分()
A.当时结点所包括的样本全归于同一种类
B.当时特点集为空，或是一切样本在一切特点上取值一样
C.当时结点包括的样本集为空
D.还有子集不能被根本正确分类
答案:BC
三、答案来历：熊猫题库（www.xmdd188.com） (共 20 道试题,共 40 分)
31.数据科学具有广泛的应用范畴,能够应用在社交网络、工作体育、政治竞选
答案:正确
32.挑选较小的k值,适当于用较小的邻域中的练习实例进行预测,学习的"近似差错"会减小,"估量差错"会增大,预测成果会对近邻的点实例点十分灵敏。
答案:正确
33.规范BP算法是在读取悉数数据集后,对参数进行一致更新的算法。
答案:错误
34.均匀削减的不纯度越大,则特征重要度越高。
答案:正确
35.运用SVD方法进行图画紧缩不可以以保存图画的重要特征。
答案:错误
36.多层感知机的学习才能有限,只能处理线性可分的二分类疑问。
答案:错误
37.相关规矩能够用枚举的方法发生。
答案:正确
38.获取数据的方法有多种,能够从网页、丈量、数据库、传统媒体、监控等等方法
答案:正确
39.每个类的先验概率能够经过归于该类的练习记载所占的份额来估量。
答案:正确
40.子集发生实质上是一个查找过程,该过程能够从空集、随机发生的一个特征子集或许整个特搜集开端。
答案:正确
41.当特征为离散型时,能够运用信息增益作为评估统计量。
答案:正确
42.由不一样的间隔衡量所断定的近来邻点是不一样的
答案:正确
43.Pearson有关系数是判别特征之间、以及特征和方针变量之间线性有关关系的统计量。
答案:正确
44.sigmoid函数归于阶跃函数,是神经网络中常见的激活函数。
答案:错误
45.分拆方法是自底向上的方法。
答案:错误
46.跟着特征维数的添加,样本间区别度进步。
答案:错误
47.两个对象越类似,他们的相异度就越高。
答案:错误
48.k值增粗心味着全体模型变得杂乱。
答案:错误
49.穿插表能够协助大家发现变量之间的彼此效果。
答案:正确
50.具有双隐层的感知机足以用于处理任何杂乱的分类疑问。
答案:正确