东财21秋《数据挖掘概论》单元作业三[答案]答案
东财《数据挖掘概论》单元作业三
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.线性回归通常通过( )方法进行参数估计。
A.最小二乘法
B.牛顿法
C.聚类
D.拉格朗日法
正确答案:-----
2.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )。
A.层次聚类
B.划分聚类
C.非互斥聚类
D.模糊聚类
正确答案:-----
3.ID3、C4.5和CART都采用的是( )方法。
正确答案:-----
A.贪心
B.回溯
C.动态规划
D.递归
正确答案:-----
4.表示簇内距离与簇间距离之比的指标为( )。
A.DBI指数
正确答案:-----
B.Jaccard系数
正确答案:-----
C.rand指数
正确答案:-----
D.轮廓系数
正确答案:-----
5.存在噪声和离群点时,( )是更鲁棒的划分聚类方法。
A.k-中心点方法
B.AGNES
C.k-均值方法
D.BIRCH
正确答案:-----
6.在决策树中,树的最顶层结点是( )。
A.内部结点
B.树叶结点
C.分支
D.根结点
正确答案:-----
7.垃圾邮件检测通常通过( )方法实现。
A.线性回归
B.岭回归
C.Lasso
D.逻辑回归
正确答案:-----
8.对于有n个数据点的数据集,经验上通常设置簇数为( )。
A.√(2n)
正确答案:-----
B.√n
正确答案:-----
C.√2
正确答案:-----
D.√(n/2)
正确答案:-----
9.在基本k-均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。
A.曼哈顿距离
B.平方欧几里德距离
C.余弦距离
D.Bregman散度
正确答案:-----
10.事件的优势比(odds)的取值范围是( )。
正确答案:-----
A.(0,+∞)
B.(0,1)
C.(-∞,+∞)
D.(-1,1)
正确答案:-----
东财21秋《数据挖掘概论》单元作业三[答案]多选题答案
二、多选题 (共 5 道试题,共 25 分)
11.( )可能成为k-均值的终止条件。
A.对固定数量的迭代
B.在局部最小值不是特别差的情况下,在迭代中对簇观测值的分配不发生变化
C.在连续迭代中质心不发生变化
D.RRS下降到阈值以下
正确答案:-----
12.以下属于分类器评价或比较尺度的有( )。
A.预测准确度
B.召回率
C.模型描述的简洁度
D.计算复杂度
正确答案:-----
13.k-均值聚类分析在( )情况下无法得出好的结果。
A.具有异常值的数据点
B.具有不同密度的数据点
C.具有非凹形的数据点
D.具有非环形的数据点
正确答案:-----
14.具有相同的时间复杂度的聚类算法有( )。
A.BIRCH
B.k-均值
C.DBSCAN
正确答案:-----
D.OPTICS
正确答案:-----
15.回归方法主要分为( )。
A.线性回归
B.非线性回归
C.岭回归
D.Lasso
正确答案:-----
三、判断题 (共 5 道试题,共 25 分)
16.分类是无监督学习,即每个训练样本的类编号是未知的,要学习的类集合或数量也可能是事先未知的。( )
17.精准率是分类器正确分类的检验元组所占的百分比。( )
21.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。( )
19.在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( )
正确答案:-----
20.轮廓系数的数值越小说明模型的聚类效果越好。( )
东财21秋《数据挖掘概论》单元作业三[答案]历年参考题目如下: