正确答案:C
22秋《大数据技术与应用》作业3-00001
正确答案:A
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 60 分)
1.项集 S ={尿布,啤酒,牛奶,可乐},则项集S称为
A.1项集
B.2项集
C.3项集
D.4项集
正确答案:C
2.决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是
A.ID3
正确答案:B
B.C4.5
C.CART
D.以上都不对
正确答案:A
正确答案:B
正确答案:A
3.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A.2
B.4
C.6
D.8
正确答案:A
4.从软件库中导入LOF异常检测算法类的语句是
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
正确答案:C
正确答案:C
D.X_scores = clf.negative_outlier_factor_
正确答案:B
正确答案:C
5.数据等级排序T的是
A.定距等级>定比等级>定类等级>定序等级
B.定比等级>定序等级>定距等级>定类等级
C.定比等级>定距等级>定序等级>定类等级
D.定比等级>定类等级>定序等级>定距等级
正确答案:D
6.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
7.不包含任何项的项集是指
A.项
B.空集
C.超项集
D.子项集
正确答案:C
8.从软件库中导入模糊C均值聚类算法类的语句是
A.from fcmeans import FCM
B.fcm=FCM(n_clusters=3)
C.fcm.fit(X)
D.fcm_labels=fcm.u.argmax(axis=1)
正确答案:B
9.如果一个项集包含K个项,则该项集称为
A.项
B.空集
C.超项集
D.K项集
正确答案:B
10.利用pandas处理数据缺失值时,用于丢弃重复值的函数为
正确答案:A
A.drop_duplicates
正确答案:D
B.duplicated
正确答案:D
C.fillna
D.dropna
正确答案:A
11.常用于多变量噪声值(异常值)处理的方法是
A.等深分箱
B.聚类法
C.等宽分箱
D.盖帽法
正确答案:A
12.数据集{1,2,3,5,7,9}的中位数是
A.3
B.5
C.7
D.4
正确答案:D
正确答案:C
13.利用pandas处理数据缺失值时,用于发现缺失值的函数为
正确答案:B
A.isnull
B.head
C.tail
正确答案:C
D.info
正确答案:C
14.关联规则 X→Y 表示中Y称为
A.前件
B.后件
C.中间件
D.以上都不对
15.数据集{1,2,2,2,3,4}的众数是
A.1
B.2
C.3
D.4
正确答案:B
二、多选题 (共 5 道试题,共 20 分)
16.聚类分析可以用于
A.顾客分组
B.分类
C.回归
D.找出显著影响
正确答案:D
17.关联规则反映的是
A.可分类性
B.可分割性
C.事物之间相互依存性
D.事物之间相互关联性
正确答案:A
21.大数据收集的途径包括()
A.互联网
B.移动互联网
C.物联网传感器
D.手动
正确答案:A
19.可用于实现数据one-hot编码的方法包括
A.Pandas的head
正确答案:C
B.Pandas的get_dummies
正确答案:C
C.sklearn.preprocessing.OneHotEncoder方法
正确答案:A
D.Pandas的tail
正确答案:D
20.决策树的关键点包括
A.采用Bagging框架
B.采用随机特征选择生成每个决策树的训练数据特征子集
C.采用采样数据集的特征子集训练对应决策树
D.以上都不对
三、判断题 (共 5 道试题,共 20 分)
21.定类数据层次比定序数据高
22.数据挖掘的过程都是有统一一致的步骤的
23.定序数据层次比定距数据高
24.下四分位数是指 数据从大到小排列排在第25%位置的数字,即最小的四分位数(下四分位数)
25.上世纪 70 年代,随着数据库管理系统趋于成熟,存储和查询百万兆字节甚至千万亿字节成为可能。而且,数据仓库允许用户从面向事物处理的思维方式向更注重数据分析的方式进行转变。因此,提取复杂深度系信息能力非常强啊
北语22秋《大数据技术与应用》作业3[答案]历年参考题目如下:
海南统招专升本有临床医学、药学、医学检验技术、护理学、口腔医学、旅游管理、计算机科学与技术、英语、学前教育、会计学、人力资源管理、工程造价、财务管理、工程管理、汉语言文学、法学、金融学、土木工程、航海技术、水路运输与海事管理、化学工程与工艺、制药工程、机械设计制造及其自动化、大数据技术与应用、物联网工程、健康服务与管理、物流管理、酒店管理、软件工程、数字媒体技术、俄语、经济学、市场营销、日语、电子信息工程、音乐学、美术学、科学教育、体育教育等专业。
虽然海南专升本报名的在职人士不能报考普通专升本,但是可以报考成人高等教育专升本。
只要报名者符合具有国民教育系列大专或大专以上毕业证书(医学类专业需要提供医学类专业大专文凭或医学类专业职业资格证书、从业证明等)即可报考。
比如通过远程教育专升本既可以报考对口专业,也可以跨专业报考,还能选择国内知名高校。比如北京大学(医学)、北京师范大学、北京外国语大学、大连理工大学、南开大学、天津大学、江南大学、西北工业大学、西安交通大学、东北大学、吉林大学、东北财经大学、东北农业大学、东北师范大学、北京语言大学、电子科技大学、兰州大学、四川大学、中国地质大学(北京)、中国传媒大学、对外经济贸易大学、北京邮电大学、北京交通大学、中国医科大学、北京中医药大学、中国石油大学(华东)、四川农业大学、西南大学等经教育部批准远程教育试点的985/211在内的示范高校。立即联系学业顾问>>
北语22秋《大数据技术与应用》作业3[答案]相关练习题:
下列各项资产中不属于金融资产的是()。
网络应用系统的外包开发模式不包括( )
收入包括( )
两个面的相交处在必然会在三视图中以实线或虚线的方式表现出来。
一种矿物切片在正交偏光镜下转动物台,始终黑暗,该矿物为二轴晶。 ( )
以下关于VPN说法正确的是:()
《建设工程监理合同》示范文本对监理人职责的规定中,不包括( )。
某旅游饭店通过发行优先股股票筹资,股票市价为每股100元,筹资费率为5%,每年股息20元,则资金成本率为()。
二级双车道公路弯道处,已知超高横坡度为5%,采用绕路面内边线旋转方式,路拱横坡度为1.5%,超高缓和段长度为100m,加宽值为0.6m,采用比例加宽,则当 时,路肩外边缘的超高值计算采用下列那个公式( )
包括数据传送安全、数据存储安全和数据操作安全,体现的物流软件系统物理特性是()
因情况紧急需要先予执行的,其紧急情况包括
以行政征收发生的根据为标准,行政征收可分为( )。
以下行为中违反国家主权平等原则的是( )。
()改变了山水在诗中的地位,写作了一大批以山水为审美对象的诗歌,奠定了中国山水诗写实的雏形。
某企业将使用过的两辆进口小汽车销售,每辆销售额16万元(原值为14万元),开具普通发票上注明价格32万元,应纳增值税为( )。
下列各项支出,应计入企业职工福利费支出的有()。
甲公司3月1日向乙公司发出要约,有效期截止4月1日,3月15日乙电传甲:“价高,难接受。”3月20日乙又以电传通知甲:“接受贵方3月1日报价。”这个合同( )。
《格列佛游记》的作者是
可以报考的学校有北京中医药大学、北京大学(医学)、中国医科大学、吉林大学、东北大学、南开大学、四川大学等等,共计68所知名高校。
单式记账凭证是指在一张凭证上( )的凭证。