正确答案:-----
22春《大数据技术与应用》作业1题目
正确答案:-----
试卷总分:100 得分:100
一、单选题 (共 15 道试题,共 60 分)
1.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为
A.2
B.4
C.6
D.8
正确答案:-----
正确答案:-----
2.在pandas中脏数据的典型表示有()
正确答案:-----
A.np.nan
B.*
C.?
D.no
正确答案:-----
3.利用pandas处理数据缺失值时,用于丢弃缺失值的函数为
正确答案:-----
A.isnull
B.head
C.tail
正确答案:-----
D.dropna
正确答案:-----
正确答案:-----
4.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22}的中四分位数为
A.2
B.4
C.6
D.8
5.数据集{1,2,3,5,7,8,9}的中位数是
A.3
B.5
C.7
D.4
正确答案:-----
6.用训练好的LOF实例对数据进行LOF分数计算并排序的语句是
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
正确答案:-----
正确答案:-----
D.X_scores = clf.negative_outlier_factor_
正确答案:-----
正确答案:-----
7.利用pandas处理数据缺失值时,用于发现重复值的函数为
正确答案:-----
A.isnull
B.duplicated
正确答案:-----
C.fillna
D.dropna
8.分类的目标是
A.将一组对象分组以发现它们之间是否存在某种关系
B.从一组预定义的类中查找新对象所属的类
C.提高数据标签利用效率
D.以上都不对
正确答案:-----
正确答案:-----
正确答案:-----
正确答案:-----
9.项集 S ={ },则项集S称为
A.1项集
B.2项集
C.3项集
D.空集
正确答案:-----
10.训练随机森林模型实例的语句是
A.from sklearn.tree import DecisionTreetClassifier
正确答案:-----
B.clf=DecisionTreetClassifier()
正确答案:-----
C.clf.fit(Xtrain,Ytrain)
D.predictions=clf.predict(Xtest)
正确答案:-----
11.:from sklearn.tree import DecisionTreeClassifiernclf = DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain) npredictions = clf.predict(Xtest)n上面代码第4行中Xtest表示
正确答案:-----
A.训练数据集
B.测试数据集
C.训练数据的类别标签数组
D.测试数据的类别标签数组
正确答案:-----
12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的上四分位数为
A.20
B.22
C.20.5
D.28
正确答案:-----
13.关联规则 X→Y 表示中Y称为
A.前件
B.后件
C.中间件
D.以上都不对
14.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的四分位差为
A.20
B.22
C.20.5
D.21.5
正确答案:-----
15.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句
A.from sklean.neighbors import LocalOutlierFactor
B.clf=LocalOutlierFactor(n_neighbors=20)
C.y_pred=clf.fit_predict(X)
D.X_scores = clf.negative_outlier_factor_
北语22春《大数据技术与应用》作业1[答案]多选题答案
正确答案:-----
二、多选题 (共 5 道试题,共 20 分)
16.常用的描述统计分析方法包括
A.对比分析法
B.平均分析法
C.交叉分析法
D.以上都不对
17.关联规则反映的是
A.可分类性
B.可分割性
C.事物之间相互依存性
D.事物之间相互关联性
正确答案:-----
21.数据集中趋势分析的常用指标包括
A.平均值
B.中位数
C.众数
D.四分位数
正确答案:-----
19.数据挖掘是适应信息社会从海量数据中提取信息的需要而产生的新学科,也是交叉学科,包括
A.统计学
B.机器学习
C.数据库
D.模式识别
正确答案:-----
20.常用的分类方法包括
A.朴素贝叶斯分类器
B.决策树
C.KNN
D.以上都不对
三、判断题 (共 5 道试题,共 20 分)
21.分箱法是针对连续的数值型数据中噪声进行处理
22.因为 Bayes 理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础
23.数据类型等级最高的是定类数据
24.分类算法的目的是找到数据的最优拟合
25.数据类型等级最低的是定比数据
北语22春《大数据技术与应用》作业1[答案]历年参考题目如下:
佛山电大本科专业有:标准化工程、法学、文化产业管理、信息安全、计算机科学与技术、土木工程、经济与金融、电子商务、学前教育、社会工作、机器人工程、数据科学与大数据技术、机械电子工程、行政管理、汉语言文学。
佛山电大专科专业有:电子商务、市场营销、会计、公共事务管理、商务英语 、计算机应用技术、公共文化服务与管理、动漫设计、表演艺术、文秘、建设工程管理、物业管理、建筑室内设计、应用英语、会展策划与管理、法律事务、数字展示技术、机械制造与自动化、汽车检测与维修技术、智能终端技术与应用、大数据技术与应用、工商企业管理。点击立即咨询,快速获取名校本科学历>>
佛山开放大学是由佛山市政府举办的、以现代信息技术为支撑的、服务全民终身学习的新型高等学校。下辖南海、顺德、高明、三水四所区级开放大学。学校前身为佛山广播电视大学,创办于1979年。学校通过整合集成教育资源,利用现代信息技术,面向职工开展专科、专升本科学历继续教育。
获得成人本科学历可以通过网络教育,网络教育学校选择较多,且多数为211重点大学。这种形式主要是比较方便学习,比较适合工作繁忙没有固定时间来上课的学员。只要有网络,便可在任意地方进行远程学习。另外报名入学时间比较宽松,分为春季3月和秋季9月进行入学。
网络教育学校主要有电子科技大学、东北财经大学、东北大学、东北农业大学、东北师范大学、对外经济贸易大学、福建师范大学、吉林大学、江南大学、北京大学(医学)、北京交通大学、北京师范大学、北京外国语大学、北京邮电大学、北京语言大学、北京中医药大学、大连理工大学、兰州大学、南开大学、四川大学、四川农业大学、天津大学、西安交通大学、西北工业大学、西南大学、中国传媒大学、中国地质大学(北京)、中国石油大学(北京)、中国石油大学(华东)、中国医科大学等。点击立即咨询,快速获取名校本科学历>>
[奥鹏]北语22春《大数据技术与应用》作业1[答案]相关练习题:
( )是互动双方由于目标对立而发生的行动方式。
钢丝绳抽油杆是具有代表性的柔性抽油杆。
网站建设与管理(21秋)形考作业2
明代拟话本小说的代表作家有( )等
关于小挠度薄板的弯曲问题的计算假定,下列错误的是()。
撰写招聘广告时要注意( )。
能作三角形运行的电机,均可釆用Y/△降压启动。( )
辩护律师调查时的人员
联邦制,若干个各自保留独立主权的国家建立起来的国家联盟。
在调查获取资料的基础上进行统计筛选指标的方法是()。
今天所见的《孟子》,共多少篇( )。
德尔图良的名言“因其荒谬而可信”的实质含义是()。
1927年8月7日,党中央在汉口召开会议。这次会议是由大革命失败到土地革命兴起的转折点。
如果一份信用证内规定汇票付款人为开证申请人,银行将视此汇票为________
在学前教育评价中,一方面要遵循客观性原则,另一方面还要注意发挥评价者的主观能动性。