正确答案:B
网络教育学院《数据挖掘》课 程 大 作 业
题 目
姓 名
学习中心
第一大题讲述自己在完成大作业过程中遇到的困难,解决问题的思路,以及相关感想,或者对这个项目的认识,或者对Python与数据挖掘的认识等等,300-500字。
第二大题完成下面一项大作业题目。
《数据挖掘》课程大作业
注意从以下5个题目中任选其一作答。
题目一Knn算法原理以及python实现
要 求文档用使用word撰写即可。
主要内容必须包括
(1)算法介绍。
(2)算法流程。
(3)python实现算法以及预测。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交
大作业上交时文件名写法为[姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。
。
注意事项
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!
题目二朴素贝叶斯算法原理以及python实现
要 求文档用使用word撰写即可。
主要内容必须包括
(1)算法介绍。
(2)算法流程。
(3)python实现算法以及预测。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交
大作业上交时文件名写法为[姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。
。
注意事项
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!
题目三SVM算法原理以及python实现
要 求文档用使用word撰写即可。
主要内容必须包括
(1)算法介绍。
(2)算法流程。
(3)python实现算法以及预测。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交
大作业上交时文件名写法为[姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。
。
注意事项
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!
题目四中华古诗词分析
要 求编写程序爬取中华古诗词网站
https://so.gushiwen.org/authors/上诗人的诗词信息,至少500首诗词,抽取诗词信息的诗人名字、朝代、诗词标题、诗词内容存储在json文件中,自选某一角度完成对诗词的处理分析。如
(1)杜甫、李白的诗词用字、用词的对比分析;
(2)唐宋代表性诗词的用词对比分析;
(3)使用sklearn对不同诗人的诗词进行训练,训练得到的模型能用于对诗词的作者的判别。对比不同算法判别的准确率。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交
大作业上交时文件名写法为[姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。
注意事项
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!
题目五歌词分析
要 求自选有音乐歌词的网站,编写爬虫程序下载不同类型的歌曲歌词,至少3种以上类型,每种类型至少100首歌曲,抽取其中的歌曲名称、歌曲类型、歌词信息存储在json文件中,自选某一角度对歌词进行处理分析。如
(1)不同类型的歌曲用词分析,如下图所示(自行学习使用jieba库和wordcloud库的使用)。
(2)使用sklearn库对不同类型的歌词进行训练,训练得到的模型能用于对歌词类型的判别。对比不同算法判别的准确率。
(3)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交
大作业上交时文件名写法为[姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。
注意事项
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!
大工23春《数据挖掘》大作业题目及要求[答案]历年参考题目如下:
20春学期(1709、1803、1809、1903、1909、2003)《管理信息系统》在线作业
试卷总分:100 得分:100
一、单选题 (共 30 道试题,共 60 分)
1.管理信息系统是一个广泛的概念,下列不属于管理信息系统范畴的是( )
A.管理信息系统
B.决策支持系统
C.业务信息系统
D.专家系统
2.一个管理信息系统的好坏主要是看它( )
A.硬件先进、软件齐全
B.是否适合组织的目标
C.是否投资力量最省
D.是否使用计算机网络
3.用结构化系统开发方法开发管理信息系统可分为三个阶段,以下哪个不属于这三个阶段之一
A.系统运行
B.系统设计
C.系统实施
D.系统分析
4.信息的维护中,要使得进入系统的信息都是正确的,有效的,指的是( )
A.信息的安全性
B.信息的及时性
C.信息的准确性
D.信息的保密性
5.MRPⅡ的进一步发展是( )
A.MRP
B.MIS
C.ERP
D.EDP
6.MIS的战略规划可以作为将来考核( )工作的标准
A.系统设计
B.系统开发
C.系统实施
D.系统分析
7.系统分析的首要任务是( )
A.正确评价当前系统
B.彻底了解管理方法
C.弄清用户要求
D.尽量使用户接受分析人员的观点
8.从管理决策问题的性质来看,在运行控制层上的决策大多属于( )的问题
A.非结构化
B.结构化
C.半结构化
D.以上都有
9.MIS系统正式投入运行后,系统人员应根据MIS运行的内外部环境的变更和业务量的改变,及时对系统进行维护,以下哪个不属于系统的维护内容之一( )
A.系统运行的日常维护
B.程序的维护
C.数据文件的维护
D.代码的维护
10.从信息处理的工作量来看,信息处理所需资源的数量随管理任务的层次而变化,层次越高,所需信息量( )
A.越小
B.越大
C.不大不小
D.不一定
11.原型模型的优点有( )
A.降低风险
B.循序渐进
C.保证软件质量
D.保证用户真实需求
12.参加系统分析的人员不包括 ( )
A.系统设计员
B.系统分析员
C.程序员
D.业务人员和领导
13.管理信息系统的应用离不开一定的环境和条件,这里所说的“环境”具体指的是( )
A.组织所处的自然环境和社会环境的综合
B.组织所处的自然环境
C.组织所处的社会环境
D.组织内外各种因素的综合
14.数据是指( )
A.经过解释成为信息
B.必须经过加工才成为信息
C.就是信息
D.不经过加工也可以称作信息
15.()反映了某个企业、组织或部门所涉及的数据本身的内容,同时也反映了数据之间的联系。
A.文件系统
B.数据结构
C.数据文件(表)
D.数据库
16.组建计算机网络的目的是为了能够相互共享资源,这里所说的资源主要是指硬件、软件与( )
A.通信系统
B.服务器
C.数据
D.大型机
17.新系统投入运行后,原系统仍有一段时间与它同时运行,称为( )
A.跟踪检验
B.测试
C.校验
D.并行切换
18.ERP是以下哪个术语的简称()
A.管理信息系统
B.客户关系管理
C.决策支持系统
D.企业资源规划
19.结构化系统开发方法在开发策略上强调()
A.自下而上
B.自上而下
C.系统调查
D.系统设计
20.数据资料中含信息量的大小,是由( )
A.消除不确定程度来确定的
B.数据资料的多少来确定的
C.数据资料的可靠程度来确定的
D.数据资料中数据的多少来确定的
21.比较常见的电子商务模式B2C(或称B to C)是指 ( )
A.消费者之间的直接电子商务
B.企业与直接个人消费者间的电子商务
C.企业与企业之间的电子商务
D.以上都不对
22.信息化( )
A.是推动工业化的动力
B.是工业化的基础
C.向工业化发展
D.代替工业化
23.下列哪项不属于信息的性质( )
A.增值性
B.单一性
C.共享性
D.事实性
24.MIS战略规划的组织除了包括成立一个领导小组、进行人员培训外,还包括( )
A.规定进度
B.研究资料
C.明确问题
D.制定规划
25.下面哪句话最准确地概括了结构化方法的核心思想( )
A.自顶向下,由细到粗,逐步抽象
B.自顶向下,由粗到细,逐步求精
C.自下而上,由抽象到具体
D.由分解到抽象
26.关于计算机与人工处理相比,以下哪个描述是不正确的 ( )
A.计算机更易出错
B.计算机处理速度快
C.计算机信息结构化程度高
D.人比计算机灵活
27.金字塔形的管理信息系统结构的底部为( )的处理和决策
A.非结构化
B.结构化
C.半结构化
D.三者都有
28.物理模型设计是系统开发的( )阶段的任务
A.系统设计
B.系统规划
C.系统分析
D.信息系统流程图设计
29.软件可移植性是用来衡量软件的( )的重要尺度之一
A.通用性
B.质量
C.效率
D.人—机界面
30.以下哪个不是基层管理人员决策时需要的信息特点
A.精度高
B.大量来自于外部
C.准确程度高
D.具体详细
二、多选题 (共 10 道试题,共 20 分)
31.以下正确说法的是()
A.模块设计中块内联系越高越好
B.模块设计中块内联系越低越好
C.块间耦合度越高,模块间的独立性越高
D.块间耦合度越低,模块间的独立性越高
32.Client/Server中的Server可能承担的角色有()
A.文件服务器
B.数据库服务器
C.打印服务器
D.应用服务器
E.WEB服务器
33.以下哪项工作内容不属于系统实施阶段()
A.项目管理
B.系统测试
C.程序设计
D.数据库选型
E.代码设计
F.人员培训
34.数据字典包括的内容有( )
A.数据流
B.数据存储
C.数据处理
D.外部实体
35.软件一般包括( )
A.系统软件
B.检测软件
C.应用软件
D.工程软件
36.典型的数据库模型有()
A.逻辑模型
B.网络模型
C.物理模型
D.层次模型
E.关系模型
37.信息的主要特性有()
A.时效性
B.可加工性
C.可传输性
D.共享性
E.低价值性
38.按照决策层次分类,将管理信息分为( )
A.战略信息
B.战术信息
C.市场信息
D.决策信息
E.业务信息
39.信息的主要特性有
A.时滞性
B.可传输性
C.共享性
D.保密性
E.价值性
40.20世纪60年代至80年代末,信息系统处于系统管理阶段,以下哪些是系统管理阶段的核心技术()
A.数据通信与网络技术
B.数据挖掘技术
C.数据库技术
D.多媒体技术
E.人机对话技术
三、判断题 (共 10 道试题,共 20 分)
41.当前管理信息系统建设的主要问题是技术问题
42.信息系统的逻辑模型要解决系统“干什么”,同时也要解决系统“如何干”等问题
43.管理信息系统是一个“人机”合成系统,但计算机并不一定是管理信息系统的必要条件
44.某种物料的需求量可由企业内部其他物料的需求量来决定的称为相关需求物料
45.系统测试的目的就是要证明程序没有错误
46.信息的价值关键在于对数据解释的正确性
47.业务流程分析主要是为了描述现行系统的物理模型
48.一个组织内各部门的信息需求在范围、内容、详细程度和使用频率等方面有差别
49.中继器、网桥、路由器、网关都属于局域网互连设备
50.结构化系统开发方法的每一个阶段都有明确的工作目标
大工23春《数据挖掘》大作业题目及要求[答案][答案]相关练习题:
A _______ political and economic situation is very important for the development of any country.
地方政府的功能有()。
水压力 P1
在恒定干燥条件下,已知: 10%, 30%,结合水为15%(均为干基)。今有湿料100kg,含水40%(湿基)与热空气长时间充分接触至平衡,则干燥过程除去非结合水 kg,降速阶段除去结合水 kg。
指出哪个不同于其他?
在教学中不存在一种可以适合于所有教学情境的方法,因此对于教学方法的选择要灵活多样,最好能体现自己的教学特色
根据《企业破产法》的规定,下列有关重整期间发生事项的表述中,不正确的有( )。
一个具有反馈信号可调节的风阀执行器,通常需要I/O模块的()进行测控
当堂开卷考试中,以下( )情况可判定为作弊。
某一材料的下列指标中为固定值的是( )
下列关于派生类的描述中,错误的是()。
当隐极同步发电机功率角在0°-90°范围内时,功率角(),电磁功率就()。
国土的概念比土地的概念在,它指一个国家主权管辖的地域空间,包括该国的领土、领海、领空和对近海专属经济区、大陆架具有开发资源权利的区域。()
将一枚匀称的硬币连续掷两次,则正面只出现一次的概率为( )
通过岩溶水作用可以改造自身的补给、径流、排泄与动态特征。
曲线图常用来描绘统计事项总体指标的动态变化,常用于连续性数据资料。
发行人应在招股说明书中披露持股量列( )的自然人及其在发行人单位任职。
资产减值的范围()
渐开线直齿圆柱齿轮传动可以看成为一对分度圆纯滚动。
进入阻挠博弈的厂商支付矩阵也可以用什么表示?
The film_____a great success and brought in a large profit to the cinema.
吉大19年9月《液压与气压传动》作业考核试题-0001
古诗《春晓》的作者是杜牧。
桥梁伸缩缝的形式包括()。
设计永久性水工建筑物需考虑的洪水标准有()。