南开22秋学期《网络爬虫与信息提取》在线作业[答案]

作者:奥鹏作业答案 字体:[增加 减小] 来源:南开在线 时间:2022-11-12 08:33

22秋学期(高起本1709-2103、全层次2109-2103)《网络爬虫与信息提取》在线作业-00001 试卷总分:100 得分:100 一、单选题 (共 20 道试题,共 40 分) 1.Python在Windows路径字符串左引号的左边加()符号来避免反

南开22秋学期《网络爬虫与信息提取》在线作业[答案]

南开22秋学期《网络爬虫与信息提取》在线作业[答案]

正确答案:A

22秋学期(高起本1709-2103、全层次2109-2103)《网络爬虫与信息提取》在线作业-00001

正确答案:B

试卷总分:100  得分:100

一、单选题 (共 20 道试题,共 40 分)

1.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题

正确答案:C

A.s

B.c

C.d

D.r

正确答案:A

 

2.使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()

A.content

B.text

C.title

D.body

正确答案:D

 

3.Python中Object={1, 2, 3, 4, 5},则Objcet是()

A.集合

B.字典

C.列表

D.元组

正确答案:A

 

4.使用UI Automatorr让屏幕向左滚动的操作是得到相应控件后使用命令()

A.scroll.left

B.scroll.horiz.left

C.scroll.forward

D.scroll.horiz.forward

正确答案:B

 

5.chrome默认打开开发者工具的快捷是

A.F5

B.F11

C.F12

D.F2

正确答案:B

 

6.Python中把列表转换为集合需要使用##函数

A.set

B.list

C.convert

D.change

正确答案:C

 

7.Python中跳过本次循环应用关键字()

A.break

B.continue

C.exit

D.return

正确答案:A

正确答案:B

 

8.PyMongo中逻辑查询表示大于等于的符号是()

A.$gt

B.$lt

C.$gte

D.$lte

正确答案:A

 

9.PyMongo中逻辑查询表示小于的符号是()

A.$gt

B.$lt

C.$gte$$lte

 

10.可以通过()绕过网站登录。

A.session

B.cookies

C.moonpies

D.localstorage

正确答案:D

 

11.requests中post请求方法的使用为requests.post('网址', data=data)中的data为()

正确答案:C

A.列表

B.元组

C.字典

D.集合

正确答案:B

正确答案:D

正确答案:B

正确答案:D

 

12.在Linux中哪个命令是添加权限的()

A.chmod

B.sudo

正确答案:A

C.cp

D.mkdir

正确答案:B

 

13.在Scrapy的目录下,哪个文件负责存放爬虫文件?()

A.spiders文件夹

正确答案:A

B.item.py

C.pipeline.py

D.settings.py

正确答案:C

 

14.Python中退出循环应用关键字()

A.break

B.continue

C.exit

D.return

 

15.Python中专门用来处理图像的第三方库是

A.lxml

B.Pillow

C.beautifulsoup

D.pytesseract

正确答案:B

 

16.Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是()

A.1

B.2

C.3

D.无输出

正确答案:B

 

17.使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()

A.exist

B.exists

C.isnull

D.contains

正确答案:B

 

21.使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()

A.scroll_forwad

B.scroll_up

正确答案:B

C.scroll.forward

D.scroll.vert.forward

正确答案:C

 

19.如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()

正确答案:B

A.列表

B.元组

C.字典

D.集合

 

20.当需要把Python里面的数据发送给网页时,应先将其转换成()

A.Json字符串

B.GET

C.POST

D.Request

正确答案:B

 

南开22秋学期《网络爬虫与信息提取》在线作业[答案]多选题答案

正确答案:B

二、多选题 (共 10 道试题,共 20 分)

21.Python中的容器有()

A.列表

B.元组

C.字典

D.集合

 

22.Python中()容器有推导式

A.列表

B.元组

C.字典

D.集合

 

23.MongoDB中获取名字为db的库的语句为()

正确答案:D

A.client.db

正确答案:B

B.client('db')

正确答案:D

C.client['db']

正确答案:C

D.client{'db'}

正确答案:C

 

24.以下HTTP状态码表示服务器本身发生错误的是

A.400

B.503

C.302

D.500

正确答案:A

 

25.cookies的缺点是

A.实现自动登录

B.跟踪用户状态

C.http中明文传输

D.增加http请求的流量

正确答案:B

 

26.requests中post请求方法的第二个参数可以为()

A.字典

B.列表

C.json数据

D.字符串

正确答案:A

 

27.以下哪些可以独立成为Python编译器()

A.Pycharm

B.IDLE

正确答案:A

C.Eclipse

D.Visual Studio 2010

正确答案:D

 

28.一个可行的自动更换代理的爬虫系统,应该下列哪些功能?

A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中

正确答案:D

B.在发现某个请求已经被设置过代理后,什么也不做,直接返回

C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用

正确答案:B

D.周期性验证数据库中的无效代理,及时将其删除

正确答案:D

 

29.HTTP常用状态码表明请求被正常处理的有()

A.200

B.301

C.302

D.204

正确答案:C

 

30.Python中一个函数可以有()个return语句

A.0

B.1

C.多个

D.2

正确答案:A

 

三、判断题 (共 20 道试题,共 40 分)

31.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。

 

32.一般来说在页面都通过GET将用户登录信息传递到服务器端。

 

33.MongoDB是一个关系数据库产品

正确答案:D

 

34.PyMongoDB中排序方法sort第二个参数-1表示升序

正确答案:C

 

35.Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。

正确答案:C

 

36.上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。

 

37.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次

 

38.使用AJAX技术,可以在不刷新网页的情况下更新网页数据

 

39.Redis中使用lrange读取数据后数据也会删除

正确答案:D

 

40.Selenium必须加载对应的webdriver才能模拟浏览器访问

正确答案:B

 

41.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取

正确答案:D

 

42.Redis中查询列表长度命令llen中l代表left,即从左侧开始数

正确答案:D

 

43.Python中函数返回值的个数可以是多个

 

44.使用Charles直接抓取HTTPS的数据包,就会出现大量的Method为CONNECT的请求,但是这些请求又全部都会失败,是没有安装SSL证书导致的

正确答案:C

 

45.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;

 

46.UI Automator Viewer与Python uiautomator可以同时使用

 

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)