23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《网络爬虫与信息提取》在线作业-00001
试卷总分:100 得分:100
一、单选题 (共 20 道试题,共 40 分)
1.HTTP常用状态码表明服务器上没有请求的资源的是()
A.500
B.503
C.403
D.404
2.打开终端,输入(),屏幕上会出现Python的路径
A.python path
B.path python
C.which python
D.python which
3.使用UI Automatorr根据坐标来滑动桌面的操作是得到相应控件后使用命令()
A.swipe
B.move
C.scroll
D.fly
4.使用Xpath构造属性值包含相同字符串的路径采用()方法
A.contain
B.contains
C.include
D.includes
5.()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。
A.meta
B.head
C.header
D.body
6.当需要把Python里面的数据发送给网页时,应先将其转换成()
A.Json字符串
B.GET
C.POST
D.Request
7.Redis中读取数据语句lrange chapter 0 3,那么表示读列表中()个值
A.2
B.3
C.4
D.5
8.chrome默认打开开发者工具的快捷是
A.F5
B.F11
C.F12
D.F2
9.在Mac OS下安装MongoDB使用命令() install mongodb
A.brew
B.apt-get
C.sudo
D.apt
10.启动MongoDB使用命令mongod –() usr/local/etc/mongod.conf
A.config
B.install
C.start
D.begin
11.PyMongo中逻辑查询表示大于的符号是()
A.$gt
B.$lt
C.$gte$$lte
12.Python中的()库用于发送网络请求
A.web
B.request
C.requests
D.javascript
13.Python中线程池map()方法第二个参数是()
A.列表
B.元组
C.字典
D.集合
14.使用UI Automatorr长按点击的操作是得到相应控件后使用命令()
A.longclick
B.long_click
C.clicklong
D.click_long
15.Python中若定义object=(1, 2, 3, 4, 5),则print(object[:3])输出()
A.345
B.34
C.45
D.123
16.Python中退出循环应用关键字()
A.break
B.continue
C.exit
D.return
17.Chrome的开发者工具中哪个选项可以查找到cookies
A.Elements
B.Sources
C.Network
D.Peformance
18.MongoDB中可以将()数据结构插入集合中
A.列表
B.元组
C.字典
D.集合
19.Python中定义函数关键字为()
南开答案请进:opzy.net或请联系微信:1095258436
A.def
B.define
C.func
D.function
20.Python中若定义object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A.12
B.123
C.23
D.234
二、多选题 (共 10 道试题,共 20 分)
21.在配置ios使用Charles的操作中,正确的有()
A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
22.下列关于在IOS上配置charles的说法正确的是()
A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B.手机和电脑需要在同一个局域网下。
C.HTTP代理可以使用“自动”选项。
D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
23.使用BeautifulSoup对象后可以使用()来查找内容
A.find_all
B.find
C.search
D.search_all
24.下列关于mitmproxy的使用说法正确的是()
A.mitmproxy的端口为8080端口。
B.设置好代理以后,在手机上打开一个App或者打开一个网页,可以看到mitmproxy上面有数据滚动。
C.用鼠标在终端窗口上单击其中的任意一个请求,可以显示这个数据包的详情信息。
D.如果要访问HTTPS网站,还需要安装mitmproxy的证书
25.BS4可以用来从()中提取数据
A.HTML
B.XML
C.数据库
D.JSON
26.HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
A.403
B.404
C.500
D.503
27.以下哪些方法属于Python写CSV文件的方法()
A.writeheaders
B.writeheader
C.writerrows
D.writerow
28.以下HTTP状态码表示服务器没有正常返回结果的是
A.200
B.301
C.404
D.500
29.使用Selennium获取网页中元素的方法有
A.find_element_by_name
B.find_element_by_id
C.find_elements_by_name
D.find_elements_by_id
30.自动填充验证码的方式有
A.手动识别填写
B.图像识别
C.打码网站
D.浏览器自动识别
三、判断题 (共 20 道试题,共 40 分)
31.代理中间件的可用代理列表一定要写在settings.py里面
32.数据在MongoDB中是按照“库(Database)”—“集合(Collections)”—“文档(Document)”的层级关系来存储的。
33.chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
34.MongoDB URI的格式为: mongodb://服务器IP或域名:端口@用户名:密码
35.当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入”163.com”就可以了
36.爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行
37.使用UI Automatorr操作实体键的命令为device.press.实体按键名称()
38.RoboMongo是MongoDB的管理软件
39.如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。
40.PyMongoDB中排序方法sort第二个参数1表示降序
41.mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
42.Redis中使用lrange读取数据后数据也会删除
43.为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面。
44.Python中使用下面代码打开文件也需要对文件进行close关闭操作 with open(‘文件路径’, ‘文件操作方式’, encoding=’utf-8′) as f
45.对Charles设置代理时,Ip可以设置为127.0.0.1,端口为8888.
46.上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
47.middlewares.py是下载器中间件
48.在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis
49.Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。
50.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是首先把数据或者分析结果出售给某基金公司,然后自己再买被爬公司的股票。此时,涉嫌内幕交易,属于严重违法行为。