南开大学23秋学期《网络爬虫与信息提取》在线作业一

奥鹏南开大学23年秋季新学期作业参考

23秋学期(高起本:1709-2103、专升本/高起专:2003-2103)《网络爬虫与信息提取》在线作业-00001

HTTP常用状态码表明服务器上没有请求的资源的是()
A:500
B:503
C:403
D:404
正确答案问询微信:424329

打开终端,输入(),屏幕上会出现Python的路径
A:python path
B:path python
C:which python
D:python which
正确答案问询微信:424329

使用UI Automatorr根据坐标来滑动桌面的操作是得到相应控件后使用命令()
A:swipe
B:move
C:scroll
D:fly
正确答案问询微信:424329

使用Xpath构造属性值包含相同字符串的路径采用()方法
A:contain
B:contains
C:include
D:includes
正确答案问询微信:424329

()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。
A:meta
B:head
C:header
D:body
正确答案问询微信:424329

当需要把Python里面的数据发送给网页时,应先将其转换成()
A:Json字符串
B:GET
C:POST
D:Request
正确答案问询微信:424329

Redis中读取数据语句lrange chapter 0 3,那么表示读列表中()个值
A:2
B:3
C:4
D:5
正确答案问询微信:424329

chrome默认打开开发者工具的快捷是
A:F5
B:F11
C:F12
D:F2
正确答案问询微信:424329

在Mac OS下安装MongoDB使用命令() install mongodb
A:brew
B:apt-get
C:sudo
D:apt
正确答案问询微信:424329

启动MongoDB使用命令mongod –() usr/local/etc/mongod.conf
A:config
B:install
C:start
D:begin
正确答案问询微信:424329

PyMongo中逻辑查询表示大于的符号是()
A:$gt
B:$lt
C:$gte$$lte
正确答案问询微信:424329

Python中的()库用于发送网络请求
A:web
B:request
C:requests
D:javascript
正确答案问询微信:424329

Python中线程池map()方法第二个参数是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

使用UI Automatorr长按点击的操作是得到相应控件后使用命令()
A:longclick
B:long_click
C:clicklong
D:click_long
正确答案问询微信:424329

Python中若定义object=(1, 2, 3, 4, 5),则print(object[:3])输出()
A:345
B:34
C:45
D:123
正确答案问询微信:424329

Python中退出循环应用关键字()
A:break
B:continue
C:exit
D:return
正确答案问询微信:424329

Chrome的开发者工具中哪个选项可以查找到cookies
A:Elements
B:Sources
C:Network
D:Peformance
正确答案问询微信:424329

MongoDB中可以将()数据结构插入集合中
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

Python中定义函数关键字为()
A:def
B:define
C:func
D:function
正确答案问询微信:424329

Python中若定义object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A:12
B:123
C:23
D:234
正确答案问询微信:424329

在配置ios使用Charles的操作中,正确的有()
A:对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B:选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
C:输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D:安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
正确答案问询微信:424329

下列关于在IOS上配置charles的说法正确的是()
A:不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B:手机和电脑需要在同一个局域网下。
C:HTTP代理可以使用“自动”选项。
D:安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
正确答案问询微信:424329

使用BeautifulSoup对象后可以使用()来查找内容
A:find_all
B:find
C:search
D:search_all
正确答案问询微信:424329

下列关于mitmproxy的使用说法正确的是()
A:mitmproxy的端口为8080端口。
B:设置好代理以后,在手机上打开一个App或者打开一个网页,可以看到mitmproxy上面有数据滚动。
C:用鼠标在终端窗口上单击其中的任意一个请求,可以显示这个数据包的详情信息。
D:如果要访问HTTPS网站,还需要安装mitmproxy的证书
正确答案问询微信:424329

BS4可以用来从()中提取数据
A:HTML
B:XML
C:数据库
D:JSON
正确答案问询微信:424329

HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
A:403
B:404
C:500
D:503
正确答案问询微信:424329

以下哪些方法属于Python写CSV文件的方法()
A:writeheaders
B:writeheader
C:writerrows
D:writerow
正确答案问询微信:424329

以下HTTP状态码表示服务器没有正常返回结果的是
A:200
B:301
C:404
D:500
正确答案问询微信:424329

使用Selennium获取网页中元素的方法有
A:find_element_by_name
B:find_element_by_id
C:find_elements_by_name
D:find_elements_by_id
正确答案问询微信:424329

自动填充验证码的方式有
A:手动识别填写
B:图像识别
C:打码网站
D:浏览器自动识别
正确答案问询微信:424329

代理中间件的可用代理列表一定要写在settings.py里面
A:对
B:错
正确答案问询微信:424329

数据在MongoDB中是按照“库(Database)”—“集合(Collections)”—“文档(Document)”的层级关系来存储的。
A:对
B:错
正确答案问询微信:424329

chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
A:对
B:错
正确答案问询微信:424329

MongoDB URI的格式为:
mongodb://服务器IP或域名:端口@用户名:密码
A:对
B:错
正确答案问询微信:424329

当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入"163.com"就可以了
A:对
B:错
正确答案问询微信:424329

爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行
A:对
B:错
正确答案问询微信:424329

使用UI Automatorr操作实体键的命令为device.press.实体按键名称()
A:对
B:错
正确答案问询微信:424329

RoboMongo是MongoDB的管理软件
A:对
B:错
正确答案问询微信:424329

如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。奥鹏南开大学23年秋季新学期作业参考
A:对
B:错
正确答案问询微信:424329

PyMongoDB中排序方法sort第二个参数1表示降序
A:对
B:错
正确答案问询微信:424329

mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
A:对
B:错
正确答案问询微信:424329

Redis中使用lrange读取数据后数据也会删除
A:对
B:错
正确答案问询微信:424329

为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面。
A:对
B:错
正确答案问询微信:424329

Python中使用下面代码打开文件也需要对文件进行close关闭操作
with open('文件路径', '文件操作方式', encoding='utf-8') as f
A:对
B:错
正确答案问询微信:424329

对Charles设置代理时,Ip可以设置为127.0.0.1,端口为8888.
A:对
B:错
正确答案问询微信:424329

上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
A:对
B:错
正确答案问询微信:424329

middlewares.py是下载器中间件
A:对
B:错
正确答案问询微信:424329

在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis
A:对
B:错
正确答案问询微信:424329

Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。
A:对
B:错
正确答案问询微信:424329

如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是首先把数据或者分析结果出售给某基金公司,然后自己再买被爬公司的股票。此时,涉嫌内幕交易,属于严重违法行为。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网