南开大学23年春学期《网络爬虫技术》在线作业三
奥鹏南开大学新学期作业参考
23春学期(高起本:1709-2103、专升本/高起专:1909-2103)《网络爬虫技术》在线作业-00003
Pyhon中()方法可以将一个字符串分割为一个列表
A:aplit
B:replace
C:strip
D:format
正确答案问询微信:424329
在Linux中哪个命令是添加权限的()
A:chmod
B:sudo
C:cp
D:mkdir
正确答案问询微信:424329
请补充pyhon判断语句
if condition:
do
()
do
else:
do
A:elseif condition
B:elseif condition:
C:elif condition:
D:elif condition
正确答案问询微信:424329
当爬虫创建好了之后,可以使用"scrapy()" 命令运行爬虫。
A:startup
B:starwar
C:drawl
D:crawl
正确答案问询微信:424329
Python中Object={1, 2, 3, 4, 5},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
以下哪个命令是利用URL语法在命令行下工作的文件传输工具()
A:curl
B:tar -zxvf
C:mkdir
D:cp
正确答案问询微信:424329
PyMongo中的查找方法的参数是哪种数据结构()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
以下哪个HTML标签表示定义列表项目()
A:
B:
C:
D:
正确答案问询微信:424329
在Scrapy的目录下,哪个文件负责存放爬虫文件?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案问询微信:424329
如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值T都T应了一个集合,Key为集合的名字,Value就是一个()。
A:字典
B:集合的名字
C:集合
D:文档
正确答案问询微信:424329
采用以下()技术可以实现异步加载
A:HTML
B:AJAX
C:CSS
D:HTTP
正确答案问询微信:424329
requests获取get或者post请求后需要通过()属性获取文本内容
A:content
B:text
C:string
D:body
正确答案问询微信:424329
服务器端记录信息确定用户身份的数据是()
A:session
B:cookies
C:moonpies
D:localstorage
正确答案问询微信:424329
Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
下面代码一共执行循环多少次():
for i in range(10):
print(i ** i)
A:9
B:10
C:11
D:0
正确答案问询微信:424329
BeautifulSoup库采用lxml HTML解析器,使用方法是()
A:BeautifulSoup(markup,"html.parser")
B:BeautifulSoup(markup,"lxml")
C:BeautifulSoup(markup,"xml")
D:BeautifulSoup(markup,"h奥鹏南开大学新学期作业参考 代做2元一门tml5lib")
正确答案问询微信:424329
Scrapy自带的待爬队列是()
A:deque
B:queue
C:list
D:lqueue
正确答案问询微信:424329
执行下面代码,结果为():
name_list = []
if name_list and name_list[100] == '张三':
print('OK')
A:程序报F
B:OK
C:NULL
D:无输出
正确答案问询微信:424329
使用Xpath构造相同字符串开头的路径采用()方法
A:starts-with
B:starts
C:begin
D:begin-with
正确答案问询微信:424329
Python中open函数中模式参数的常用值哪个表示读写模式()
A:r
B:w
C:a
D:+
正确答案问询微信:424329
requests中post请求方法的第二个参数可以为()
A:字典
B:列表
C:json数据
D:字符串
正确答案问询微信:424329
使用Selenium获取多个元素的方法有()
A:find_element_by_id
B:find_element_by_name
C:find_elements_by_xpath
D:find_elements_by_tag_name
正确答案问询微信:424329
Selenium的Webdriver支持的浏览器有()
A:phantomjs
B:safari
C:chrome
D:ie
正确答案问询微信:424329
PyMongo删除操作有()
A:delete
B:delete_all
C:delete_one
D:delete_many
正确答案问询微信:424329
Xpah中下面例子name元素的先辈节点有():
xiao ming
36
A:user database
B:user
C:name
D:id
正确答案问询微信:424329
Python中正则表达式一般字符的有()
A:"."
B:""
C:"/"
D:"[…]"
正确答案问询微信:424329
Python中正则表达式数量词包括()
A:*
B:d
C:+
D:?
正确答案问询微信:424329
最常见的HTTP请求类型有()
A:GET
B:POST
C:SEND
D:RECEIVE
正确答案问询微信:424329
BS4可以用来从()中提取数据
A:HTML
B:XML
C:数据库
D:JSON
正确答案问询微信:424329
以下哪种方法是MongoDB的查找方法()
A:find
B:find_one
C:finds
D:find_all
正确答案问询微信:424329
如果元组里面只有整数、浮点数、字符串、一个列表,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。
A:对
B:错
正确答案问询微信:424329
Python中包含字典的列表页可以转换成JSON字符串
A:对
B:错
正确答案问询微信:424329
在使用多线程处理问题时,线程池设置越大越好
A:对
B:错
正确答案问询微信:424329
已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行
A:对
B:错
正确答案问询微信:424329
Python中正则表达式预定义字符s表示匹配任何非空白字符,等价于 [^ fnrtv]
A:对
B:错
正确答案问询微信:424329
cookies在http请求中是明文传输的。
A:对
B:错
正确答案问询微信:424329
Xpah中下面例子name元素是user的后代节点:
xiao ming
35
A:对
B:错
正确答案问询微信:424329
如果需要安装某个特定版本的Python,可以在终端中输入:
sudo install python3.5
A:对
B:错
正确答案问询微信:424329
关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性
A:对
B:错
正确答案问询微信:424329
类中的变量称为类的变量,专业术语为类的属性
A:对
B:错
正确答案问询微信:424329
Xpath中路径表达式base/user[1]表示选取属于base的子元素中第二个user元素
A:对
B:错
正确答案问询微信:424329
一般来说在页面都通过GET将用户登录信息传递到服务器端。
A:对
B:错
正确答案问询微信:424329
在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的
A:对
B:错
正确答案问询微信:424329
Python中将字符串a,b相加的方法是a+b
A:对
B:错
正确答案问询微信:424329
Xpath中路径表达式base//user表示选取属于base的子元素中所有user元素
A:对
B:错
正确答案问询微信:424329
Xpath中text()方法匹配的是显示文本信息
A:对
B:错
正确答案问询微信:424329
Python中正则表达式预定义字符d表示匹配一个非数字字符,等价于 [^0-9]
A:对
B:错
正确答案问询微信:424329
HTTP请求中GET方法就是填写表单或提交信息时所做的事情,如登录一个网址,使用的便是GET 方法。
A:对
B:错
正确答案问询微信:424329
通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
A:对
B:错
正确答案问询微信:424329
默认情况下,MongoDB可以通过外网访问
A:对
B:错
正确答案问询微信:424329