南开大学23年春学期《网络爬虫技术》在线作业二

奥鹏南开大学新学期作业参考

23春学期（高起本：1709-2103、专升本/高起专：1909-2103）《网络爬虫技术》在线作业-00002

PyMongo中逻辑查询表示小于的符号是（）
A:$gt
B:$lt
C:$gte
D:$lte
正确答案问询微信：424329

以下哪个HTML标签表示定义文档的主体（）
A:
B:
C:
D:
正确答案问询微信：奥鹏南开大学新学期作业参考代做2元一门424329

Python中正则表达式为字符集的是（）
A:"."
B:""
C:"/"
D:"[…]"
正确答案问询微信：424329

如果使用Python的数据结构来做类比的话，MongoDB中文档相当于一个()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信：424329

PyMongo中逻辑查询表示大于等于的符号是（）
A:$gt
B:$lt
C:$gte
D:$lte
正确答案问询微信：424329

BeautifulSoup库使用唯一支持XML解析器的使用方法是()
A:BeautifulSoup(markup,"html.parser")
B:BeautifulSoup(markup,"lxml")
C:BeautifulSoup(markup,"xml")
D:BeautifulSoup(markup,"html5lib")
正确答案问询微信：424329

Pyhon中（）方法可以将字符串替换
A:aplit
B:replace
C:strip
D:format
正确答案问询微信：424329

Pyhon中（）方法可以将一个字符串分割为一个列表
A:aplit
B:replace
C:strip
D:format
正确答案问询微信：424329

Python中定义函数关键字为（）
A:def
B:define
C:func
D:function
正确答案问询微信：424329

BS6的find_all()方法返回是一个（）
A:集合
B:列表
C:Tag
D:元组
正确答案问询微信：424329

BeautifulSoup库采用Python标准库，使用方法是()
A:BeautifulSoup(markup,"html.parser")
B:BeautifulSoup(markup,"lxml")
C:BeautifulSoup(markup,"xml")
D:BeautifulSoup(markup,"html5lib")
正确答案问询微信：424329

以下哪个HTML标签表示分区或节（）
A:
B:
C:
D:
正确答案问询微信：424329

如果使用Python的数据结构来做类比的话，MongoDB中库相当于一个大字典，大字典里面的每一个键值T都T应了一个集合，Key为（），Value就是一个集合。
A:字典
B:集合的名字
C:集合
D:文档
正确答案问询微信：424329

Python中for循环表达式
for item in iterable:
do
里item表示元素，iterable是（）
A:表达式
B:结果
C:循环
D:集合
正确答案问询微信：424329

如果使用Python的数据结构来做类比的话，MongoDB中库相当于一个大字典，大字典里面的每一个键值T都T应了一个集合，Key为集合的名字，Value就是一个（）。
A:字典
B:集合的名字
C:集合
D:文档
正确答案问询微信：424329

查看网站请求一般在Chrome开发者模式下的（）选项卡中查看
A:Console
B:Sources
C:Network
D:Performance
正确答案问询微信：424329

通过（）爬取伪装成异步加载的后端渲染数据
A:正则表达式
B:Json字符串
C:JavaScript
D:Get
正确答案问询微信：424329

浏览器用来记录用户状态信息的数据叫（）
A:session
B:cookies
C:moonpies
D:selenium
正确答案问询微信：424329

在Scrapy的目录下，哪个文件负责存放爬虫的各种配置信息？（）
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案问询微信：424329

PyMongo中的查找方法的参数是哪种数据结构（）
A:列表
B:元组
C:字典
D:集合
正确答案问询微信：424329

PyMongo更新操作有（）
A:update
B:update_all
C:update_one
D:update_many
正确答案问询微信：424329

针T解析源代码的BeautifulSoupT象，构造时BeautifulSoup(网页源代码, '解析器')中的解析器可以为（）
A:html
B:html.parser
C:lxml
D:xml
正确答案问询微信：424329

Selenium的Webdriver支持的浏览器有（）
A:phantomjs
B:safari
C:chrome
D:ie
正确答案问询微信：424329

常用的会话跟踪技术是（）
A:session
B:cookies
C:moonpies
D:localstorage
正确答案问询微信：424329

网络爬虫的用途有（）
A:收集数据
B:尽职调查
C:提高流量
D:攻击服务器
正确答案问询微信：424329

BeautifulSoup 库支持（）解析器
A:Python标准库
B:lxml HTML解析器
C:lxml XML解析器
D:html5lib
正确答案问询微信：424329

Python中re模块的修饰符有（）
A:re.I
B:re.N
C:re.M
D:re.S
正确答案问询微信：424329

Python中通过Key来从字典object中读取T应的Value的方法有（）
A:object[key]
B:object.get(key)
C:object.pop(key)
D:object.pop()
正确答案问询微信：424329

Python中正则表达式边界匹配符号包括（）
A:^
B:S
C:$
D:A
正确答案问询微信：424329

Xpah中下面例子user database元素的后代节点有（）：

xiao ming
35

A:user database
B:user
C:name
D:id
正确答案问询微信：424329

Scrapy的工程名字不能使用"scrapy"，否则爬虫会无法运行。除此以外工程名不受限制。
A:对
B:错
正确答案问询微信：424329

Python中正则表达式边界匹配$表示匹配字符串开头
A:对
B:错
正确答案问询微信：424329

Xpath中contains方法匹配一个属性值中包含的字符串
A:对
B:错
正确答案问询微信：424329

登录MySQL需执行命令：mysql -u root -p
A:对
B:错
正确答案问询微信：424329

Python中列表生成以后还可以往里面继续添加数据，也可以从里面删除数据；
A:对
B:错
正确答案问询微信：424329

MongoDB 是一个基于分布式文件存储的数据库
A:对
B:错
正确答案问询微信：424329

通用搜索引擎大多提供基于关键字的检索，难以支持根据语义信息提出的查询。
A:对
B:错
正确答案问询微信：424329

需要登录的网站一般通过GET请求就可以实现登录。
A:对
B:错
正确答案问询微信：424329

Selenium必须加载T应的webdriver才能模拟浏览器访问
A:对
B:错
正确答案问询微信：424329

selenium使用driver.get()方法请求过后的网页源代码中有异步加载的信息
A:对
B:错
正确答案问询微信：424329

网络连接需要客户端一次Requests请求和服务器端的Response回应
A:对
B:错
正确答案问询微信：424329

所有的异步加载都会向后台发送请求
A:对
B:错
正确答案问询微信：424329

数据在MongoDB中以Key-Value的形式存储
A:对
B:错
正确答案问询微信：424329

通过在后台与服务器进行少量数据交换，AJAX可以使网页实现异步更新。
A:对
B:错
正确答案问询微信：424329

方法就是函数，方法是T实例进行使用的，所以又叫实例方法。
A:对
B:错
正确答案问询微信：424329

Scrapy作为一个爬虫的框架，它在单机环境下运行时就可以获得最大性能优势
A:对
B:错
正确答案问询微信：424329

_init＿()方法在我们创造实例的时候，需要引用该方法才会被自动执行
A:对
B:错
正确答案问询微信：424329

如果需要安装某个特定版本的Python，可以在终端中输入：
sudo install python3.5
A:对
B:错
正确答案问询微信：424329

Python中语句结束不需要已分号结束，变量不需要提前定义
A:对
B:错
正确答案问询微信：424329

Hbase属于列存数据库
A:对
B:错
正确答案问询微信：424329

提供优质的教育资源