南开大学23年春学期《网络爬虫技术》在线作业二
奥鹏南开大学新学期作业参考
23春学期(高起本:1709-2103、专升本/高起专:1909-2103)《网络爬虫技术》在线作业-00002
PyMongo中逻辑查询表示小于的符号是()
A:$gt
B:$lt
C:$gte
D:$lte
正确答案问询微信:424329
以下哪个HTML标签表示定义文档的主体()
A:
B:
C:
D:
正确答案问询微信:奥鹏南开大学新学期作业参考 代做2元一门424329
Python中正则表达式为字符集的是()
A:"."
B:""
C:"/"
D:"[…]"
正确答案问询微信:424329
如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
PyMongo中逻辑查询表示大于等于的符号是()
A:$gt
B:$lt
C:$gte
D:$lte
正确答案问询微信:424329
BeautifulSoup库使用唯一支持XML解析器的使用方法是()
A:BeautifulSoup(markup,"html.parser")
B:BeautifulSoup(markup,"lxml")
C:BeautifulSoup(markup,"xml")
D:BeautifulSoup(markup,"html5lib")
正确答案问询微信:424329
Pyhon中()方法可以将字符串替换
A:aplit
B:replace
C:strip
D:format
正确答案问询微信:424329
Pyhon中()方法可以将一个字符串分割为一个列表
A:aplit
B:replace
C:strip
D:format
正确答案问询微信:424329
Python中定义函数关键字为()
A:def
B:define
C:func
D:function
正确答案问询微信:424329
BS6的find_all()方法返回是一个()
A:集合
B:列表
C:Tag
D:元组
正确答案问询微信:424329
BeautifulSoup库采用Python标准库,使用方法是()
A:BeautifulSoup(markup,"html.parser")
B:BeautifulSoup(markup,"lxml")
C:BeautifulSoup(markup,"xml")
D:BeautifulSoup(markup,"html5lib")
正确答案问询微信:424329
以下哪个HTML标签表示分区或节()
A:
B:
C:
D:
正确答案问询微信:424329
如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值T都T应了一个集合,Key为(),Value就是一个集合。
A:字典
B:集合的名字
C:集合
D:文档
正确答案问询微信:424329
Python中for循环表达式
for item in iterable:
do
里item表示元素,iterable是()
A:表达式
B:结果
C:循环
D:集合
正确答案问询微信:424329
如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值T都T应了一个集合,Key为集合的名字,Value就是一个()。
A:字典
B:集合的名字
C:集合
D:文档
正确答案问询微信:424329
查看网站请求一般在Chrome开发者模式下的()选项卡中查看
A:Console
B:Sources
C:Network
D:Performance
正确答案问询微信:424329
通过()爬取伪装成异步加载的后端渲染数据
A:正则表达式
B:Json字符串
C:JavaScript
D:Get
正确答案问询微信:424329
浏览器用来记录用户状态信息的数据叫()
A:session
B:cookies
C:moonpies
D:selenium
正确答案问询微信:424329
在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案问询微信:424329
PyMongo中的查找方法的参数是哪种数据结构()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
PyMongo更新操作有()
A:update
B:update_all
C:update_one
D:update_many
正确答案问询微信:424329
针T解析源代码的BeautifulSoupT象,构造时BeautifulSoup(网页源代码, '解析器')中的解析器可以为()
A:html
B:html.parser
C:lxml
D:xml
正确答案问询微信:424329
Selenium的Webdriver支持的浏览器有()
A:phantomjs
B:safari
C:chrome
D:ie
正确答案问询微信:424329
常用的会话跟踪技术是()
A:session
B:cookies
C:moonpies
D:localstorage
正确答案问询微信:424329
网络爬虫的用途有()
A:收集数据
B:尽职调查
C:提高流量
D:攻击服务器
正确答案问询微信:424329
BeautifulSoup 库支持()解析器
A:Python标准库
B:lxml HTML解析器
C:lxml XML解析器
D:html5lib
正确答案问询微信:424329
Python中re模块的修饰符有()
A:re.I
B:re.N
C:re.M
D:re.S
正确答案问询微信:424329
Python中通过Key来从字典object中读取T应的Value的方法有()
A:object[key]
B:object.get(key)
C:object.pop(key)
D:object.pop()
正确答案问询微信:424329
Python中正则表达式边界匹配符号包括()
A:^
B:S
C:$
D:A
正确答案问询微信:424329
Xpah中下面例子user database元素的后代节点有():
xiao ming
35
A:user database
B:user
C:name
D:id
正确答案问询微信:424329
Scrapy的工程名字不能使用"scrapy",否则爬虫会无法运行。除此以外工程名不受限制。
A:对
B:错
正确答案问询微信:424329
Python中正则表达式边界匹配$表示匹配字符串开头
A:对
B:错
正确答案问询微信:424329
Xpath中contains方法匹配一个属性值中包含的字符串
A:对
B:错
正确答案问询微信:424329
登录MySQL需执行命令:mysql -u root -p
A:对
B:错
正确答案问询微信:424329
Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据;
A:对
B:错
正确答案问询微信:424329
MongoDB 是一个基于分布式文件存储的数据库
A:对
B:错
正确答案问询微信:424329
通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
A:对
B:错
正确答案问询微信:424329
需要登录的网站一般通过GET请求就可以实现登录。
A:对
B:错
正确答案问询微信:424329
Selenium必须加载T应的webdriver才能模拟浏览器访问
A:对
B:错
正确答案问询微信:424329
selenium使用driver.get()方法请求过后的网页源代码中有异步加载的信息
A:对
B:错
正确答案问询微信:424329
网络连接需要客户端一次Requests请求和服务器端的Response回应
A:对
B:错
正确答案问询微信:424329
所有的异步加载都会向后台发送请求
A:对
B:错
正确答案问询微信:424329
数据在MongoDB中以Key-Value的形式存储
A:对
B:错
正确答案问询微信:424329
通过在后台与服务器进行少量数据交换,AJAX可以使网页实现异步更新。
A:对
B:错
正确答案问询微信:424329
方法就是函数,方法是T实例进行使用的,所以又叫实例方法。
A:对
B:错
正确答案问询微信:424329
Scrapy作为一个爬虫的框架,它在单机环境下运行时就可以获得最大性能优势
A:对
B:错
正确答案问询微信:424329
_init_()方法在我们创造实例的时候,需要引用该方法才会被自动执行
A:对
B:错
正确答案问询微信:424329
如果需要安装某个特定版本的Python,可以在终端中输入:
sudo install python3.5
A:对
B:错
正确答案问询微信:424329
Python中语句结束不需要已分号结束,变量不需要提前定义
A:对
B:错
正确答案问询微信:424329
Hbase属于列存数据库
A:对
B:错
正确答案问询微信:424329