南开大学22秋学期《大数据开发技术（一）》在线作业二

奥鹏教育南开大学平时作业

22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（一）》在线作业-00002

UMP系通过()来实现实现管理每台物理机上的MySQL实例
A:Controller服务器
B:Procy服务器
C:愚公系统
D:Agent服务器
正确答案获取微信：424329

Storm框架不适用于哪个领域()。
A:实时分析
B:实时交通
C:远程RPC
D:历史记录查询
正确答案获取微信：424329

批处理系统关注(),流处理系统关注()。
A:吞吐率，延时
B:延时，吞吐率
C:延时，速度
D:速度，吞吐率
正确答案获取微信：424329

HBase的目标是处理非常庞大的表,可以通过()方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表
A:垂直扩展
B:水平扩展
C:拓扑扩展
D:叠加
正确答案获取微信：424329

名称节点和数据节点之间则使用()协议进行交互
A:名称节点
B:第二名称节点
C:数据节点
D:TCP
正确答案获取微信：424329

应用于存储、索引并管理面向文档的数据或者类似的半结构化数据,比如,用于后台具有大量读写操作的网站的数据库是哪种()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案获取微信：424329

Google Fusion Tables是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案获取微信：424329

HDFS中ClientProtocol的()方法通知名称节点关闭文件
A:close
B:finish
C:exit
D:complete
正确答案获取微信：424329

关于分布式并行编程,以下说法错误的是()。
A:“摩尔定律”，CPU性能大约每隔12个月翻一番
B:“摩尔定律”逐渐失效后，人们开始借助于分布式并行编程来提高程序性能
C:分布式程序运行在大规模计算机集群上，可以并行执行大规模数据处理任务，从而获得海量的计算能力
D:谷歌公司最先提出了分布式并行编程模型MapReduce
正确答案获取微信：424329

SQL Azure体系结构层中哪层是硬件和操作系统
A:Client Layer
B:Services Layer
C:Platform Layer
D:Infrastructure Layer
正确答案获取微信：424329

静态数据采取()计算模式
A:批量
B:实时
C:大数据
D:动态
正确答案获取微信：424329

以下哪种属于图数据库()
A:MongoDB
B:Redis
C:Hbase
D:Neo4j
正确答案获取微信：424329

Hadoop中执行MapReduce任务不含哪种方式()。
A:Mahout
B:Hadoop jar
C:Shell脚本
D:Python
正确答案获取微信：424329

Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。
A:ShuffleGrouping
B:AllGrouping
C:GlobalGrouping
D:FiedlsGrouping
正确答案获取微信：424329

行式数据库采用()存储模型
A:NSM
B:DSM
C:Hbase
D:MySQL
正确答案获取微信：424329

Pregel计算模型中每个顶点ID的类型是()
A:String
B:Int
C:Double
D:结构体
正确答案获取微信：424329

HDFS中FSDataInputStream封装了()
A:HDFSInputStream
B:DFSInputStream
C:DataInputStream
D:FSInputStream
正确答案获取微信：424329

HDFS中NameNode将从SecondaryNameNode接收到的新的FsImage替换旧的FsImage文件,同时将edit.new替换##文件
A:edit
B:edit.old
C:FsImage
D:EditLog
正确答案获取微信：424329

针对流数据,“量子恒道”开发了海量数据实时流计算框架()。
A:Time Tunnel
B:Spark
C:Super Mario
D:Storm
正确答案获取微信：424329

Hbase中()文件记录了-ROOT-表的位置
A:Master
B:Region
C:Zookeeper
D:Chubby
正确答案获取微信：424329

以下针对Hive的说法不正确的是()。
A:Hive是一个基于Hadoop的数据仓库工具
B:Hive是关系数据库
C:Hive QL是一种查询语言
D:Hive可以提供查询分析存储等功能
正确答案获取微信：424329

R是哪种可视化工具()
A:信息图表
B:地图工具
C:时间线工具
D:分析工具
正确答案获取微信：424329

优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活
提供嵌入式文档功能的数据库是()
A:列族数据库
B:键值数据库
C:图数据库
D:文档数据库
正确答案获取微信：424329

信息技术发展史上的第三次信息化浪潮解决的问题是什么()。
A:信息处理
B:信息增长
C:信息爆炸
D:信息传输
正确答案获取微信：424329

Hbase中-ROOT-表有()个Region
A:1
B:10
C:10-1000
D:0
正确答案获取微信：424329

UMP系统中面对分库分表用户如何进行资源调度()
A:可以共享同一个MySQL实例
B:每个用户独占一个MySQL实例
C:会占用多个独立的MySQL实例
D:随机分配MySQL实例
正确答案获取微信：424329

HDFS读数据过程中()具体实现了FileSystem
A:DistributedFileSystem
B:GFSSystem
C:FileSystem
D:HDFSSystem
正确答案获取微信：424329

Hbase在寻址过程客户端只需询问Zookeeper服务器,不需要链接()
A:Master
B:Region
C:Zookeeper
D:Chubby
正确答案获取微信：424329

以下亚马逊的产品中哪个是分布式内存缓存
A:ElastiCache
B:RDS
C:DynamoDB
D:Redshift
正确答案获取微信：424329

()可解决HDFS中名称节点运行期间EditLog不断变大的问题
A:NameNode
B:SecondaryNameNode
C:DataNode
D:Block
正确答案获取微信：424329

以下哪种数据库属于NoSQL数据库()
A:MySQL
B:DynamoDB
C:InfiniteGraph
D:MongoDB
正确答案获取微信：424329

流计算系统的需求有()。
A:实时性
B:廉价
C:高性能
D:高带宽
E:分布式
正确答案获取微信：424329

以下说法正确的是()。
A:Kafka是一种高吞吐量的分布式发布订阅消息系统
B:Spark是并行框架
C:Pig是一个基于Hadoop的大规模数据计算平台
D:Storm是一种流计算框架
正确答案获取微信：424329

关系数据库与NoSQL数据库相比适用于哪些领域()
A:电信
B:银行
C:互联网企业大数据处理
D:传统企业的数据分析
正确答案获取微信：奥鹏教育南开大学平时作业424329

以下亚马逊的产品中哪个属于存储部分
A:EC2
B:EBS
C:S3
D:ELB
正确答案获取微信：424329

关于Map端Shuffle过程中的合并与归并,说法正确的是()。
A:两个键值对和，如果合并，会得到
B:合并不会改变最终结果
C:两个键值对和，如果归并，会得到
D:两个键值对和，如果归并，会得到>
正确答案获取微信：424329

HDFS的命名空间包含()
A:节点
B:目录
C:文件
D:块
正确答案获取微信：424329

以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎
A:Giraph
B:Pregel
C:Hama
D:DEX
正确答案获取微信：424329

以下哪种数据库属于NoSQL数据库()
A:MongoDB
B:Oracle
C:Neo4j
D:Redis
E:Hbase
正确答案获取微信：424329

Hadoop集群的整体性能取决于哪些性能间的平衡
A:CPU
B:GPU
C:内存
D:存储
E:网络
正确答案获取微信：424329

数据实时计算阶段对采集的数据进行实时的分析和计算。流处理系统接收数据采集系统不断发来的实时数据,实时地进行分析计算,不需要反馈实时结果。
A:对
B:错
正确答案获取微信：424329

传统的数据处理流程,需要先采集数据并存储在关系数据库等数据管理系统中,之后由用户通过查询操作和数据管理系统进行交互
A:对
B:错
正确答案获取微信：424329

图算法如果用MapReduce实现,需要一系列的MapReduce的调用。从一个阶段到下一个阶段,它需要传递整个图的状态,会产生大量不必要的序列化和反序列化开销。而Pregel使用超步简化了这个过程
A:对
B:错
正确答案获取微信：424329

Ambari通过Web进行Hadoop集群的管理配置。
A:对
B:错
正确答案获取微信：424329

HBase只有一个索引——行键,通过巧妙的设计,HBase中的所有访问方法,或者通过行键访问,或者通过行键扫描,从而使得整个系统不会慢下来
A:对
B:错
正确答案获取微信：424329

Hadoop可以在单节点上以伪分布式的方式运行,Hadoop进程以分离的Java进程来运行,节点既作为NameNode也作为DataNode,同时,读取的是HDFS中的文件。
A:对
B:错
正确答案获取微信：424329

HDFS 在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。
A:对
B:错
正确答案获取微信：424329

数据产生方式的用户原创内容阶段的数据产生方式是主动的。
A:对
B:错
正确答案获取微信：424329

大数据计算处理方法主要分为两种方法,即批处理方法和流处理方法。
A:对
B:错
正确答案获取微信：424329

Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储
A:对
B:错
正确答案获取微信：424329

提供优质的教育资源