南开大学22秋学期《大数据开发技术（二）》在线作业二

奥鹏教育南开大学平时作业

22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（二）》在线作业-00002

Spark中DataFrame的（）方法是进行连接查询
A:where
B:join
C:limit
D:apply
正确答案获取微信：424329

在图结构中，每个元素都可以有（）前驱
A:至少一个
B:零个或多个
C:一个
D:零个
正确答案获取微信：424329

Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以（）
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案获取微信：424329

PairRDD中（）函数可以对具有相同键的值进行分组
A:mapValues
B:groupBy
C:groupByKey
D:reduceByKey
正确答案获取微信：424329

Spark中DataFrame的（）方法是进行条件查询
A:where
B:join
C:limit
D:apply
正确答案获取微信：424329

Scala函数组合器可以对集合中的元素进行分组操作，结果得到的是一个Map的方法是（）
A:filter
B:flatten
C:grouby
D:flatmap
正确答案获取微信：424329

在MLlib中，逻辑回归算法的输入值为（）类型
A:Double
B:LabledPoint
C:Point
D:SGB
正确答案获取微信：424329

Scala列表方法中丢弃前n个元素，并返回新列表的方法是（）
A:drop
B:head
C:filter
D:init
正确答案获取微信：424329

Graph类中如果要根据边数据创建图，边数据需要加载为二元组，可以选择是否对边分区，应该用（）方法
A:Graph(vertices,edges, defaultVertexAttr)
B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D:GraphLoader.edgeListFile(sc,filename)
正确答案获取微信：424329

Scala函数组合器可以把一个二维的列表展开成一个一维的列表的方法是（）
A:filter
B:flatten
C:grouby
D:flatmap
正确答案获取微信：424329

以下算法中属于聚类算奥鹏教育南开大学平时作业法的是（）
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案获取微信：424329

Scala通过（）来定义常量
A:val
B:val
C:define
D:def
正确答案获取微信：424329

Dstream窗口操作中（）方法返回基于滑动窗口的DStream中的元素的数量
A:window
B:countByWindow
C:reduceByWindow
D:reduceByKeyAndWindow
正确答案获取微信：424329

GraphX中graph.triplets可以得到（）
A:顶点视图
B:边视图
C:顶点与边的三元组整体视图
D:有向图
正确答案获取微信：424329

PairRDD的（）方法，可以把两个RDD中键相同的元素组合在一起，合并为一个RDD。
A:join
B:union
C:substract
D:intersection
正确答案获取微信：424329

当需要将一个普通的RDD转化为一个PairRDD时可以使用（）函数来进行操作
A:transfer
B:change
C:map
D:build
正确答案获取微信：424329

Spark Streming中（）函数可以合并两个DStream，生成一个包含两个DStream中所有元素的新DStream对象
A:map
B:flatMap
C:filter
D:union
正确答案获取微信：424329

MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法（）训练分类树
A:trainClassifier
B:trainRegressor
C:LogisticRegressionModel
D:LabeledPoint
正确答案获取微信：424329

请问RDD的（）操作用来计算RDD中所有元素个数
A:count
B:num
C:length
D:number
正确答案获取微信：424329

Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
A:第一个
B:所有
C:前10个
D:前100个
正确答案获取微信：424329

一般情况下，对于迭代次数较多的应用程序，Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的（）多倍
A:2
B:10
C:100
D:1000
正确答案获取微信：424329

递归函数意味着函数可以调用它（）
A:其他函数
B:主函数
C:子函数
D:自身
正确答案获取微信：424329

Mllib中metrics.fMeasureByThreshold
表示（）指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案获取微信：424329

Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是（）
A:filter
B:flatten
C:grouby
D:flatmap
正确答案获取微信：424329

GraphX中graph.edges可以得到（）
A:顶点视图
B:边视图
C:顶点与边的三元组整体视图
D:有向图
正确答案获取微信：424329

Spark SQL可以处理（）
A:RDD
B:Parquet文件
C:JSON文件
D:Hive表
正确答案获取微信：424329

Scala中使用（）方法来查看两个集合的交集元素
A:Set.concat
B:Set.&
C:Set.&&
D:Set.intersect
正确答案获取微信：424329

以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区（）
A:resetpartition
B:repartiton
C:Partition
D:coalesce
正确答案获取微信：424329

Scala支持（）
A:显式参数
B:隐式参数
C:转换
D:多态方法
正确答案获取微信：424329

Spark DataFrame中（）方法可以获取若干行数据
A:first
B:head
C:take
D:collect
正确答案获取微信：424329

Spark Streaming支持实时流式数据，包括（）
A:Web服务器日志文件
B:社交网络数据
C:实时交易数据
D:类似Kafka的信息数据
正确答案获取微信：424329

以下哪个方法可以创建RDD（）
A:parallelize
B:makeRDD
C:textFile
D:loadFile
正确答案获取微信：424329

MLlib中用于线性回归算法的包主要有（）
A:LinearRegressionWithSGD
B:RidgeRegressionWithSGD
C:LassoWithSGD
D:LeftRegression
正确答案获取微信：424329

Scala中使用（）方法来连接两个集合
A:append
B:++
C:concat
D:Set.++()
正确答案获取微信：424329

Spark DataFrame中（）方法可以返回一个List
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案获取微信：424329

Spark SQL包括基本的SQL语法和HiveQL语法
A:对
B:错
正确答案获取微信：424329

RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD ，但是转换操作是懒操作，不会立刻执行计算。
A:对
B:错
正确答案获取微信：424329

Scala 配备了一种表现型的系统，它以静态的方式进行抽象，以安全和连贯的方式进行使用。
A:对
B:错
正确答案获取微信：424329

Scala中高阶函数可以产生新的函数，并将新的函数作为返回值。
A:对
B:错
正确答案获取微信：424329

Spark只有键值对类型的RDD才能设置分区方式
A:对
B:错
正确答案获取微信：424329

Scala中++i和i++表示变量i自增1
A:对
B:错
正确答案获取微信：424329

Scala是一种纯面向对象的语言，每个值都是对象。
A:对
B:错
正确答案获取微信：424329

Spark Streming中DStream可以通过外部数据源（Kafka，Flume，Twitter等）来获取，也可以通过现有DStream的高级操作（Transformation操作）获得
A:对
B:错
正确答案获取微信：424329

Scala是不可扩展的
A:对
B:错
正确答案获取微信：424329

RDD是一个可读写的数据结构
A:对
B:错
正确答案获取微信：424329

Scala中Map 合并时会移除重复的 key
A:对
B:错
正确答案获取微信：424329

Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。
A:对
B:错
正确答案获取微信：424329

RDD中combineByKey不允许返回类型与输入数据类型不同的返回值
A:对
B:错
正确答案获取微信：424329

Scala中列表是可变的
A:对
B:错
正确答案获取微信：424329

Scala可以通过“var” 来定义变量，通过“val” 关键字来定义常量
A:对
B:错
正确答案获取微信：424329

提供优质的教育资源