南开大学22秋学期《大数据开发技术(二)》在线作业一

奥鹏教育南开大学平时作业

南开大学22秋学期《大数据开发技术(二)》在线作业一插图

22秋学期(高起本1709-1803、全层次1809-2103)《大数据开发技术(二)》在线作业-00001

GraphX中graph.edges可以得到()
A:顶点视图
B:边视图
C:顶点与边的三元组整体视图
D:有向图
正确答案获取微信:424329

请问RDD的()操作把RDD 所有元素转换成数组并返回到Driver 端
A:join
B:zip
C:combineByKey
D:collect
正确答案获取微信:424329

图的结构通常表示为:G(V,E),其中,E是图G中()
A:顶点
B:顶点的集合
C:边
D:边的集合
正确答案获取微信:424329

GraphX中()方法可以释放边缓存
A:cache
B:presist
C:unpersistVertices
D:edges.unpersist
正确答案获取微信:424329

Dstream输出操作中()方法将DStream中的内容以文本的形式保存为文本文件
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案获取微信:424329

Dstream窗口操作中()方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的Dstream
A:window
B:countByWindow
C:reduceByWindow
D:reduceByKeyAndWindow
正确答案获取微信:424329

以下哪个函数可以求两个RDD交集 ()
A:union
B:substract
C:intersection
D:cartesian
正确答案获取微信:424329

Spark GraphX中类Graph的joinVertices方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案获取微信:424329

spark-submit配置项中()表示Driver程序使用的内存大小
A:–driver-memory MEM
B:–executor-memory MEM
C:–total-executor-cores NUM
D:–executor-coures NUM
正确答案获取微信:424329

Scala列表方法中输出符号指定条件的所有元素的方法是()
A:drop
B:head
C:filter
D:init
正确答案获取微信:424329

一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的()多倍
A:2
B:10
C:100
D:1000
正确答案获取微信:424329

以下哪个函数可以求两个RDD的笛卡尔积()
A:union
B:substract
C:intersection
D:cartesian
正确答案获取微信:424329

RDD的()操作通常用来划分单词
A:filter
B:union
C:flatmap
D:mapPartitions
正确答案获取微信:424329

GraphX中graph.vertices可以得到()
A:顶点视图
B:边视图
C:顶点与边的三元组整体视图
D:有向图
正确答案获取微信:424329

spark-submit配置项中()表示executor使用的总核数
A:–num-executors NUM
B:–executor-memory MEM
C:–total-executor-cores NUM
D:–executor-coures NUM
正确答案获取微信:424329

Mllib中metrics.fMeasureByThreshold
表示()指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案获取微信:424329

Scala列表方法中通过给定的方法将所有元素重新计算的方法是()
A:filter
B:foreach
C:map
D:mkString
正确答案获取微信:424329

()是Spark的核心,提供底层框架及核心支持
A:Spark Core
B:Spark SQL
C:Spark Streaming
D:Mllib
正确答案获取微信:424329

Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案获取微信:424329

Spark Streming中()函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的Dstream
A:map
B:flatMap
C:filter
D:union
正确答案获取微信:424329

Mllib中线性会馆算法中的参数numIterations表示()
A:要运行的迭代次数
B:梯度下降的步长
C:是否给数据加干扰特征或者偏差特征
D:Lasso 和ridge 的正规化参数
正确答案获取微信:424329

GraphX中()方法可以查询顶点个数
A:numVertices
B:numEdges
C:vertices
D:edges
正确答案获取微信:424329

图的结构通常表示为:G(V,E),其中,G表示()
A:图
B:子图
C:顶点
D:边
正确答案获取微信:424329

Scala中()方法返回一个列表,包含除了第一个元素之外的其他元素
A:head
B:init
C:tail
D:last
正确答案获取微信:424329

Dstream输出操作中()方法在Driver中打印出DStream中数据的前10个元素。
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案获取微信:424329

Scala函数支持()
A:递归函数
B:高阶函数
C:柯里化
D:匿名函数
正确答案获取微信:424329

Scala中使用() 方法来连接两个集合
A:append
B:++
C:concat
D:Set.++()
正确答案获取微信:424329

以下哪个是Scala的数据类型()
A:Any
B:NULL
C:Nothing
D:AnyRef
正确答案获取微信:424329

Scala支持()
A:显式参数
B:隐式参数
C:转换
D:多态方法
正确答案获取微信:424329

Mllib实现了一些常见的机器学习算法和应用程序,包括()
A:分类
B:聚类
C:降维
D:回归
正确答案获取微信:424329

以下是机器学习的常用算法的是()
A:回归算法
B:聚类算法
C:降维算法
D:分类算法
正确答案获取微信:424329

Scala中构造列表的两个基本单位是 ()
A:Nil
B:Nill
C:::
D:List
正确答案获取微信:424329

Spark DataFrame中()方法可以返回一个List
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案获取微信:424329

Spark SQL读取的数据源支持()
A:Hive表
B:Parquent文件
C:JSON数据
D:关系数据库
正确答案获取微信:424329

以下算法中属于分类算法的是()
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案获取微信:424329

PairRDD中groupByKey是对具有相同键的值进行分组
A:对
B:错
正确答案获取微信:424329

Spark Streming中DStream可以通过外部数据源(Kafka,Flume,Twitter等)来获取,也可以通过现有DStream的高级操作(Transformation操作)获得
A:对
B:错
正确答案获取微信:424329

聚类是一种无监督学习的方法,用于将高度相似的数据分到一类中
A:对
B:错
正确答案获取微信:424329

图(Graph)是一种复杂的非线性结构
A:对
B:错
正确答案获取微信:424329

RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。
A:对
B:错
正确答案获取微信:424329

Spark RDD 是惰性求值的, 如果需要对一个RDD 多次使用,那么调用行动操作时每次都需要重复计算RDD 以及它的依赖。
A:对
B:错
正确答案获取微信:424329

RDD中zip操作要求两个RDD的partition数量以及元素数量都相同
A:对
B:错
正确答案获取微信:424329

Dstream输出操作中foreachRDD的正确用法是使用rdd.foreachPartition方法创建一个单独的连接对象,然后使用该连接对象输出所有RDD分区中的数据到外部系统
A:对
B:错
正确答案获取微信:424329

Scala 列表与数组非常相似,列表奥鹏教育南开大学平时作业的所有元素可具有不同的类型。
A:对
B:错
正确答案获取微信:424329

Scala函数组合器中groupBy是对集合中的元素进行分组操作,结果得到的是一个Map
A:对
B:错
正确答案获取微信:424329

Scala 配备了一种表现型的系统,它以静态的方式进行抽象,以安全和连贯的方式进行使用。
A:对
B:错
正确答案获取微信:424329

Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
A:对
B:错
正确答案获取微信:424329

Scala是一种纯面向对象的语言,每个值都是对象。
A:对
B:错
正确答案获取微信:424329

Scala中元组是是一种可迭代的键值对(key/value)结构。
A:对
B:错
正确答案获取微信:424329

RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
A:对
B:错
正确答案获取微信:424329

提供优质的教育资源

公众号: 超前自学网