1.[单选题] ()可以解决图计算问题
A.Spark Core
B.BlinkDB
C.GraphX
D.Mllib
答:——C——
2.[单选题] 图结构中如果无重复的边或者顶点到自身的边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
答:——D——
3.[单选题] ()是Spark的核心,提供底层框架及核心支持
A.Spark Core
B.Spark SQL
C.Spark Streaming
D.Mllib
答:——A——
4.[单选题] 递归函数意味着函数可以调用它()
A.其他函数
B.主函数
C.子函数
D.自身
答:————
5.[单选题] 请问RDD的()操作是根据键对两个RDD进行内连接
A.join
B.zip
C.combineByKey
D.collect
答:————
6.[单选题] Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
A.window
B.countByWindow
C.reduceByWindow
D.reduceByKeyAndWindow
答:————
7.[单选题] Spark Streming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream 时,返回类型为(K,(V,W))键值对的一个新 DStream。
A.union
B.reduce
C.join
D.cogroup
答:————
8.[单选题] Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream
A.map
B.flatMap
C.filter
D.union
答:————
9.[单选题] 请问RDD的()操作用于将相同键的数据聚合
A.join
B.zip
C.combineByKey
D.collect
答:————
10.[单选题] RDD的()操作通常用来划分单词
A.filter
B.union
C.flatmap
D.mapPartitions
答:————
11.[单选题] Scala通过()来定义变量
A.val
B.val
C.define
D.def
答:————
12.[单选题] 下列Scala代码应输出():
var a=0;
var b=0
var sum=0;
for(a<-1 until 3; b<-1 until 3) {
sum+=a+b;
}
println(sum);
A.36
B.35
C.11
D.12
答:————
13.[单选题] MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树
A.trainClassifier
B.trainRegressor
C.LogisticRegressionModel
D.LabeledPoint
答:————
14.[单选题] 以下哪个不是Scala的数据类型()
A.AnyRef
B.Anything
C.NULL
D.Nothing
答:————
15.[单选题] Spark GraphX中类Graph的reverse方法可以()
A.反转图中所有边的方向
B.按照设定条件取出子图
C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D.合并边相同的属性
答:————
16.[单选题] 图结构中如果任意两个顶点之间都存在边,那么称之为()
A.完全图
B.有向完全图
C.无向图
D.简单图
答:————
17.[单选题] Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
答:————
18.[单选题] spark-submit配置项中()表示启动的executor数量
A.–num-executors NUM
B.–executor-memory MEM
C.–total-executor-cores NUM
D.–executor-coures NUM
答:————
19.[单选题] 以下算法中属于无监督学习算法的是()
A.KNN算法
B.逻辑回归
C.随机森林
D.Kmeans
答:————
20.[单选题] Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是()
A.filter
B.flatten
C.grouby
D.flatmap
答:————
21.[单选题] 以下哪个函数可以求两个RDD差集 ()
A.union
B.substract
C.intersection
D.cartesian
答:————南开答案q599792222 或请进 opzy.net
22.[单选题] Scala列表方法中通过给定的方法将所有元素重新计算的方法是()
A.filter
B.foreach
C.map
D.mkString
答:————
23.[单选题] Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法
A.Graph(vertices,edges, defaultVertexAttr)
B.Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C.Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D.GraphLoader.edgeListFile(sc,filename)
答:————
24.[单选题] 以下哪个函数可以求两个RDD交集 ()
A.union
B.substract
C.intersection
D.cartesian
答:————
25.[单选题] ()是Spark的数据挖掘算法库
A.Spark Core
B.BlinkDB
C.GraphX
D.Mllib
答:————
26.[多选题] Scala中使用()方法来查看两个集合的交集元素
A.Set.concat
B.Set.&
C.Set.&&
D.Set.intersect
答:————
27.[多选题] 以下哪个方法可以从集合中创建RDD()
A.parallelize
B.makeRDD
C.textFile
D.loadFile
答:————
28.[多选题] 以下是机器学习的常用算法的是()
A.回归算法
B.聚类算法
C.降维算法
D.分类算法
答:————
29.[多选题] Mllib实现了一些常见的机器学习算法和应用程序,包括()
A.分类
B.聚类
C.降维
D.回归
答:————
30.[多选题] Spark是一个()计算框架
A.快速
B.分布式
C.可扩展
D.容错
答:————
31.[多选题] MapReudce不适合()任务
A.大数据计算
B.迭代
C.交互式
D.离线分析
答:————
32.[多选题] Spark创建DataFrame对象方式有()
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
答:————
33.[多选题] Spark的RDD持久化操作有()方式
A.cache
B.presist
C.storage
D.long
答:————
34.[多选题] 以下哪个是Scala的数据类型()
A.Any
B.NULL
C.Nothing
D.AnyRef
答:————
35.[多选题] Spark中DataFrame的()方法是查询指定字段的数据信息
A.select
B.selectExpr
C.col
D.apply
答:————
36.[判断题] RDD的subtract用于用于将前一个RDD 中在后一个RDD 出现的元素删除
A.对
B.错
答:————
37.[判断题] RDD的map操作不会改变RDD的分区数目
A.对
B.错
答:————
38.[判断题] RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。
A.对
B.错
答:————
39.[判断题] Scala是一种纯面向对象的语言,每个值都是对象。
A.对
B.错
答:————
40.[判断题] MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。
A.对
B.错
答:————
41.[判断题] PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value进行Map操作
A.对
B.错
答:————
42.[判断题] RDD的filter过滤会将返回值为true的过滤掉
A.对
B.错
答:————
43.[判断题] Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
A.对
B.错
答:————
44.[判断题] Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
A.对
B.错
答:————
45.[判断题] Scala函数组合器可以通过一个函数重新计算列表中所有元素,没有返回值
A.对
B.错
答:————
46.[判断题] Scala在子类中重写超类的抽象方法时,需要使用override关键字
A.对
B.错
答:————
47.[判断题] RDD是一个可读写的数据结构
A.对
B.错
答:————
48.[判断题] Scala中创建一个方法时经常用void表示该方法无返回值
A.对
B.错
答:————
49.[判断题] RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。
A.对
B.错
答:————
50.[判断题] Spark Streming中Dstream是一种抽象的离散流
A.对
B.错
答:————