欢迎光临
我们一直在努力

东大《大数据开发技术(一)》19秋期末考核【标准答案】

可做奥鹏国开全部院校作业论文!答案请添加qq:599792888 或 微信:1095258436

《大数据开发技术(一)》19秋期末考核-0001

 

一、单选题 (共 15 道试题,共 30 分)

1.UMP系通过()来实现实现数据路由的基本功能

A.愚公系统

B.Procy服务器

C.Controller服务器

D.Agent服务器

 

2.Amazon Redshift属于()

A.键值数据库

B.数据仓库

C.关系数据库

D.NoSQL数据库

 

3.应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()

A.键值数据库

B.文档数据库

C.图数据库

D.列族数据库

 

4.HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小

A.Zookeeper

B.Region

C.Master

D.Chubby

 

5.UMP系统中面对中等规模用户如何进行资源调度()

A.随机分配MySQL实例

B.每个用户独占一个MySQL实例

C.可以共享同一个MySQL实例

D.会占用多个独立的MySQL实例

 

6.以下亚马逊的产品中哪个是数据仓库

A.Redshift

B.RDS

C.ElastiCache

D.DynamoDB

 

7.UMP系统中面对多个小规模用户如何进行资源调度()

A.随机分配MySQL实例

B.每个用户独占一个MySQL实例

C.可以共享同一个MySQL实例

D.会占用多个独立的MySQL实例

 

8.关于Strom中Bolt说法错误的是()。

A.Bolt是一个被动的角色,Spout是一个主动的角色

B.Bolt是Streams的状态转换过程的抽象含义

C.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作

D.Bolt不仅可以处理Tuple还可以创建新的Tuple

 

9.优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是()

A.键值数据库

B.文档数据库

C.图数据库

D.列族数据库

 

10.应用于分布式数据存储与管理 数据在地理上分布于多个数据中心的应用程序的数据库是哪种()

A.键值数据库

B.文档数据库

C.图数据库

D.列族数据库

 

11.Hbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的()位置信息,用来加快后续数据访问过程

A.客户端

B.Slaver

C.Region

D.Master

 

12.以下亚马逊的产品中哪个是分布式内存缓存

A.Redshift

B.RDS

C.ElastiCache

D.DynamoDB

 

13.Hbase采用()作为底层数据存储

A.传统文件系统

B.Hbase

C.HDFS

D.GFS

 

14.关于Hadoop集群,以下说法错误的是()。

A.SecondaryNameNode可以和NameNode共用一台机器

B.SecondaryNameNode可以和DataNode共用一台机器

C.NameNode可以和JobTracker共用一台机器

D.JobTracker指派的任务由TaskTracker执行

 

15.Map Task和Reduce Task均由()启动。

A.Task Tracker

B.Task

C.Job Tracker

D.Client

 

二、多选题 (共 10 道试题,共 20 分)

16.HDFS中对名称节点设置了备份机制,会将名称节点中的()文件同步复制到备份服务器上。

A.FsImage

B.EditLog

C.DataNode

D.Block

 

17.以下图计算软件哪种属于以图顶点为中心的、基于消息传递批处理的并行引擎

A.Pregel

B.Hama

C.Giraph

D.DEX

 

18.以下哪种数据库属于NoSQL数据库()

A.MySQL

B.MongoDB

C.InfiniteGraph

D.DynamoDB

 

19.关系数据库与NoSQL数据库相比适用于哪些领域()

A.银行

B.电信

C.传统企业的数据分析

D.互联网企业大数据处理

 

20.以下哪种数据库是针对在线业务的,并且抛弃了关系模型()

A.Redis

B.Oracle

C.MySQL

D.MongoDB

 

21.分布式文件系统的设计目的包括()。

A.速度

B.并发控制

C.容错

D.可伸缩性

 

22.MapReduce的main函数中设置输出类型的方法有()。

A.setOutputValueClass

B.setOutputKeyClass

C.setOutputClass

D.setKeyValueClass

 

23.以下哪些是云计算关键技术()。

A.虚拟化

B.物联网

C.单租户

D.分布式计算

E.分布式存储

 

24.Pregel作为分布式图计算的计算框架,主要用于()

A.最短路径

B.图遍历

C.PageRank计算

D.MapReduce

 

25.以下哪个应用适合用Pregel来解决()

A.求极值

B.数据库的笛卡尔积

C.单元最短路径

D.二分匹配

 

三、判断题 (共 10 道试题,共 20 分)

26.分布式离线分析可以实现秒级别的实时分析响应。

 

27.Hadoop平台在大数据发展的成熟期时开始大行其道

 

28.Yahoo! S4和Twitter Storm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储

 

29.在HBase 的概念视图中, 一个表可以视为一个稀疏、多维的映射关系。

 

30.HBase中包含一个Region服务器和许多个Master服务器

 

31.HDFS读数据过程中读取请求获得的输入流是FSInputStream

 

32.Linux系统中只有Ubuntu可以安装Hadoop。

 

33.MapReduce处理分组聚合操作时,在Map过程中,选择关系的某一宇段的值作为键,其他字段的值作为与键相关联的值;Reduce过程,输出为<键,聚合运算结果〉。

 

34.Hbase和传统数据库一样都是列式数据库

 

35.在HBase中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在

 

四、主观填空题 (共 5 道试题,共 10 分)

36.MapReduce的main函数中添加MyMapper类的方法为job.##(MyMapper.class);

 

37.Storm运行任务的方式与Hadoop类似:Hadoop运行的是MapReduce作业,而Storm运行的是##

 

38.HDFS中SecondaryNameNode通过HTTP的##请求方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下;

 

39.SQL中的table对应与MongoDB中的##

 

40.所有的HDFS通信协议都是构建在##协议基础之上的

 

五、问答题 (共 2 道试题,共 8 分)

41.Hbase中Master的主要工作

 

42.试说明一个MapReduce程序在运行期间,所启动的Map任务数量和Reduce任务数量各是由什么因素决定的。

 

六、名词解释 (共 4 道试题,共 12 分)

43.Twitter Storm

 

44.Hbase中.META.表

 

45.数据库事务的原子性

 

46.Hadoop项目中的Pig

赞(0)
未经允许不得转载:奥鹏作业网 » 东大《大数据开发技术(一)》19秋期末考核【标准答案】

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址