欢迎光临
我们一直在努力

南开19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业【满分答案】

可做奥鹏国开全部院校作业论文!答案请添加qq:599792888 或 微信:1095258436

19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业-0001

试卷总分:100    得分:0

一、 单选题 (共 30 道试题,共 60 分)

1.优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是()

A.列族数据库

B.键值数据库

C.图数据库

D.文档数据库

 

 

2.以下哪种属于图数据库()

A.MongoDB

B.Redis

C.Hbase

D.Neo4j

 

 

3.Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。

A.ShuffleGrouping

B.AllGrouping

C.GlobalGrouping

D.FiedlsGrouping

 

 

4.以下哪个是HDFS的局限性()。

A.吞吐率

B.数据集

C.兼容性

D.延迟

 

 

5.Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。

A.ShuffleGrouping

B.AllGrouping

C.GlobalGrouping

D.FiedlsGrouping

奥鹏在线离线论文作业答案代做请添加:opzy666

 

6.以下说法不正确的是()。

A.Zookeeper提供分布式锁之类的基本服务

B.Mahout提供了分布式存储服务

C.Flume提供了日志管理服务

D.Sqoop主要被用于数据交互操作

 

 

7.MapReduce将输入文件切分成M个分片,Master将其中()个分片分给处于空闲状态的N个Worker来处理。

A.M

B.N

C.M-1

D.N-1

 

 

8.Hbase中Zookeeper文件记录了()的位置

A..META.表

B.-ROOT-表

C.Region

D.Master

 

 

9.Amazon SimpleDB属于()

A.关系数据库

B.键值数据库

C.NoSQL数据库

D.数据仓库

 

 

10.UMP系统的哪个功能实现了负载均衡()

A.读写分离

B.资源隔离

C.资源调度

D.可扩展

 

 

11.在Storm的工作流程中,对于Supervisor说法错误的是()。

A.Supervisor会去Zookeeper集群上认领自己的Task

B.Supervisor节点首先将提交的Topology进行分片,分成一个个Task,分配给相应的Nimbus

C.Supervisor会将Task和相关的信息提交到Zookeeper集群上

D.Supervisor会通知自己的Worker进程进行Task的处理

 

 

12.HDFS中FSDataInputStream封装了()

A.HDFSInputStream

B.DFSInputStream

C.DataInputStream

D.FSInputStream

 

 

13.Storm中如果要保证相同字段的Tuple分配到同一个Task中,应该采用哪种Stream Groupings()。

A.ShuffleGrouping

B.AllGrouping

C.GlobalGrouping

D.FiedlsGrouping

 

 

14.关于Hadoop集群网络拓扑,以下说法错误的是()。

A.普通的Hadoop集群结构由一个两阶网络构成

B.Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器

C.在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和

D.一般来说机架内部网络环境比机架间网络环境好

 

 

15.列式数据库采用()存储模型

A.NSM

B.DSM

C.Hbase

D.MySQL

 

 

16.以下亚马逊的产品中哪个是NoSQL数据库

A.RDS

B.SimpleDB

C.DynamoDB

D.Redshift

 

 

17.UMP系统中面对分库分表用户如何进行资源调度()

A.可以共享同一个MySQL实例

B.每个用户独占一个MySQL实例

C.会占用多个独立的MySQL实例

D.随机分配MySQL实例

奥鹏在线离线论文作业答案代做请添加:opzy666

 

18.Hbase中Zookeeper可以帮助选举出一个()作为集群的总管

A.Master

B.Slaver

C.Region

D.客户端

 

 

19.Amazon RDS属于()

A.关系数据库

B.键值数据库

C.NoSQL数据库

D.数据仓库

 

 

20.Hadoop启动所有进程的命令为()。

A.all-start.sh

B.all-start.exe

C.start-all.sh

D.start-all.exe

 

 

21.信息技术发展史上的第三次信息化浪潮解决的问题是什么()。

A.信息处理

B.信息增长

C.信息爆炸

D.信息传输

 

 

22.以下亚马逊的产品中哪个是键值数据库

A.RDS

B.SimpleDB

C.DynamoDB

D.Redshift

 

 

23.以下属于Hadoop2.0的特性是()。

A.MapReduce

B.HDFS

C.YARN

D.SPARK

 

 

24.Xtimeline是哪种可视化工具()

A.信息图表

B.地图工具

C.时间线工具

D.分析工具

 

 

25.很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据就是()数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对企业有价值的信息。

A.动态

B.存量

C.实时

D.静态

奥鹏在线离线论文作业答案代做请添加:opzy666

 

26.MapReduce处理关系的()运算时,Map过程需要记录元组的信息及该元组来源。

A.投影

B.差

C.交

D.并

 

 

27.以下哪种属于键值数据库()

A.MongoDB

B.Redis

C.Hbase

D.Neo4j

 

 

28.UMP系统借助于()来实现高效和可靠的协同工作

A.Mnesia

B.LVS

C.RabbitMQ

D.Zookeeper

 

 

29.Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings()。

A.ShuffleGrouping

B.AllGrouping

C.GlobalGrouping

D.FiedlsGrouping

 

 

30.关于Hadoop集群,以下说法错误的是()。

A.SecondaryNameNode可以和NameNode共用一台机器

B.JobTracker指派的任务由TaskTracker执行

C.SecondaryNameNode可以和DataNode共用一台机器

D.NameNode可以和JobTracker共用一台机器

 

 

二、 多选题 (共 10 道试题,共 20 分)

1.以下哪个是HDFS的局限性()。

A.延迟高

B.只允许对文件执行追加操作,不能执行随机写操作

C.用MapReduce处理大量小文件时,会产生过多的Map任务,线程管理开销会大大增加

D.拥有复杂的数据模型

 

 

2.以下哪种数据库属于NoSQL数据库()

A.SimpleDB

B.BigTable

C.MongoDB

D.GraphDB

 

 

3.以下哪个不是云数据库的特点

A.高可扩展性

B.高可用性

C.支持资源有效分发

D.本地存储

 

 

4.Hbase的Region服务器中用户数据首先被写入到()

A.MemStore

B.Hlog

C.StoreFile

D.客户端

奥鹏在线离线论文作业答案代做请添加:opzy666

 

5.以下亚马逊的产品中哪个属于存储部分

A.EC2

B.EBS

C.S3

D.ELB

 

 

6.HDFS中NameNode保存的核心数据结构是()

A.FsImage

B.DataNode

C.Block

D.EditLog

 

 

7.以下哪些是数据可视化信息图表工具()

A.大数据魔镜

B.D3

C.Google Chart API

D.Google Fusion Tables

 

 

8.NoSQL数据库与关系数据库相比有哪些优势()

A.支持事务ACID四性

B.可以支持超大规模数据存储

C.以完善的关系代数理论作为基础

D.具有强大的横向扩展能力

 

 

9.MapReduce与传统并行计算框架的对比中,说法正确的是()。

A.MapReduce属于共享式集群架构,容错性好

B.传统并行计算框架比MapReduce硬件更加便宜

C.传统并行计算框架适用于实时、细粒度计算

D.MapReduce适用于数据密集型,传统并行计算框架适用于计算密集型

 

 

10.HDFS的命名空间包含()

A.节点

B.目录

C.文件

D.块

 

 

三、 判断题 (共 10 道试题,共 20 分)

1.NoSQL数据库可以完全取代关系数据库

A.对

B.错

 

 

2.HDFS中的NameNode的操作日志文件EditLog中记录了所有针对文件的创建、删除、重命名等操作

A.对

B.错

 

 

3.MapReduce和Spark都属于大数据批处理计算的产品。

A.对

B.错

 

 

4.大数据开发的两大核心技术是Hadoop和MapReduce

A.对

B.错

 

 

5.Hbase中缓存刷新,每次刷写都生成一个新的StoreFile文件,因此,每个Store包含多个StoreFile文件

A.对

B.错

奥鹏在线离线论文作业答案代做请添加:opzy666

 

6.HDFS集群中的数据节点一般是一个节点运行多个数据节点进程,负责处理文件系统客户端的读/写请求。

A.对

B.错

 

 

7.大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高的延迟

A.对

B.错

 

 

8.亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层

A.对

B.错

 

 

9.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记

A.对

B.错

 

 

10.感知式系统的广泛使用 人类社会数据量第三次大的飞跃最终导致了大数据的产生。

A.对

B.错

赞(0)
未经允许不得转载:奥鹏作业网 » 南开19秋学期(1709、1803、1809、1903、1909)《大数据开发技术(一)》在线作业【满分答案】

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址