1.[单选题] 第一个提出大数据概念的公司是( )。
A.麦肯锡公司
B.谷歌公司
C.微软公司
D.脸谱公司
答:——A——
2.[单选题] 数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
答:——B——
3.[单选题] 下列不属于Google云计算平台技术架构的是()
A.并行数据处理MapReduce
B.分布式锁Chubby
C.结构化数据表BigTable
D.弹性云计算EC2
答:——D——
4.[单选题] 以下不是数据仓库基本特征的是()
A.数据仓库是面向主题的
B.数据仓库是面向事务的
C.数据仓库的数据是相对稳定的
D.数据仓库的数据是反映历史变化的
答:————
5.[单选题] SAN是一种()
A.存储设备
B.专为数据存储而设计构建的网络
C.光纤交换机
D.HBA
答:————
6.[单选题] 购物篮问题是##的典型案例
A.数据变换
B.关联规则挖掘
C.数据分类
答:————
7.[单选题] 以下哪项不是数据可视化工具的特性()
A.实时性
B.简单操作
C.更丰富的展现
D.仅需一种数据支持方式即可
答:————
8.[单选题] 用于描述相等时间间隔下连续数据随时间变化趋势的是()
A.折线图
B.散点图
C.条形图
D.饼图
答:————
9.[单选题] IaaS是()的简称
A.软件即服务
B.平台即服务
C.基础设施即服务
D.硬件即服务
答:————
10.[单选题] 大数据的特点不包含
A.数据体量大
B.价值密度高
C.处理速度快
D.数据不统一
答:————
11.[单选题] 数据仓库是随着时间变化的,下列不正确的是()
A.数据仓库随时间变化不断增加新内容
B.捕捉到的新数据会覆盖原来的快照
C.数据仓库随事件变化不断删去旧的数据内容
D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合
答:————
12.[单选题] 基础设施即服务的英文简称是
A.IaaS
B.PaaS
C.SaaS
答:————
13.[单选题] MapReduce中的Map和Reduce函数使用()进行输入输出
A.key/value对
B.随机数值
C.其他计算结果
答:————
14.[单选题] 医疗健康数据的基本情况不包括以下哪项?
A.诊疗数据
B.个人健康管理数据
C.公共安全数据
D.健康档案数据
答:————
15.[单选题] 下列哪个工具常用来开发移动友好地交互地图()
A.Leaflet
B.Visual.ly
C.BPizza Pie Charts
D.Gephi
答:————
16.[多选题] 开放云()
A.价值呈现:大数据应用价值呈现和创新不足
B.应用建设:周期长、门槛高、多冗余、体验差
C.组织流程:应用跨部门,缺乏流程贯串和使能业务生产
D.生态建设:无法有效构建和融入新的数字生态圈
答:————
17.[多选题] 医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()
A.多态性
B.时效性
C.不完整性
D.冗余性
答:————
18.[多选题] 数据清洗(Data Cleaning)的方法有()
A.填充空缺值
B.清除数据中的噪声
C.识别或删除离群点并解决不一致性
答:————
19.[多选题] 大数据时代预测人类移动行为的数据特点是
A.多样化
B.数据量大
C.维数高
D.变化快
答:————
20.[多选题] 统计图表的可视化方法主要包括()
A.散点图
B.折线图
C.条形图
D.饼图
答:————
21.[多选题] 大数据的技术支撑有()
A.计算速度加快
B.存储成本下降
C.机器智能化
D.数据量增加
答:————南开答案q599792222 或请进 opzy.net
22.[多选题] 常见的非结构化数据有()
A.web网页
B.即时消息
C.富文本文档
D.实时多媒体数据
答:————
23.[多选题] 数据变换(Data Transformation)的方法有()
A.光滑
B.聚集
C.数据泛化
D.规范化
答:————
24.[多选题] 最常用的方式是企业自己搜集自己生产系统所产生的数据,除生产系统的数据外,企业的信息系统还充斥着大量的()等。
A.用户行为数据
B.日志式的活动数据
C.事件信息
答:————
25.[多选题] KNIME(Konstanz Information Miner)是一个对用户友好的、智能、开源的平台。该平台包括了##、##、##、##。
A.数据集成
B.数据处理
C.数据分析
D.数据挖掘
答:————
26.[多选题] 大数据带来的挑战有哪些( )。
A.会导致数据盲点
B.危及个人隐私
C.造成群体歧视
D.产生庞大能耗
答:————
27.[多选题] 数据变换的常用方法有##,##,##,##
A.中心化变换
B.极差规格化变换
C.标准化变换
D.对数变换
答:————
28.[多选题] 主流分布式计算平台有()
A.google
B.IBM
C.baidu
D.Amazon
答:————
29.[多选题] 借助于大数据提供的##和##,政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A.消费能力
B.趋势报告
C.购物结果
答:————
30.[多选题] 数据预处理的过程主要是
A.数据清洗
B.数据集成
C.数据变换
D.数据规约
答:————
31.[判断题] R语言是S语言的实现,是一种B编译语言
A.对
B.错
答:————
32.[判断题] 事件是Flume的基本数据单位
A.对
B.错
答:————
33.[判断题] 原始数据的错误,异常值和冲突值必须被清理。典型的数据清洁操作包含三个阶段:审计数据发现差距,选择转换来修正差距,将转换应用到数据集。
A.对
B.错
答:————
34.[判断题] 发现满足最小支持度阈值的所有项集,这些项集被称为频繁项集。
A.对
B.错
答:————
35.[判断题] 内存分析数据量比BI分析数据量大
A.对
B.错
答:————
36.[判断题] 广播变量在广播后可以修改
A.对
B.错
答:————
37.[判断题] NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的模式。
A.对
B.错
答:————
38.[判断题] 麦肯锡给出的大数据定义是大数据指的是大小超出常规的数据库工具获取、存储、管理、和分析能力的数据集。
A.对
B.错
答:————
39.[判断题] 数据隐私和安全是大数据发展面临的挑战
A.对
B.错
答:————
40.[判断题] 结构化数据是用excel结构表现的数据
A.对
B.错
答:————
41.[判断题] 21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。
A.对
B.错
答:————
42.[判断题] 概念描述(concept description):对含有大量数据的数据集合进行概述性的总结并获得简明、准确的描述。
A.对
B.错
答:————
43.[判断题] 时空数据是指带有地理位置与时间标签的数据。
A.对
B.错
答:————
44.[判断题] 交通数据涉及到交通车辆或者道路两旁安装的传感器生成和手机的数据集。
A.对
B.错
答:————
45.[判断题] 用一个函数拟合数据来光滑数据称为回归。
A.对
B.错
答:————
46.[判断题] 数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式
A.对
B.错
答:————
47.[判断题] 数据可根据产生主体的不同分为两类:少量企业应用产生的数据和量个人用户产生的数据
A.对
B.错
答:————
48.[判断题] 商业智能(BI)可以被描述为“一组用于获取原始数据,并将其转换为用于业务分析目的,有意义且有用的信息的技术和工具”。
A.对
B.错
答:————
49.[判断题] 宁家骏委员指出,我国发展医疗服务业,同时发展智慧养老。
A.对
B.错
答:————
50.[判断题] 减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。
A.对
B.错
答:————