东财《大数据——概念、方法与应用》单元作业2
试卷总分:100 得分:100
一、单选题 (共 10 道试题,共 50 分)
1.导入与预处理过程的特点和挑战是( )。
A.数据量大,导致企业不堪重负
B.成本增长速度快
C.隐私安全
D.以上选项都不正确
2.( )是一些管理方面的最佳实践。
A.数据挖掘
B.可视化分析
C.数据质量和管理
D.预测性分析
3.回归分析方法反映的是将事务数据库中属性值在( )的特征。
A.地点上
B.空间上
C.时间上
D.以上都不是
4.K-Means算法不适合处理( )属性。
A.连续型
B.离散型
C.稳定型
D.随机型
5.在企业危机管理及其预警中,管理者更感兴趣的是( )。
A.关联规则
B.意外规则
C.依赖规则
D.相关规则
6.聚类分析目的是使得属于同一类别的数据间的相似性尽可能( )。
A.小
B.大
C.相同
D.随机
7.两个或多个变量的( )之间存在某种规律性,就称为关联。
A.范围
B.特点
C.取值
D.字段
8.数据挖掘在大型数据库中寻找预测信息是( )。
A.自动的
B.被动的
C.随机的
D.单一的东财答案请进:opzy.net或请联系微信:1095258436
9.偏差检测的基本方法是寻找( )之间有意义的差别。
A.期望值与参照值
B.观测值与参照值
C.预测值与参照值
D.期望值与预测值
10.可视化是给人看的,( )是给机器看的。
A.数据质量和管理
B.数据挖掘
C.预测性分析
D.语音引擎
二、多选题 (共 5 道试题,共 25 分)
11.下列选项中,属于大数据分析的基本方面的包括( )。
A.预测性分析能力
B.数据质量和管理
C.可视化分析
D.语义引擎
12.下列选项中属于偏差分析的包括( )。
A.分类中的反常实例
B.模式的例外
C.对期望的偏差
D.结果的异常
13.下列选项中,属于传统的聚类分析手段的有( )。
A.划分法
B.层次方法
C.基于密度方法
D.基于网络方法
14.回归分析主要研究问题包括( )。
A.数据序列的趋势特征
B.数据序列的预测
C.数据序列的统计
D.数据间的相关关系
15.概念描述分析( )。
A.特征性描述
B.区别性描述
C.共同性描述
D.关联性描述
三、判断题 (共 5 道试题,共 25 分)
16.数据挖掘支持特定的发现问题,要求发现放之四海皆准的知识。( )
17.用户在导入时是不可以进行一些简单的清洗和预处理工作的。( )
18.结构化数据的多样性带来了数据分析的新挑战。( )
19.概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。( )
20.对于大数据分析需求,一些实时性需求会用到MySQL的Infobright。( )
奥鹏国开作业答案请进opzy.net或添加微信:1095258436