东财《大数据——概念、方法与应用》单元作业2
共20道题 总分:100分
一、单选题(共10题,50分)
1.导入与预处理过程的特点和挑战是( )。
A、数据量大,导致企业不堪重负
B、成本增长速度快
C、隐私安全
D、以上选项都不正确
2.回归分析方法反映的是将事务数据库中属性值在( )的特征。
A、地点上
B、空间上
C、时间上
D、以上都不是
3.K-Means算法不适合处理( )属性。
A、连续型
B、离散型
C、稳定型
D、随机型
4.在企业危机管理及其预警中,管理者更感兴趣的是( )。
A、关联规则
B、意外规则
C、依赖规则
D、相关规则
5.聚类分析目的是使得属于同一类别的数据间的相似性尽可能( )。
A、小
B、大
C、相同
D、随机
6.数据挖掘的分类方法是找出数据库中一组数据对象的( )并按照分类模式将其划分为不同的类。
A、共同点
B、不同点
C、属性
D、值
7.可视化是给人看的,( )是给机器看的。
A、数据质量和管理
B、数据挖掘
C、预测性分析
D、语音引擎
8.( )需要被设计成能够从“文档”中智能提取信息。
A、可视化分析
B、数据挖掘
C、预测性分析
D、语音引擎
9.半结构化的数据分析需求可以使用( )。
A、GreenPlum
B、Exadata
C、Infobright
D、Hadoop
10.在大数据的采集过程中,其主要的特点和挑战是( )。
A、安全
B、隐私
C、并发数高
D、死锁
二、多选题(共5题,25分)
1.从商业层面上看,数据挖掘的主要特点有( )。
A、对商业数据库中的大量业务数据进行抽取、转换
B、对商业数据库中的大量业务数据进行分析
C、对商业数据库中的大量业务数据进行其他模型化处理
D、从商业数据库中提取辅助商业决策的关键性数据
2.挖掘的特点和挑战有( )。
A、挖掘的算法很复杂
B、涉及的数据量很大
C、计算量很大
D、数据处理简单
3.数据挖掘出的知识表现为( )。
A、可接受的
B、可理解的
C、可运用的东财答案请进:opzy.net或请联系微信:1095258436
D、有规则的
4.下列选项中,属于数据挖掘功能的有( )。
A、自动预测趋势和行为
B、关联分析
C、聚类
D、概念描述
5.概念描述分析( )。
A、特征性描述
B、区别性描述
C、共同性描述
D、关联性描述
三、判断题(共5题,25分)
1.用户在导入时是不可以进行一些简单的清洗和预处理工作的。( )
A、对
B、错
2.K-Means算法是用均值算法把数据分成K个类的算法。( )
A、对
B、错
3.K-Means算法对符号属性的数据特别有利。( )
A、对
B、错
4.商业层面上的数据挖掘是为商业决策提供真正有价值的信息。( )
A、对
B、错
5.数据挖掘算法仅仅是处理大数据的量。( )
A、对
B、错
东财《大数据——概念、方法与应用》单元作业2
共20道题 总分:100分
一、单选题(共10题,50分)
1.导入与预处理过程的特点和挑战是( )。
A、数据量大,导致企业不堪重负
B、成本增长速度快
C、隐私安全
D、以上选项都不正确
2.回归分析方法反映的是将事务数据库中属性值在( )的特征。
A、地点上
B、空间上
C、时间上
D、以上都不是
3.K-Means算法不适合处理( )属性。
A、连续型
B、离散型
C、稳定型
D、随机型
4.在企业危机管理及其预警中,管理者更感兴趣的是( )。
A、关联规则
B、意外规则
C、依赖规则
D、相关规则
5.聚类分析目的是使得属于同一类别的数据间的相似性尽可能( )。
A、小
B、大
C、相同
D、随机
6.数据挖掘的分类方法是找出数据库中一组数据对象的( )并按照分类模式将其划分为不同的类。
A、共同点
B、不同点
C、属性
D、值
7.可视化是给人看的,( )是给机器看的。
A、数据质量和管理
B、数据挖掘
C、预测性分析
D、语音引擎
8.( )需要被设计成能够从“文档”中智能提取信息。
A、可视化分析
B、数据挖掘
C、预测性分析
D、语音引擎
9.半结构化的数据分析需求可以使用( )。
A、GreenPlum
B、Exadata
C、Infobright
D、Hadoop
10.在大数据的采集过程中,其主要的特点和挑战是( )。
A、安全
B、隐私
C、并发数高
D、死锁
二、多选题(共5题,25分)
1.从商业层面上看,数据挖掘的主要特点有( )。
A、对商业数据库中的大量业务数据进行抽取、转换
B、对商业数据库中的大量业务数据进行分析
C、对商业数据库中的大量业务数据进行其他模型化处理
D、从商业数据库中提取辅助商业决策的关键性数据
2.挖掘的特点和挑战有( )。
A、挖掘的算法很复杂
B、涉及的数据量很大
C、计算量很大
D、数据处理简单
3.数据挖掘出的知识表现为( )。
A、可接受的
B、可理解的
C、可运用的
D、有规则的
4.下列选项中,属于数据挖掘功能的有( )。
A、自动预测趋势和行为
B、关联分析
C、聚类
D、概念描述
5.概念描述分析( )。
A、特征性描述
B、区别性描述
C、共同性描述
D、关联性描述
三、判断题(共5题,25分)
1.用户在导入时是不可以进行一些简单的清洗和预处理工作的。( )
A、对
B、错
2.K-Means算法是用均值算法把数据分成K个类的算法。( )
A、对
B、错
3.K-Means算法对符号属性的数据特别有利。( )
A、对
B、错
4.商业层面上的数据挖掘是为商业决策提供真正有价值的信息。( )
A、对
B、错
5.数据挖掘算法仅仅是处理大数据的量。( )
A、对
B、错