1.在数据分析方法中,将一组数据对象采取一定方法划分成若干个组,并使组内数据对象尽可能相似,组间对象尽可能不同的过程称为聚类。
2.混合型LAP是指将基于多维数据库的OLAP和基于关系数据库的OLAP结合起来
3.根据事物发展的延续性和规律性,基于变量历史时间点上的顺序数据,推测变量未来后续时间点的发展趋势的任务称为时间序列分析
4.在关联规则挖掘中,为了发现有意义的关联规则,需要给定最小支持度和最小可信度两个闽值
5.在数据仓库中,根据数据源的变化量在维护对象原有数据的基础上对数据进行维护的方法称为增量维护法。
6.机器学习中,分类算法需要用到的样本数据一般分成训练集、测试集和验证集3类。
7.支持向量机、朴素贝叶斯、K-近邻等分类方法都属于有监督机器学习模型
8.在企业信息系统的应用类型中,OLAP应用是指联机分析处理应用
9.数据挖掘作为知识发现的过程,一般由三个主要阶段组成:数据准备、数据挖掘、结果的解释和评估
10.在数据仓库中,数据的粒度越小,表明数据的细节程度越高,可以回答查询的种类就越多
11.在进行多维分析时,如果将年销售额投影到每个月上来进行观察,这种分析动作被称为钻取(年→月)。若是上卷,则是月→年。
12.在OLAP的实现方式中,以多维数组作为存储结构的被称作MOLAP
13.数据从操作型环境转移到数据仓库过程中所用到ETL工具通常需要完成的处理操作包括抽取、转换和装载。
14.聚类是一类常见的机器学习方法,聚类算法所处理的数据对象一般都没有标记,因此聚类一般也被称为无监督的学习方法。
15.给定一个销售交易数据库,从中找出这些交易中的某些物品和其他物品之间的关系,这种数据挖掘般称为关联挖掘。
16.对一个数据集的数据进行分组,使得每一组内的数据尽可能相似而不同组间的数据尽可能的不同样数据挖掘方法称为聚类算法。聚类:组内相同,组外不同
17.在数据仓库环境中,数据的粒度设计是一种重要的设计问题,它会影响到数据仓库中数据量以及系统能回答的查询的类型。
18.在数据仓库设计和建设过程中,设计者需要调查用户的决策或数据处理需求,并将功能相近且需要相关联数据支持的需求进行归类,得到不同的需求集合,并在企业数据模型中寻找能够满足各个需求集合的数据集合,然后针对各个数据集合开展数据仓库数据模型的设计。这种设计方法称为 面向主题的设计方法
19.分类器的构造方法有统计方法(贝叶斯法和非参数法)、机器学习方法(决策树法和规则归纳法)、神经网络方法(BP算法)等。K-means属于聚类算法。
20.分布式数据库是物理上分散、逻辑上集中的数据库系统。
21.分布式数据库系统的恢复控制采用的最典型策略是基于两阶段的提交协议
22.云计算通过集中所有的计算资源,采用硬件虚拟化技术,为使用者提供强大的计算能力、存储和带宽等资源
23.并行数据库有多种体系结构,其中所有处理机通过网络共享一个公共的主存储器的结构称为共享内存结构
24.在各种并行数据库系统结构中,层次结构综合了共享内存、共享磁盘和无共享结构的特点,将结构分成顶层和底层两层,顶层是无共享结构,底层是共享内存或共享磁盘结构。