数据仓库与数据挖掘导论作 者: 李於洪 主编出版时间:2012内容简介 《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》为数据仓库与数据挖掘的基础教程,是作者多年来从事数据仓库与数据挖掘课程教学经验的梳理和总结。为了增强内容的直观性和可理解度,全书以大量图、表、实例融入其中。全书共分为四篇14章。第一篇为导引,共分2章:用实例和实例分析引导学生理解数据仓库与数据挖掘的概念内涵及其产生背景。第二篇为数据仓库,共分5章:详细介绍了数据仓库的体系结构及其组成部分的功能;从商业需求的角度介绍了数据仓库维度建模方法和联机分析处理操作;介绍了元数据在数据仓库建设中的重要性、分类方法与作用。第三篇为数据挖掘,共分4章:通过浅显易懂的语言及实例,深入浅出地介绍了关联分析方法、神经网络算法、决策树算法和聚类分析方法。第四篇为实验与工具,共分3章:提供了数据仓库实验、神经网络建模实验、决策树与关联分析实验,强化培养学生的应用能力。《高等院校本科应用型经管专业规划教材:数据仓库与数据挖掘导论》可作为普通高等院校计算机专业、软件工程专业、信管专业等其他相关专业的教材,也可作为数据仓库与数据挖掘方面的培训教材,对于希望了解或学习数据仓库与数据挖掘知识的自学人士,本书具有较强的可读性。目录第一篇导引 第1章数据仓库概念与内涵 1.1数据仓库概念 1.1.1数据仓库的产生 1.1.2数据仓库应用实例:理解数据仓库的应用目标与作用 1.2数据仓库的四个基本特征 1.2.1数据仓库的数据是面向主题的 1.2.2数据仓库的数据是集成的 1.2.3数据仓库的数据是不可更新的 1.2.4数据仓库的数据是随时间不断变化的 1.3数据集市——部门级数据仓库 1.3.1自上而下构建数据集市 1.3.2自下而上构建数据集市 1.3.3自上而下与自下而上结合构建数据集市 习题 讨论题 第2章数据挖掘概念与内涵 2.1数据挖掘概念 2.1.1数据挖掘的产生 2.1.2数据挖掘应用实例:理解数据挖掘的应用目标与作用 2.1.3数据挖掘的定义 2.2数据仓库与数据挖掘的关系 讨论题 第二篇数据仓库 第3章数据仓库的体系结构及其组成部分 3.1数据仓库的体系结构 3.2数据仓库的组成部分及其功能 3.2.1源数据部分 3.2.2数据准备部分 3.2.3数据存储部分 3.2.4信息传递部分 思考题 习题 讨论题 第4章数据仓库数据的商业需求分析 4.1收集商业需求数据碰到的问题 4.2商业数据维度化分析 4.3商业维度实例分析 思考题 习题 第5章数据仓库的维度建模 5.1维度建模基础 5.2星型模式及其查询的钻取 5.2.1星型模式维度表内容的特征 5.2.2星型模式事实表内容的特征 5.2.3星型模式的优势 5.3雪花型模式:对维度表的再处理 5.4聚集事实表:对关键指标的再处理 5.4.1理解事实表的数据量 5.4.2理解聚集事实表的作用 5.4.3对事实表进行聚集的三种方法 5.4.4聚集过程中相关问题讨论 思考题 习题 第6章数据仓库中的联机分析处理——OLAP 6.1OLAP的含义、规则与特征 6.1.1OLAP的含义 6.1.2OLAP的规则 6.1.3OLAP的特征 6.2OLAP的基本操作 6.2.1切片 6.2.2切块 6.2.3上钻与下钻 6.2.4旋转 6.3OLAP模型结构 6.3.1关系联机分析处理(ROLAP)结构 6.3.2多维联机分析处理(MOLAP)结构 6.3.3混合联机分析处理(HOLAP)结构 6.3.4桌面联机分析处理(DOLAP)结构 6.3.5客户联机分析处理(COLAP)结构 6.4典型OLAP模型的数据组织与应用 6.4.1ROLAP的数据组织与应用 6.4.2MOIAP的数据组织与应用 6.4.3ROLAP与MOLAP的数据组织与应用比较 思考题 习题 讨论题 第7章元数据 7.1数据仓库中元数据的重要性 7.1.1数据仓库的用户需要元数据 7.1.2数据仓库的开发者需要元数据 7.1.3数据仓库的管理员需要元数据 7.2关于数据仓库元数据的概念界定 7.3元数据的几种分类方法 7.3.1按用途对元数据进行分类 7.3.2按数据仓库功能区域划分的元数据分类 7.3.3按元数据的活动方式进行分类 7.4元数据的作用 7.5元数据管理的体系结构 7.5.1集中的方法 7.5.2分散的方法 7.5.3分布的方法 思考题 习题 讨论题 第三篇数据挖掘 第8章关联分析 8.1关联规则概念 8.1.1关联规则的支持度和置信度 8.1.2关联规则分类 8.2关联规则挖掘算法 8.2.1Apriori算法 8.2.2强关联规则的有效性和可行性问题 习题 讨论题 第9章神经网络算法 9.1神经网络概念 9.1.1神经网络原理 9.1.2人工神经网络 9.2人工神经网络模型 9.2.1感知器 9.2.2带隐层的人工神经网络 9.3前馈神经网络 9.3.1训练神经网络 9.3.2后向传播如何工作 9.3.3后向传播算法 9.4有关神经网络研究中应该关注的几个问题 9.4.1关于对神经网络的理解问题 9.4.2关于神经网络应用中数据准备的问题 9.4.3影响神经网络模型性能的部分因素 9.4.4学习神经网络,需要强调以下几个问题 习题 讨论题 第10章决策树算法 10.1决策树分类概述 10.1.1决策树分类步骤 10.1.2决策树分类举例 10.2ID3算法 10.2.1信息论基本原理 10.2.2ID3算法的基本思想与实例 10.2.3ID3算法应用中应该关注的几个问题 习题 讨论题 第11章聚类分析 11.1聚类分析概述 11.1.1聚类分析中的数据类型 11.1.2聚类分析中相异度(相似性、差异度)测度方法 11.2聚类分析方法 11.2.1划分聚类方法 11.2.2基于密度的聚类方法 11.2.3聚类分析在数据挖掘应用中有待进一步研究的问题 习题 讨论题 第四篇实验与工具 第12章数据仓库实验与工具应用 第13章神经网络建模实验与工具应用 第14章决策树与关联分析实验与工具应用 参考文献 上一篇: 支持向量机的算法设计与分析 下一篇: 机器学习系统设计