R语言数据分析与挖掘实战手册作者: 程静出版时间: 2019年版内容简介 本书系统地介绍了利用R 语言进行数据分析和挖掘的相关技术,采用由浅入深的框架体 系:开篇伊始介绍R 语言的基础操作,进而介绍回归分析、方差分析等数据分析的方法,以 更好地探索数据内部结构,获取数据所包含的信息;更重要的是为后续的数据挖掘提供理论 依据;后介绍典型数据挖掘工具和方法,采用理论基础到算法介绍到案例实战的布局,让 读者深刻感知数据挖掘的精髓,在了解算法的同时更好地学以致用。目录第1 章 R 语言简介1.1 R 语言软件的安装与运行................................................................................................. 11.1.1 R 语言软件的安装、启动与关闭........................................................................... 11.1.2 R 语言程辑包的安装和使用.................................................................................. 41.2 R 语言的数据结构............................................................................................................. 61.2.1 R 语言对象和类型................................................................................................. 61.2.2 向量........................................................................................................................ 71.2.3 数组和矩阵........................................................................................................... 121.2.4 列表...................................................................................................................... 171.2.5 数据框.................................................................................................................. 20第2 章 数据的读取与保存2.1 数据的读取...................................................................................................................... 242.1.1 读取内置数据集和文本文件................................................................................ 242.1.2 读取Excel 数据和CSV 格式的数据.................................................................... 302.1.3 读取R 语言格式数据和网页数据........................................................................ 332.1.4 读取其他格式的数据........................................................................................... 342.2 数据保存.......................................................................................................................... 362.2.1 写出数据.............................................................................................................. 362.2.2 使用函数cat() ...................................................................................................... 372.2.3 保存为R 语言格式文件....................................................................................... 382.2.4 保存为其他类型文件........................................................................................... 39第3 章 数据预处理3.1 缺失值处理...................................................................................................................... 403.1.1 缺失值判断........................................................................................................... 403.1.2 缺失模型判断....................................................................................................... 443.1.3 常用处理方法....................................................................................................... 483.2 数据整理.......................................................................................................................... 533.2.1 数据合并.............................................................................................................. 533.2.2 选取子集.............................................................................................................. 563.2.3 数据转换.............................................................................................................. 59第4 章 数据的探索性分析4.1 基本绘图函数.................................................................................................................. 664.2 探索单个变量.................................................................................................................. 744.2.1 单组数据的图形描述........................................................................................... 744.2.2 单组数据的描述性分析....................................................................................... 794.3 探索多个变量.................................................................................................................. 814.3.1 两组数据的图形描述........................................................................................... 814.3.2 多组数据的图形描述........................................................................................... 854.3.3 多组数据的描述性统计....................................................................................... 884.4 其他图像探索.................................................................................................................. 90第5 章 回归分析5.1 一元线性回归.................................................................................................................. 945.1.1 模型简介.............................................................................................................. 945.1.2 函数介绍.............................................................................................................. 965.1.3 综合案例:iris 数据集的一元回归建模.............................................................. 975.2 多元线性回归.................................................................................................................. 995.2.1 模型简介.............................................................................................................. 995.2.2 综合案例:iris 数据集的多元回归建模............................................................ 1005.3 变量的选择.................................................................................................................... 1055.3.1 逐步回归方法简介及函数介绍.......................................................................... 1055.3.2 综合案例:swiss 数据集的逐步回归建模......................................................... 1065.3.3 岭回归的方法简介及函数介绍.......................................................................... 1095.3.4 综合案例:longley 数据集的岭回归探索.......................................................... 1105.3.5 lasso 回归方法简介及函数介绍......................................................................... 1145.3.6 综合案例:longley 数据集的lasso 回归建模.................................................... 1155.4 Logistic 回归.................................................................................................................. 1175.4.1 模型简介............................................................................................................ 1175.4.2 函数介绍............................................................................................................ 1195.4.3 综合案例:iris 数据集的逻辑回归建模............................................................ 120第6 章 方差分析6.1 单因素方差分析............................................................................................................ 1246.1.1 模型介绍............................................................................................................ 1246.1.2 函数介绍............................................................................................................ 1266.1.3 综合案例:不同治疗方法下胆固醇降低效果的差异性分析............................ 1276.2 双因素方差分析............................................................................................................ 1306.2.1 模型介绍............................................................................................................ 1306.2.2 综合案例:不同剂量下老鼠妊娠重量的差异性分析........................................ 1326.3 协方差分析.................................................................................................................... 1366.3.1 模型简介............................................................................................................ 1366.3.2 函数介绍............................................................................................................ 1366.3.3 综合案例:hotdog 数据集的协方差分析........................................................... 137第7 章 主成分分析和因子分析7.1 降维的基本方法:主成分分析..................................................................................... 1397.1.1 理论基础:原始变量的线性组合...................................................................... 1397.1.2 模型介绍............................................................................................................ 1417.1.3 函数介绍............................................................................................................ 1437.1.4 综合案例:longley 数据集的变量降维及回归.................................................. 1447.1.5 综合案例:longley 数据集的变量降维及回归(主成分回归)....................... 1487.2 推广发展:因子分析.................................................................................................... 1507.2.1 理论基础:多个变量综合为少数因子............................................................... 1507.2.2 模型介绍............................................................................................................ 1517.2.3 函数介绍............................................................................................................ 1537.2.4 综合案例:能力和智商测试的因子分析探索................................................... 154第8 章 判别分析8.1 距离判别法.................................................................................................................... 1608.1.1 理论基础:离谁近,就属于谁.......................................................................... 1608.1.2 函数介绍............................................................................................................ 1628.1.3 综合案例:基于距离判别的iris 数据集分类.................................................... 1648.2 Bayes 判别法................................................................................................................. 1688.2.1 理论基础:先验概率与错判损失...................................................................... 1688.2.2 函数介绍............................................................................................................ 1708.2.3 综合案例:基于iris 数据集的Bayes 判别分析................................................ 1718.3 Fisher 判别法................................................................................................................. 1718.3.1 理论基础:投影................................................................................................. 1718.3.2 函数介绍............................................................................................................ 1738.3.3 综合案例:基于Fisher 判别的iris 数据集分类................................................ 174第9 章 常规聚类分析9.1 深入了解聚类分析........................................................................................................ 1789.1.1 差异与分类......................................................................................................... 1789.1.2 主流的聚类算法................................................................................................. 1799.2 动态聚类........................................................................................................................ 1809.2.1 聚类的基本过程................................................................................................. 1809.2.2 函数介绍............................................................................................................ 1839.2.3 综合案例:基于随机生成序列的动态聚类....................................................... 1849.3 层次聚类........................................................................................................................ 1949.3.1 聚类的基本过程................................................................................................. 1949.3.2 函数介绍............................................................................................................ 1979.3.3 综合案例:基于UScitiesD 数据集的层次聚类................................................. 1999.4 密度聚类........................................................................................................................ 2029.4.1 聚类的基本过程................................................................................................. 2029.4.2 函数介绍............................................................................................................ 2029.4.3 综合案例:基于随机生成序列的密度聚类....................................................... 2039.5 EM 聚类......................................................................................................................... 2049.5.1 聚类的基本过程................................................................................................. 2059.5.2 函数介绍............................................................................................................ 2059.5.3 综合案例:基于iris 数据集的EM 聚类............................................................ 206第10 章 关联规则10.1 简单关联规则.............................................................................................................. 21010.1.1 基本概念与表示形式....................................................................................... 21010.1.2 评价简单关联规则的有效性和实用性............................................................. 21110.2 序列关联规则.............................................................................................................. 21210.2.1 差异与基本概念............................................................................................... 21210.2.2 生成序列关联规则........................................................................................... 21310.3 Apriori 算法................................................................................................................. 21410.3.1 算法介绍:挖掘频繁项集................................................................................ 21410.3.2 函数介绍.......................................................................................................... 21510.3.3 综合案例:基于Titanic 数据集的关联规则挖掘............................................ 21610.4 Eclat 算法.................................................................................................................... 22410.4.1 算法介绍:自底向上的搜索............................................................................ 22410.4.2 函数介绍.......................................................................................................... 22410.4.3 综合案例:基于美国人口调查数据的关联规则挖掘...................................... 22510.5 SPADE 算法................................................................................................................. 23010.5.1 算法介绍:基于序列格的搜索和连接............................................................. 23110.5.2 函数介绍.......................................................................................................... 23210.5.3 综合案例:基于zaki 数据集的序列关联规则挖掘......................................... 233第11 章 神经网络11.1 深入了解人工神经网络............................................................................................... 23911.1.1 生物神经元....................................................................................................... 24011.1.2 人工神经元模型............................................................................................... 24111.1.3 人工神经网络种类........................................................................................... 24411.1.4 建立模型的一般步骤........................................................................................ 24711.2 B-P 反向传播网络....................................................................................................... 24811.2.1 B-P 反向传播网络模型.................................................................................... 24811.2.2 算法介绍........................................................................................................... 24911.2.3 函数介绍........................................................................................................... 25011.3 综合案例:基于Boston 数据的波士顿郊区房价预测建模........................................ 252 上一篇: Python自然语言处理实战:核心技术与算法 涂铭 2018年版 下一篇: Unity VR虚拟现实完全自学教程 邵伟 2019年版