R语言数据分析与挖掘:微课版作者:谢佳标 出版时间:2022年版内容简介本书由浅入深,内容丰富。全书共11章,主要内容包括第1章R语言数据分析概述、第2章R语言数据操作基础、第3章数据读写、第4章数据预处理、第5章数据的描述统计分析、第6章 数据相关性分析、第7章 R语言可视化基础、第8章 *可视化工具、第9章聚类分析、第10章关联规则、第11章分类及预测。 本书可作为高等院校数据科学相关专业的教材,也可作为初级数据分析进行数据分析学习的指导书。目录第1章R语言数据分析概述11.1认识数据分析11.1.1为什么要对数据做分析11.1.2数据分析的流程11.2R语言的简介及安装21.2.1R语言简介21.2.2R语言的安装31.2.3其他辅助工具31.2.4R语言快速上手41.3小结91.4本章练习9第2章R语言数据操作基础112.1R语言数据类型112.1.1数据类型判断及转换112.1.2日期类型数据处理122.2R语言数据对象162.2.1.向量162.2.2.矩阵和数组202.2.3因子222.2.4列表和数据框242.3文本处理252.3.1基础文本处理252.3.2stringr扩展包332.4小结372.5本章练习37第3章R语言数据读写393.1文本文件读写393.1.1base包393.1.2readr包433.1.3data.table包463.2Excel文件读写483.2.1xlsx包503.2.2XLConnect包543.2.3openxlsx包563.2.4readxl包593.3数据库文件读写603.3.1RODBC包613.3.2RMySQL包653.4本章小结673.5本章练习67第4章数据基本管理684.1数据去重684.2数据排序694.3数据筛选714,4数据合并734.5数据关联754.6数据转换784.7融合重铸794.8数据聚合814.9数据分组834.10本章小结844.11本章练习85第5章数据预处理865.1数据抽样865.1.1数据抽样的必要性865.1.2类失衡处理方法:SMOTE865.1.3数据随机抽样:sample函数875.1.4数据等比抽样:createDataPartition函数885.1.5用于交叉验证的样本抽样895.2数据清洗905.2.1缺失值判断及处理905.2.2异常值判断处理955.3数据变换995.3.1数据分箱995.3.2数据标准化1005.4数据哑变量处理1025.5本章小结1045.6本章练习104第6章R语言重要绘图技术1056.1图形三要素1056.1.1颜色元素1056.1.2文字元素1086.1.3点线元素1096.2低级绘图函数1116.2.1标题1116.2.2坐标轴1126.2.3图例1136.2.4网格线1156.2.5点1166.2.6文字1166.2.7线1176.3高级绘图函数1196.3.1散点图1206.3.2气泡图1226.3.3线图1236.3.4柱状图1246.3.5饼图1256.3.6直方图和密度图1256.3.7箱线图1276.4本章小结1276.5本章练习127第7章高级绘图工具1297.1lattice绘图工具1297.1.1绘图特色1297.1.2基本图形1357.2ggplot2绘图工具1397.1.1从qplot开始1397.1.2ggplot作图1467.1.3ggplot2扩展包1497.3交互式绘图工具1527.3.1rCharts包1527.3.2recharts包1547.3.3rbokeh包1627.3.4plotly包1647.4本章小结1667.5本章练习166第8章聚类分析1688.1概述1688.2聚类距离度量1698.3层次聚类1728.3.1层次聚类原理1728.3.2R语言实现1738.3.3聚类树形图可视化1778.3.4比较聚类树形图1868.4K-均值聚类1908.4.1K-均值聚类原理1908.4.2R语言实现1908.5K-中心点聚类1928.6密度聚类1958.6.1密度聚类原理1958.6.2R语言实现1968.7集群评估及验证2018.7.1估计聚类趋势2018.7.2确定数据集中的簇数2028.7.3集群验证2048.8本章小结2058.9本章练习205第9章理解回归分析2079.1简单线性回归2079.1.1简单线性回归原理2079.1.2简单线性回归R语言实现2099.1.3模型诊断及预测2119.1.4指数变换2129.1.5多项式回归2139.1.6稳健线性回归2159.2多元线性回归2169.3自变量有定性变量的回归2179.4逐步回归2199.5多重共线性分析2219.6线性回归的正则化2229.6.1为什么要使用正则化2229.6.2岭回归的原理2239.6.3Lasso回归的原理2249.6.4glmnet包简介2259.6.5综合案例2289.7逻辑回归2309.7.1逻辑回归基本原理2309.7.2逻辑回归的R实现2319.8本章小结2349.9本章练习23410.1决策树概述23610.2决策树基本原理23710.3ID3算法23710.3.1C4.5算法24010.3.2CART算法24110.4R语言实现及案例24310.4.1R语言实现24310.4.2C5.0案例24310.4.3CART案例24710.4.4条件推理决策树案例25410.4.5绘制决策边界25610.5集成学习与随机森林25810.6本章小结26010.7本章练习260第11章神经网络与支持向量机26211.1理解神经网络26211.1.1激活函数26211.1.2网络结构26511.1.3人工神经网络的主要类型26511.2神经网络的R语言实现26611.3基于神经网络进行类别预测26911.4理解支持向量机27511.5支持向量机的R语言实现27611.6基于支持向量机进行类别预测27811.7本章小结28511.8本章练习28512.1模型性能评估28712.1.1数值预测评估方法28712.1.2概率预测评估方法28912.2模型参数优化29812.2.1训练集、验证集、测试集的引入29812.2.2K折交叉验证30112.2.3网格搜索30212.3本章小结30412.4本章练习304 上一篇: Java EE企业级应用开发项目教程:SSM 黑马程序员 2023年版 下一篇: 数字时代的效率手册 少数派 2021年版