Python实战之数据分析与处理 作者:刘宇宙 出版时间:2020年版内容简介 本书是为使用Python进行科学计算的新手或刚入门者量身定做的,是作者学习和使用Python进行人工智能项目研发的体会与经验总结,涵盖了实际开发中的基础知识点,内容详尽,代码可读性及可操作性强。本书主要介绍NumPy、Pandas、Matplotlib的基本操作。本书使用通俗易懂的描述,引入了丰富的示例代码,同时结合智慧城市中的一些事件,使内容呈现尽可能生动有趣,让一些原本复杂的处理能够通过另一种辅助解释得以简单化,从而使读者充分感受学习的乐趣和魅力。本书可供有一定Python基础但没有NumPy、Pandas、Matplotlib操作经验的人员,有Python基础并且想进一步学习使用Python进行科学计算的人员,有一些Python基础并且打算入门人工智能的人员,以及培训机构、中学及大专院校的学生阅读。目录目 录第一部分 数据分析与处理简介第1章 数据分析与处理概述/t21.1 了解大数据/t21.2 数据分析与处理的需求/t41.3 数据分析与处理的发展前景/t5第二部分 科学计算之门――NumPy第2章 NumPy入门/t82.1 NumPy简介/t82.2 NumPy安装/t82.3 NumPy――ndarray对象/t92.4 NumPy数据类型/t112.4.1 数据类型/t112.4.2 数据类型对象(dtype)/t122.5 NumPy数组属性/t162.6 NumPy创建数组/t192.6.1 numpy.empty/t192.6.2 numpy.zeros/t192.6.3 numpy.ones/t202.6.4 numpy.asarray/t212.6.5 numpy.frombuffer/t222.6.6 numpy.fromiter/t232.6.7 numpy.arange/t232.6.8 numpy.linspace/t242.6.9 numpy.logspace/t262.7 NumPy切片和索引/t272.7.1 切片和索引/t272.7.2 整数数组索引/t292.7.3 布尔索引/t302.7.4 花式索引/t312.8 NumPy迭代数组/t322.9 NumPy数组操作/t372.9.1 修改数字形状/t372.9.2 翻转数组/t392.9.3 修改数组维度/t422.9.4 连接数组/t452.9.5 分割数组/t482.9.6 数组的添加与删除/t502.10 NumPy位运算/t552.10.1 bitwise_and()函数/t552.10.2 bitwise_or()函数/t552.10.3 invert()函数/t562.10.4 left_shift()函数/t562.10.5 right_shift()函数/t562.11 实战演练/t57第3章 NumPy函数/t583.1 字符串函数/t583.1.1 numpy.char.add()函数/t583.1.2 numpy.char.multiply()函数/t593.1.3 numpy.char.center()函数/t593.1.4 numpy.char.capitalize()函数/t593.1.5 numpy.char.title()函数/t593.1.6 numpy.char.lower()函数/t603.1.7 numpy.char.upper()函数/t603.1.8 numpy.char.split()函数/t603.1.9 numpy.char.splitlines()函数/t613.1.10 numpy.char.strip()函数/t613.1.11 numpy.char.join()函数/t613.1.12 numpy.char.replace()函数/t623.1.13 numpy.char.encode()函数/t623.1.14 numpy.char.decode()函数/t623.2 数学函数/t623.2.1 三角函数/t623.2.2 舍入函数/t643.2.3 numpy.floor()函数/t653.2.4 numpy.ceil()函数/t653.3 算术函数/t65?3.4 统计函数/t673.4.1 numpy.amin()函数和numpy.amax()函数/t673.4.2 numpy.ptp()函数/t683.4.3 numpy.percentile()函数/t683.4.4 numpy.median()函数/t693.4.5 numpy.mean()函数/t703.4.6 numpy.average()函数/t703.4.7 标准差/t713.4.8 方差/t723.5 排序、搜索和计数函数/t723.5.1 numpy.sort()函数/t723.5.2 numpy.argsort()函数/t733.5.3 numpy.lexsort()函数/t743.5.4 numpy.argmax()函数和numpy.argmin()函数/t743.5.5 numpy.nonzero()函数/t753.5.6 numpy.where()函数/t763.5.7 numpy.extract()函数/t763.5.8 其他排序/t773.6 字节交换/t783.7 副本和视图/t793.7.1 无复制/t793.7.2 视图/t803.7.3 副本/t813.8 矩阵库/t823.9 线性代数/t853.10 NumPy IO/t903.11 实战演练/t93第三部分 数据处理法宝――Pandas第4章 Pandas入门/t964.1 Pandas简介/t964.2 Pandas安装及数据结构/t964.3 系列/t974.3.1 创建空系列/t984.3.2 由ndarray创建系列/t984.3.3 由字典创建系列/t994.3.4 使用标量创建系列/t994.3.5 从系列中访问数据/t1004.3.6 使用标签检索数据/t1014.4 数据帧/t1014.4.1 创建空数据帧/t1024.4.2 使用列表创建数据帧/t1024.4.3 使用ndarrays/lists的字典创建数据帧/t1034.4.4 使用字典列表创建数据帧/t1044.4.5 使用系列的字典创建数据帧/t1054.4.6 列选择/t1054.4.7 列添加/t1064.4.8 列删除/t1064.4.9 行选择、添加和删除/t1074.4.10 行切片/t1084.5 面板/t1094.5.1 面板创建/t1104.5.2 数据选择/t1104.6 基本功能/t1114.6.1 T转置/t1124.6.2 axes/t1134.6.3 dtypes/t1134.6.4 empty/t1134.6.5 ndim/t1144.6.6 shape/t1144.6.7 size/t1144.6.8 values/t1154.6.9 head()方法与tail()方法/t1154.7 描述性统计/t1164.7.1 sum()函数/t1164.7.2 mean()函数/t1174.7.3 std()函数/t1184.7.4 describe()函数/t1184.8 函数应用/t1204.8.1 表格函数/t1204.8.2 行列合理函数/t1214.8.3 元素合理函数/t1224.9 重建索引/t1234.9.1 重建对象对齐索引/t1234.9.2 填充时重新加注/t1244.9.3 重建索引时的填充限制/t1244.9.4 重命名/t1254.10 迭代/t1264.11 排序/t1274.11.1 按标签排序/t1274.11.2 排序顺序/t1284.11.3 按列排序/t1294.11.4 按值排序/t1294.11.5 排序算法/t1294.12 字符串和文本数据/t1304.12.1 lower()函数/t1304.12.2 upper()函数/t1304.12.3 len()函数/t1314.12.4 strip()函数/t1314.12.5 split()函数/t1314.12.6 cat()函数/t1324.12.7 get_dummies()函数/t1324.12.8 contains()函数/t1324.12.9 replace()函数/t1334.12.10 repeat()函数/t1334.12.11 count()函数/t1334.12.12 startswith()函数/t1334.12.13 endswith()函数/t1344.12.14 find()函数/t1344.12.15 findall()函数/t1344.12.16 swapcase()函数/t1354.12.17 islower()函数/t1354.12.18 isupper()函数/t1354.12.19 isnumeric()函数/t1364.13 选项和自定义/t1364.13.1 get_option()函数/t1364.13.2 set_option()函数/t1364.13.3 reset_option()函数/t1374.13.4 describe_option()函数/t1374.13.5 option_context()函数/t1384.14 选择和索引数据/t1384.14.1 .loc()/t1384.14.2 .iloc()/t1394.14.3 .ix()/t1394.14.4 使用符号/t1394.14.5 属性访问/t1404.15 实战演练/t140第5章 Pandas进阶/t1415.1 统计函数/t1415.1.1 pct_change()函数/t1415.1.2 协方差/t1425.1.3 相关性/t1435.1.4 数据排名/t1435.2 窗口函数/t1445.2.1 .rolling()函数/t1445.2.2 .expanding()函数/t1455.2.3 .ewm()函数/t1455.3 聚合/t1455.3.1 在整个DataFrame上应用聚合/t1465.3.2 在DataFrame的单列上应用聚合/t1465.3.3 在DataFrame的多列上应用聚合/t1475.3.4 在DataFrame的单列上应用多个函数/t1475.3.5 在DataFrame的多列上应用多个函数/t1485.3.6 将不同的函数应用于DataFrame的不同列/t1485.4 缺失数据/t1495.4.1 为什么会缺失数据/t1495.4.2 检查缺失值/t1495.4.3 缺失数据的计算/t1505.4.4 缺失数据填充/t1505.4.5 向前和向后填充/t1505.4.6 清除缺失值/t1515.4.7 值替换/t1515.5 分组/t1515.5.1 将数据拆分成组/t1525.5.2 查看分组/t1525.5.3 迭代遍历分组/t1535.5.4 选择一个分组/t1535.5.5 聚合/t1545.5.6 使用多个聚合函数/t1545.5.7 转换/t1555.5.8 过滤/t1555.6 合并/连接/t1565.6.1 合并一个键上的两个数据帧/t1575.6.2 合并多个键上的两个数据帧/t1575.6.3 使用how参数/t1585.7 级联/t1595.7.1 concat()函数/t1595.7.2 append()函数/t1615.7.3 时间序列/t1615.8 日期功能/t1625.9 时间差/t1645.10 分类数据/t1655.11 稀疏数据/t1695.12 实战演练/t170第四部分 优雅的艺术――Matplotlib第6章 Matplotlib 入门/t1726.1 Matplotlib简介/t1726.2 Matplotlib安装/t1736.3 Pyplot教程/t1736.3.1 控制线条属性/t1766.3.2 处理多个图形和轴域/t1776.3.3 处理文本/t1786.3.4 在文本中使用数学表达式/t1796.3.5 对数和其他非线性轴/t1806.4 使用GridSpec自定义子图位置/t1816.4.1 subplot2grid/t1816.4.2 GridSpec和SubplotSpec/t1826.4.3 调整GridSpec布局/t1836.4.4 使用SubplotSpec创建GridSpec/t1846.4.5 调整GridSpec布局/t1856.5 布局/t1866.5.1 简单示例/t1866.5.2 和GridSpec一起使用/t1906.5.3 和AxesGrid1一起使用/t1936.5.4 颜色条/t1946.6 艺术家教程/t1956.6.1 自定义对象/t1966.6.2 图形容器/t1976.6.3 轴域容器/t1976.6.4 轴容器(Axis)/t1996.6.5 刻度容器/t2016.7 图例指南/t2026.7.1 控制图例条目/t2026.7.2 代理艺术家/t2036.7.3 图例位置/t2046.7.4 同轴域的多个图例/t2046.7.5 图例处理器/t2056.7.6 自定义图例处理器/t2066.8 变换/t2086.8.1 数据坐标/t2086.8.2 混合变换/t2096.8.3 创建阴影效果/t2106.9 路径/t2126.9.1 贝塞尔示例/t2136.9.2 复合路径/t2146.9.3 路径效果/t2166.9.4 添加阴影/t2176.9.5 其他/t218第7章 Matplotlib更多处理/t2207.1 基本文本命令/t2207.2 文本属性及布局/t2227.3 标注/t2257.3.1 基本标注/t2257.3.2 使用框和文本标注/t2277.3.3 使用箭头标注/t2287.4 数学表达式/t2317.5 颜色指定/t2357.6 事件处理及拾取/t2367.6.1 事件连接/t2367.6.2 事件属性/t2377.6.3 可拖曳的矩形/t2397.6.4 鼠标进入和离开/t2427.6.5 对象拾取/t2447.7 扩展/t2467.7.1 透明度填充/t2467.7.2 透明、花式图例/t2477.7.3 放置文本框/t248第五部分 项目实战第8章 数据加载与数据库操作/t2528.1 读写文本格式的数据/t2528.2 逐块读取文本文件/t2568.3 数据写入文本/t2588.4 JSON数据处理/t2608.5 二进制数据格式/t2628.6 HDF5数据格式/t2628.7 Pandas操作数据库/t265第9章 数据分析/t2739.1 数据准备/t2739.2 数据处理/t2799.3 数据可视化/t291附录A 可用Line2D属性/t294附录B 习题参考答案/t295 上一篇: Power BI智能数据分析与可视化从入门到精通 牟恩静 2019年版 下一篇: Python编程:从数据分析到机器学习实践 微课视频版 刘瑜 2020年版