Python+Superset:商业智能数据分析与实战作 者: 王国平 著出版时间: 2022 内容简介 本书通过实际案例深入介绍了基于Python的开源商业智能工具Apache Superset。本书立足于为企业建立一套开源免费的BI(商业智能)数据分析平台,实现自助数据处理、数据分析、数据可视化,概述了该系统的基本情况、总体需求、解决方案和业务理解等。本书从企业BI系统建设的实际需求出发,详细阐述了商业智能系统开发的概念、流程及相关技术,同时结合实际案例介绍了基于Apache Superset的**且常用的商业智能技术,包括Redis、Hive、Presto、Vertica、ClickHouse、TiDB、Dremio等。目录第1章 商业智能概述/t11.1 商业智能简介/t11.1.1 商业智能的发展/t11.1.2 商业智能的价值/t31.1.3 商业智能的流程/t41.2 商业智能技术/t41.2.1 数据仓库技术/t41.2.2 ETL技术/t61.2.3 数据可视化技术/t61.3 几个概念的比较/t101.3.1 商业智能与报表工具/t101.3.2 商业智能与数据分析/t111.3.3 商业智能与数据可视化/t11第2章 系统开发需求分析/t122.1 项目背景概述/t122.1.1 项目意义与需求/t122.1.2 项目目标、系统设计与阶段划分/t162.2 平台总体需求/t182.2.1 平台总体规划/t192.2.2 平台用户角色/t202.3 解决方案概述/t212.3.1 BI平台功能简介/t212.3.2 BI平台总体架构/t222.4 业务数据理解/t232.4.1 表及其字段含义/t242.4.2 重要需求点阐述/t28第3章 系统开发相关技术/t313.1 系统主要软件/t313.1.1 Hadoop/t313.1.2 Python/t343.1.3 Apache Superset/t353.2 数据仓库技术/t373.2.1 数据仓库构建过程/t373.2.2 数据仓库拉链算法/t383.3 Apache Superset的安装/t393.3.1 在Docker中部署Apache Superset/t393.3.2 在Windows下安装Apache Superset/t44第4章 Apache Superset连接数据源/t474.1 读取本地数据/t474.1.1 读取CSV文件/t474.1.2 读取TXT文件/t514.2 连接关系型数据库/t514.2.1 安装驱动程序/t524.2.2 配置连接参数/t534.2.3 添加数据库表/t58第5章 Apache Superset基础操作/t615.1 Apache Superset可视化分析/t615.1.1 SQL Lab提取数据/t615.1.2 制作报表与看板/t645.2 Apache Superset用户管理/t685.2.1 创建新的系统用户/t685.2.2 删除已有系统用户/t705.2.3 查看用户日志记录/t715.3 Apache Superset角色管理/t725.3.1 设置用户角色类型/t735.3.2 创建新的用户角色/t735.3.3 修改用户角色类型/t755.4 Apache Superset看板设置与编辑/t775.4.1 Apache Superset看板设置/t775.4.2 Apache Superset看板编辑/t81第6章 Apache Superset前端集成开发/t846.1 前端开发概述/t846.1.1 HTML及其应用案例/t846.1.2 JavaScript及其特点/t886.2 系统参数设置/t896.3 Apache Superset前端集成实战/t906.3.1 报表嵌入Web页面/t906.3.2 看板嵌入Web页面/t97第7章 Apache Superset系统性能优化/t1007.1 系统性能优化/t1007.2 搭建开发环境/t1027.2.1 Redis缓存概述/t1027.2.2 配置Redis环境/t1047.3 集成开发实战/t1067.3.1 测试集成前看板/t1067.3.2 刷新集成后看板/t108第8章 Apache Superset与数据仓库/t1098.1 数据仓库概述/t1098.1.1 传统数据仓库/t1098.1.2 大数据数据仓库/t1118.2 Apache Superset集成Hive/t1138.2.1 Hive数据仓库概述/t1138.2.2 搭建Hive开发环境/t1158.3 物流配送影响因素分析/t117第9章 Apache Superset与实时计算引擎/t1219.1 实时计算引擎概述/t1219.1.1 实时计算应用场景/t1219.1.2 实时计算重要架构/t1239.2 Apache Superset集成Presto/t1269.2.1 Presto计算引擎概述/t1269.2.2 搭建Presto开发环境/t1289.3 网购退货原因分析/t1329.3.1 网购退货主要原因/t1329.3.2 个人原因退货分析/t134第10章 Apache Superset与列式存储引擎/t13610.1 列式存储引擎/t13610.2 Apache Superset集成Vertica/t13810.2.1 Vertica存储引擎概述/t13810.2.2 搭建Vertica开发环境/t14010.3 客户流失原因分析/t14410.3.1 客户流失主要原因/t14410.3.2 客户流失服务因素分析/t145第11章 Apache Superset与联机分析处理/t14711.1 联机分析处理概述/t14711.1.1 联机分析处理特性/t14711.1.2 联机分析处理操作/t14911.2 Apache Superset集成ClickHouse/t15011.2.1 ClickHouse存储引擎概述/t15111.2.2 搭建ClickHouse开发环境/t15213.3 商家物流运营分析/t15511.3.1 物流运营主要模式/t15611.3.2 商家交货周期分析/t157第12章 Apache Superset与混合事务分析处理/t15912.1 混合事务分析处理/t15912.1.1 混合事务分析处理概述/t15912.1.2 混合事务分析处理操作/t16112.2 Apache Superset集成TiDB/t16312.2.1 TiDB存储引擎概述/t16312.2.2 搭建TiDB开发环境/t16612.3 物流配送沟通性/t16812.3.1 物流配送沟通性概述/t16912.3.2 物流配送沟通性分析/t169第13章 Apache Superset与数据湖引擎/t17213.1 数据湖引擎/t17213.1.1 数据湖引擎概述/t17213.1.2 数据湖与数据仓库/t17313.2 Apache Superset集成Dremio/t17413.2.1 Dremio引擎概述/t17513.2.2 搭建Dremio开发环境/t17613.3 客户流失价格因素/t18213.3.1 客户流失价格因素概述/t18213.3.2 客户流失价格因素分析/t182第14章 客户细分主题分析/t18414.1 客户细分的价值及其方法/t18414.1.1 客户细分的概念/t18414.1.2 客户细分的目的/t18514.1.3 客户细分的方法/t18514.2 基于客户属性的客户细分/t18714.2.1 提取SQL数据库数据/t18714.2.2 制作可视化分析报表/t18814.2.3 基于属性的细分看板/t19214.3 基于客户价值的客户细分/t19314.3.1 提取SQL数据库数据/t19314.3.2 制作可视化分析报表/t19414.3.3 基于价值的细分看板/t19814.4 基于消费行为的客户细分/t19914.4.1 RFM模型及客户价值类型/t19914.4.2 提取与清洗SQL数据/t20014.4.3 制作可视化分析报表/t20414.4.4 基于行为的细分看板/t20814.5 对细分客户进行营销/t208第15章 客户满意度主题分析/t21115.1 客户满意度概述/t21115.2 客户满意信赖度分析/t21415.3 客户满意专业度分析/t21515.4 客户满意有形度分析/t21715.5 客户满意同理度分析/t21815.6 客户满意反应度分析/t22015.7 提升客户满意度/t221附录A 安装Python 3.10.0/t224附录B 集群各节点的参数配置/t228B.1 Hadoop的参数配置/t228B.2 Hive的参数配置/t231B.3 集群的启动与关闭/t233附录C 数据源及其连接方式/t234 上一篇: MySQL数据库应用技术及实战 第2版 肖睿 2022年版 下一篇: Python一行流:像专家一样写代码 [美]Christian Mayer 2021年版