发表于2024-11-23
书[0名0]: | Greenplum企业应用实战[按需印刷]|3770631 |
图书定价: | 69元 |
图书作者: | 何勇;陈晓峰 |
出版社: | [1机1] 械工业出版社 |
出版日期: | 2014-10-01 0:00:00 |
ISBN号: | 9787111481003 |
开本: | 16开 |
页数: | 332 |
版次: | 1-1 |
作者简介 |
何勇资深数据库专家和软件架构师,对Greenplum、Oracle、Teradata、MySQL以及各种[0No0]SQL都有非常深入的研究,实战经验丰富。曾就职于阿里巴巴和盛[0大0],从事数据库系统架构、软件架构和数据中心相关的工作.熟悉Peri、Python、Java、C,以及移动开发。现为杭州遥指科技有限公司联合创始人兼CTO。陈晓峰资深数据库专家和高级开发工程师,对Greenplum和PostgresQL等数据库以及Hadoop和Storm等[0大0]数据技术有非常深入的研究和丰富的实践经验。曾就职于阿里巴巴数据平台事业部,负责数据仓库Greenplum计算集群、报表集群的维护及调[0优0],担任RTDC项目和天罡项目的技术负责人,以及负责的交易直播间项目;还曾就职于阿里巴巴小微金服集团保险事业部,负责保险事业部所有险种的核保核赔;现就职于深圳前海微众银行。熟悉Java、C、C++、Python,以及数据挖掘和数据分析相关技术。 |
内容简介 |
这是[0国0]内[0首0]本Greenplum著作,[0国0]内早开始使用Greenp,um的企业是阿里巴巴,本书的两位作者是阿里巴巴早负责使用和维护Greenplum的技术工程师,性毋庸置疑。本书完全立足于阿里巴巴的企业应用实践,不仅系统介绍Greenplum的功能特性、使用方[0法0]、高级应用,而且还详细讲解 Greenplum的系统架构、运维管理、性能[0优0]化和各种技巧。重要的是,包含[0大0]量企业级应用案例,并且对每个案例都进行了详尽的讲解和实操指导。 全书一共15章,分为三个部分:基础篇([0第0] 1-3章)[0首0]先介绍了Greenplum的应用场景、功能特性以及与PostgreSQL的关系,然后讲解了 Greenplum的安装配置、语[0法0]以及相关操作,后通过两个具体的数据仓库ETL案例加强读者对 Greenplum的功能特性的了解和操作能力;进阶篇([0第0]4-7章)围绕数据字典、执行计划、系统架构、高级特性等主题对Greenplum进行了更深入的讲解,不仅能让读者更深入理解Greenplum的工作原理,也能让读者游刃有余地应对各种日常操作;管理篇([0第0]8-15章)从运维和管理的角度讲解了 Greenplum的线上部署、数据库管理、脚本维护、监控、[0权0]限控制、容灾/扩容、备份恢复、性能调[0优0]、常用技巧和常见问题等。 |
目录 |
《Greenplum企业应用实战》 前言 上篇 基 础 篇 [0第0]1章 Greenplum简介 2 1.1 Greenplum的起源和发展历程 2 1.2 OLTP与OLAP 3 1.3 PostgreSQL与Greenplum的关系 3 1.3.1 PostgreSQL 3 1.3.2 Greenplum 5 1.4 Greenplum特性及应用场景 6 1.4.1 Greenplum特性 6 1.4.2 Greenplum应用场景 7 1.5 小结 8 [0第0]2章 Greenplum快速入门 9 2.1 软件安装及数据库初始化 9 2.1.1 Greenplum架构 9 2.1.2 环境搭建 11 2.1.3 Greenplum安装 13 2.1.4 创建数据库 20 2.1.5 数据库启动与关闭 20 2.2 安装Greenplum的常见问题 22 2.2.1 /etc/hosts配置错误 22 2.2.2 MASTER_DATA_DIRECTORY设置错误 24 2.3 [0畅0]游Greenplum 25 2.3.1 如何访问Greenplum 25 2.3.2 数据库整体概况 27 2.3.3 基本语[0法0]介绍 28 2.3.4 常用数据类型 35 2.3.5 常用函数 37 2.3.6 分析函数 43 2.3.7 分区表 46 2.3.8 外部表 49 2.3.9 COPY命令 51 2.4 小结 52 [0第0]3章 Greenplum实战 53 3.1 历[0史0]拉链表 53 3.1.1 应用场景描述 53 3.1.2 原理及步骤 54 3.1.3 表结构 55 3.1.4 Demo数据准备 57 3.1.5 数据加载 58 3.1.6 数据刷新 61 3.1.7 分区裁剪 64 3.1.8 数据导出 64 3.2 日志分析 65 3.2.1 应用场景描述 65 3.2.2 数据Demo 65 3.2.3 日志分析实战 66 3.3 数据分布 68 3.3.1 数据分散情况查看 69 3.3.2 数据加载速度影响 69 3.3.3 数据查询速度影响 72 3.4 数据压缩 73 3.4.1 数据加载速度影响 73 3.4.2 数据查询速度影响 74 3.5 索引 75 3.6 小结 75 中篇 进 阶 篇 [0第0]4章 数据字典详解 78 4.1 oid无处不在 78 4.2 数据库集群信息 80 4.2.1 Gp_configuration和gp_segment_configuration 80 4.2.2 Gp_id 82 4.2.3 Gp_configuration_history 84 4.2.4 pg_filespace_entry 84 4.2.5 集群配置信息表转化 84 4.3 常用数据字典 85 4.3.1 pg_class 85 4.3.2 pg_attribute 88 4.3.3 gp_distribution_policy 89 4.3.4 pg_statistic和pg_stats 90 4.4 分区表信息 90 4.4.1 如何实现分区表 91 4.4.2 pg_partition 91 4.4.3 pg_partition_rule 92 4.4.4 pg_partitions视图及其[0优0]化 93 4.5 自定义类型以及类型转换 94 4.6 主、备节点同步的相关数据字典 95 4.7 数据字典应用示例 96 4.7.1 获取表的字段信息 96 4.7.2 获取表的分布键 96 4.7.3 获取一个视图的定义 97 4.7.4 查询comment(备注信息) 98 4.7.5 获取数据库建表语句 99 4.7.6 查询表上的视图 103 4.7.7 查询表的数据文件创建时间 104 4.7.8 分区表总[0大0]小 106 4.7.9 如何分析数据字典变化 108 4.7.10 获取数据库锁信息 111 4.8 Gp_toolkit介绍 112 4.9 小结 114 [0第0]5章 执行计划详解 115 5.1 执行计划入门 115 5.1.1 什么是执行计划 115 5.1.2 查看执行计划 116 5.2 分布式执行计划概述 116 5.2.1 架构 116 5.2.2 重分布与广播 117 5.2.3 Greenplum Master的工作 119 5.3 Greenplum执行计划中的术语 120 5.3.1 数据扫描方式 120 5.3.2 分布式执行 121 5.3.3 两种聚合方式 122 5.3.4 关联 123 5.3.5 SQL消耗 126 5.3.6 其他术语 126 5.4 数据库统计信息收集 128 5.4.1 Analyze分析 128 5.4.2 固定执行计划 129 5.5 控制执行计划的参数介绍 130 5.6 规划器开销的计算方[0法0] 131 5.7 各种执行计划原理分析 133 5.7.1 详解关联的广播与重分布 133 5.7.2 HashAggregate与GroupAggregate 137 5.7.3 Nestloop Join 、 Hash Join 与Merge Join 141 5.7.4 分析函数:开窗函数和grouping sets 142 5.8 案例 144 5.8.1 关联键强制类型转换,导致重分布 144 5.8.2 统计信息过期 145 5.8.3 执行计划出错 145 5.8.4 分布键选择不恰[0当0] 147 5.8.5 计算distinct 148 5.8.6 union与union [0all0] 150 5.8.7 子查询[0no0]t in 152 5.8.8 聚合函数太多导致内存不足 154 5.9 小结 155 [0第0]6章 Greenplum高级应用 156 6.1 Appendonly表与压缩表 157 6.1.1 应用场景及语[0法0]介绍 157 6.1.2 压缩表的性能差异 157 6.1.3 Appendonly表特性 158 6.1.4 相关数据字典 164 6.2 列存储 165 6.2.1 应用场景 165 6.2.2 数据文件存储特性 166 6.2.3 如何使用列存储 166 6.2.4 性能比较 166 6.3 外部表高级应用 168 6.3.1 外部表实现原理 168 6.3.2 可写外部表 171 6.3.3 HDFS外部表 173 6.3.4 可执行外部表 177 6.4 自定义函数—各个编程接口 179 6.4.1 pl/pgsql 180 6.4.2 C语言接口 182 6.4.3 plpython 185 6.5 Greenplum MapReduce 187 6.6 小结 193 [0第0]7章 Greenplum架构介绍 195 7.1 并行和分布式计算 195 7.2 并行数据库 197 7.3 Greenplum架构分析 198 7.4 冗余与故障切换 199 7.5 数据分布及负载均衡 200 7.6 跨库关联 202 7.7 分布式事务 203 7.8 其他[0大0]数据分析方案 205 7.9 小结 208 下篇 管 理 篇 [0第0]8章 Greenplum线上环境部署 210 8.1 服务器硬件选型 210 8.1.1 CPU 211 8.1.2 内存 211 8.1.3 磁盘及硬盘接口 211 8.1.4 网络 213 8.2 服务器系统参数调整 213 8.2.1 Solaris参数修改 214 8.2.2 Linux参数修改 216 8.2.3 系统参数及性能验证 217 8.3 计算节点分配技巧 221 8.4 数据库参数介绍 221 8.5 数据库集群基准测试 225 8.6 小结 227 [0第0]9章 数据库管理 228 9.1 用户及[0权0]限管理 228 9.1.1 Greenplum数据库逻辑结构 228 9.1.2 Grant语[0法0] 229 9.2 登录[0权0]限控制 231 9.3 资源队列及并发控制 232 9.4 Greenplum锁 [1机1] 制 236 9.5 数据目录结构 238 9.6 数据文件存储分布 240 9.7 表空间管理 241 9.8 小结 244 [0第0]10章 数据库监控及调[0优0] 245 10.1 Linux监控工具介绍 245 10.1.1 监控磁盘 245 10.1.2 监控网络 246 10.1.3 监控CPU 247 10.1.4 监控内存 247 10.2 安装Performance Monitor 248 10.3 监控Segment是否正常 252 10.4 VACUUM系统表 253 10.5 数据倾斜排查 255 10.6 查看子节点的SQL运行状态 258 10.7 自动加分区 261 10.8 自动赋[0权0] 266 10.9 清理过期数据 266 10.10 小结 267 [0第0]11章 解读Greenplum维护脚本 268 11.1 添加Greenplum Contrib模块 268 11.2 启动和关闭脚本gpstart和gpstop 270 11.3 初始化系统脚本gpinitsystem 272 11.4 集群操作脚本gpssh和gpscp 274 11.5 数据库状态检查脚本gpstate 275 11.6 数据库升级脚本gpmigrate 276 11.7 参数修改脚本gpconfig 281 11.8 数据 [按需印刷]Greenplum企业应用实战 计算机与互联网 书籍|3770631 下载 mobi epub pdf txt 电子书 格式 [按需印刷]Greenplum企业应用实战 计算机与互联网 书籍|3770631 mobi 下载 pdf 下载 pub 下载 txt 电子书 下载 2024[按需印刷]Greenplum企业应用实战 计算机与互联网 书籍|3770631 下载 mobi pdf epub txt 电子书 格式 2024 [按需印刷]Greenplum企业应用实战 计算机与互联网 书籍|3770631 下载 mobi epub pdf 电子书用户评价
评分
评分
评分
评分
评分
评分
评分
评分
评分
类似图书 点击查看全场最低价
[按需印刷]Greenplum企业应用实战 计算机与互联网 书籍|3770631 mobi epub pdf txt 电子书 格式下载 2024 分享链接相关图书
|