发表于2024-12-24
书名 | 基于Apache Kylin构建大数据分析平台 |
定价 | 69 |
ISBN | 9787302454526 |
出版社 | 清华大学出版社 |
作者 | 蒋守壮 |
编号 | 1201432098 |
出版日期 | 2017-01-01 |
印刷日期 | 2017-01-01 |
版次 | 1 |
字数 | 4350 |
页数 | 260 |
D1—部分ApacheKylin基础部分 D11章ApacheKylin前世今生 1.1ApacheKylin的背景 1.2ApacheKylin的应用场景 1.3ApacheKylin的发展历程 D12章ApacheKylin前奏 2.1事实表和维表 2.2星型模型和雪花型模型 2.2.1星型模型 2.2.2雪花型模型 2.2.3星型模型示例 2.3OLAP 2.3.1OLAP分类 2.3.2OLAP的基本操作 2.4数据立方体-DataCube D13章ApacheKylin工作原理和体系架构 3.1Kylin工作原理 3.2Kylin体系架构 3.3Kylin中的核心部分:Cube构建 3.4Kylin的SQL查询 3.5Kylin的特性和生态圈 D14章搭建CDH大数据平台 4.1系统环境和安装包 4.1.1系统环境 4.1.2安装包的下载 4.2准备工作:系统环境搭建 4.2.1网络配置-CDH集群所有节点1 4.2.2打通SSH 设置ssh无密码登录-所有节点 4.3正式安装CDH:准备工作 4.4正式安装CDH5:安装配置 4.4.1CDH5的安装配置 4.4.2对Hive、HBase执行简单操作 D15章使用Kylin构建企业大数据分析平台的4种部署方式 5.1Kylin部署的架构 5.2Kylin的四种典型部署方式 D16章单独为Kylin部署HBase集群 D17章部署Kylin集群环境 7.1部署Kylin的先决条件 7.2部署Kylin集群环境 7.3为Kylin集群搭建负载均衡器 7.3.1搭建Nginx环境 7.3.2配置Nginx实现Kylin的负载均衡 D1二部分ApacheKylin进阶部分 D18章Demo案例实战 8.1SampleCube案例描述 8.2SampleCube案例实战 8.2.1准备数据 8.2.2构建Cube D19章多维分析的Cube创建实战 9.1Cube模型 9.2创建Cube的流程 9.2 1步骤一:Hive中事实表 以及多张维表的处理 9.2.2步骤二:Kylin中建立项目-Project 9.2.3步骤三:Kylin中建立数据源-DataSource 9.2.4步骤四:Kylin中建立数据模型-Model 9.2.5步骤五:Kylin中建立Cube 9.2.6步骤六:BuildCube 9.2.7步骤七:查询Cube D110章BuildCube的来龙去脉 10.1流程分析 10.2小结 D1三部分ApacheKylingao级部分 D111章Cube优化 D112章备份Kylin的Metadata 12.1Kylin的元数据 12.2备份元数据 12.3恢复元数据 D113章使用Hive视图 13.1使用Hive视图 13.2使用视图实战 D114章Kylin的垃圾清理 14.1清理元数据 14.2清理存储器数据 D115章JDBC访问方式 D116章通过RESTful访问Kylin D117章Kylin版本之间升级 17.1从1.5.2升级到*新版本1.5.3 17.2从1.5.1升级到1.5.2版本 17.3从Kylinl.5.2.1升级到Kylin1.5.3实战 17.4补充内容 D118章大数据可视化实践 18.1可视化工具简述 18.2安装KylinODBC驱动 18.3通过Excel访问Kylin 18.4通过PowerBI访问Kylin 18.4.1安装配置PowerBI 18.4.2实战操作 18.5通过Tableau访问Kylin 18.6KylinMondrianSaiku 18.7实战演练:通过Saiku访问Kylin 18.7.1D1一个Schema例子:myproject_pvuv_cube的演示 18.7.2D1二个Schema例子:kylin_sales_cube的演示 18.7.3Saiku使用的一些问题 18.8通过ApacheZepplin访问Kylin 18.9通过Kylin的“Insight”查询 D119章使用StreamingTable构建准实时Cube D120章快速数据立方算法 20.1快速数据立方算法概述 20.2快速数据立方算法优点和缺点 20.3获取FastCubing算法的优势 D1四部分ApacheKylin的扩展部分 D121章大数据智能分析平台KAP 21.1大数据智能分析平台KAP概述 21.2KAP的安装部署 |
蒋守壮 现就职于万达网络科技集团有限公司 资历大数据工程师 大数据实践者。曾任平安科技资历大数据分析师和架构师 CSDN社区专家 知识库特邀编辑。目前专注于Docker、Kubernetes、Mesos、Hadoop、Spark和Kylin等技术领域。 |
普通大众 |
ApacheKylin是一个开源的分布式分析引擎 提供Hadoop之上的SQL查询接口及多维分析-OLAP能力以支持超大规模数据 很初由eBay公司开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。 本书分为21章 详细讲解ApacheKylin概念、安装、配置、部署 让读者对ApacheKylin构建大数据分析平台有一个感性认识。同时 本书从应用角度 结合Dome和实例介绍了用于多维分析的Cube算法的创建、配置与优化。很后还介绍了Kyligence公司发布KAP大数据分析平台 对读者有极大的参考价值。 本书适合大数据技术初学者、大数据分析人员、大数据架构师等 也适合用于高等院校和培训学校相关专业师生教学参考。 |
包邮 基本拉伸:改善颈肩腰痛的肌肉伸展运动全书 拉伸基本动作 肌肉锻炼教程指导 下载 mobi pdf epub txt 电子书 格式 2024
包邮 基本拉伸:改善颈肩腰痛的肌肉伸展运动全书 拉伸基本动作 肌肉锻炼教程指导 下载 mobi epub pdf 电子书包邮 基本拉伸:改善颈肩腰痛的肌肉伸展运动全书 拉伸基本动作 肌肉锻炼教程指导 mobi epub pdf txt 电子书 格式下载 2024