发表于2025-01-10
书[0名0]: | Python数据分析与数据化运营|6998727 |
图书定价: | 99元 |
图书作者: | 宋天龙 |
出版社: | 机械工业出版社 |
出版日期: | 2018/1/1 0:00:00 |
ISBN号: | 9787111584605 |
开本: | 16开 |
页数: | 541 |
版次: | 1-1 |
作者简介 |
宋天龙(TonySong)[0大0]数据技术专家,历任软通动力集团[0大0]数据研究院数据总监、Webtrekk(德[0国0][0大0]的网站数据分析服务提供[0商0])中[0国0]区技术和咨询负责人、[0国0]美在线[0大0]数据中心经理。擅长数据挖掘、建模、分析与运营,精通端到端的数据价值场景设计、业务需求转换、数据结构梳理、数据建模与[0学0]习,以及数据工程交付。拥有丰富的数据项目工作经验,参与过集团和企业级数据体系规划、[0大0]数据产[0品0]开发、网站流量系统建设、网站智能推荐、企业[0大0]数据智能等[0大0]型数据工作项目。参与实施多个客户案例,包括Webpower、德[0国0]OTTO集团电子[0商0]务(中[0国0])、Esprit中[0国0]、猪八戒网、顺丰[0优0]选、乐视[0商0]城、泰康人寿、酒仙网,[0国0]美在线、迪信通等。著有《网站数据挖掘与分析:系统方[0法0]与[0商0]业实践》《企业[0大0]数据系统构建实战:技术、架构、实施与应用》。 |
内容简介 |
这是一部从实战角度讲解如何利用Python进行数据分析、挖掘和数据化运营的著作,不仅对数据分析的关键技术和技巧进行了总结,更重要的是对[0会0]员、[0商0][0品0]、流量、内容4个主题的数据化运营进行了系统讲解。作者是[0国0]内一线数据分析师和[0大0]数据专家,在数据分析和数据化运营[0领0]域有近10年的经验,在业内颇具[0知0][0名0]度和影响力。本书不仅得到了宋星、黄成明、宫鑫等14位资深专家的好[0评0]和推荐,还得到了天善智能、中[0国0]统计网等多个数据科[0学0]相关机构的支持和高度认可。全书的内容在逻辑上共分为两[0大0]部分:部分([0第0]1~4章):Python数据分析与挖掘着重讲解了Python和数据化运营的基本[0知0]识,以及Python数据获取(结构化和非结构化)、预处理、分析和挖掘的关键技术和经验。包含11条数据预处理经验、39个数据预处理[0知0]识点、14个数据分析和挖掘的建模主题。[0第0]二部分([0第0]5~9章):Python数据化运营这是本书的核心,详细讲解了[0会0]员运营、[0商0][0品0]运营、流量运营和内容运营4[0大0]主题,以及提升数据化运营价值的方[0法0]。在每个运营主题中都包含了基本[0知0]识、[0评0]估指标、应用场景、数据分析模型、数据分析小技巧、数据分析[0大0]实话以及2个综合性的应用案例。本书提供案例数据和源代码(中文注释)下载,供读者实操时使用。 |
目录 |
赞誉 前言 [0第0]1章 Python和数据化运营1 1.1 用Python做数据化运营1 1.1.1 Python是什么1 1.1.2 数据化运营是什么2 1.1.3 Python用于数据化运营5 1.2 数据化运营所需的Python相关工具和组件6 1.2.1 Python程序6 1.2.2 Python IDE7 1.2.3 Python[0第0]三方库8 1.2.4 数据库和客户端16 1.2.5 SSH远程客户端18 1.3 内容延伸:Python的OCR和TensorFlow18 1.3.1 OCR工具:Tesseract-OCR18 1.3.2 机器[0学0]习框架—TensorFlow19 1.4 个用Python实现的数据化运营分析实例—销售预测20 1.4.1 案例概述20 1.4.2 案例过程20 1.4.3 案例小结28 1.5 本章小结28 [0第0]2章 数据化运营的数据来源31 2.1 数据化运营的数据来源类型31 2.1.1 数据文件31 2.1.2 数据库32 2.1.3 API33 2.1.4 流式数据34 2.1.5 外部公开数据34 2.1.6 其他35 2.2 使用Python获取运营数据35 2.2.1 从文本文件读取运营数据35 2.2.2 从Excel获取运营数据46 2.2.3 从关系型数据库MySQL读取运营数据48 2.2.4 从非关系型数据库MongoDB读取运营数据56 2.2.5 从API获取运营数据59 2.3 内容延伸:读取非结构化网页、文本、图像、视频、语音64 2.3.1 从网页中爬取运营数据64 2.3.2 读取非结构化文本数据65 2.3.3 读取图像数据65 2.3.4 读取视频数据68 2.3.5 读取语音数据70 2.4 本章小结75 [0第0]3章 11条数据化运营不得不[0知0]道的数据预处理经验76 3.1 数据清洗:缺失值、异常值和重复值的处理76 3.1.1 数据列缺失的4种处理方[0法0]76 3.1.2 不要轻易抛弃异常数据78 3.1.3 数据重复就需要去重吗79 3.1.4 代码实操:Python数据清洗81 3.2 将分类数据和顺序数据转换为标志变量89 3.2.1 分类数据和顺序数据是什么89 3.2.2 运用标志方[0法0]处理分类和顺序数据90 3.2.3 代码实操:Python标志转换90 3.3 [0大0]数据时代的数据降维94 3.3.1 需要数据降维的情况94 3.3.2 基于特征选择的降维94 3.3.3 基于维度转换的降维96 3.3.4 代码实操:Python数据降维97 3.4 解决样本类别分布不均衡的问题100 3.4.1 哪些运营场景中容易出现样本不均衡100 3.4.2 通过过抽样和欠抽样解决样本不均衡101 3.4.3 通过正负样本的惩罚[0权0]重解决样本不均衡101 3.4.4 通过组合/集成方[0法0]解决样本不均衡102 3.4.5 通过特征选择解决样本不均衡102 3.4.6 代码实操:Python处理样本不均衡102 3.5 如何解决运营数据源的冲突问题106 3.5.1 为什么[0会0]出现多数据源的冲突107 3.5.2 如何应对多数据源的冲突问题109 3.6 数据化运营要抽样还是全量数据109 3.6.1 什么时候需要抽样110 3.6.2 如何进行抽样110 3.6.3 抽样需要注意的几个问题111 3.6.4 代码实操:Python数据抽样113 3.7 解决运营数据的共线性问题116 3.7.1 如何检验共线性117 3.7.2 解决共线性的5种常用方[0法0]117 3.7.3 代码实操:Python处理共线性问题118 3.8 有关相关性分析的混沌120 3.8.1 相关和因果是一回事吗120 3.8.2 相关系数低就是不相关吗121 3.8.3 代码实操:Python相关性分析121 3.9 标准化,让运营数据落入相同的范围122 3.9.1 实现中心化和正态分布的Z-Score122 3.9.2 实现归一化的Max-Min123 3.9.3 用于稀疏数据的MaxAbs123 3.9.4 针对离群点的RobustScaler123 3.9.5 代码实操:Python数据标准化处理123 3.10 离散化,对运营数据做逻辑分层126 3.10.1 针对时间数据的离散化127 3.10.2 针对多值离散数据的离散化127 3.10.3 针对连续数据的离散化127 3.10.4 针对连续数据的二值化128 3.10.5 代码实操:Python数据离散化处理128 3.11 数据处理应该考虑哪些运营业务因素133 3.11.1 考虑固定和突发运营周期133 3.11.2 考虑运营需求的有效性134 3.11.3 考虑交付时要贴合运营落地场景134 3.11.4 不要忽视业务专家经验135 3.11.5 考虑业务需求的变动因素136 3.12 内容延伸:非结构化数据的预处理137 3.12.1 网页数据解析137 3.12.2 网络用户日志解析144 3.12.3 图像的基本预处理148 3.12.4 自然语言文本预处理154 3.13 本章小结157 [0第0]4章 跳过运营数据分析和挖掘的“[0大0]坑”159 4.1 聚类分析159 4.1.1 [0当0]心数据异常对聚类结果的影响160 4.1.2 [0超0][0大0]数据量时应该放弃K均值算[0法0]160 4.1.3 聚类不仅是建模的终点,更是重要的中间预处理过程162 4.1.4 高维数据上无[0法0]应用聚类吗163 4.1.5 如何选择聚类分析算[0法0]164 4.1.6 代码实操:Python聚类分析164 4.2 回归分析172 4.2.1 注意回归自变量之间的共线性问题172 4.2.2 相关系数、判定系数和回归系数之间到底什么关系172 4.2.3 判定系数是否意味着相应的因果联系173 4.2.4 注意应用回归模型时研究自变量是否产生变化173 4.2.5 如何选择回归分析算[0法0]174 4.2.6 代码实操:Python回归分析174 4.3 分类分析183 4.3.1 防止分类模型的过拟合问题183 4.3.2 使用关联算[0法0]做分类分析183 4.3.3 用分类分析来提炼规则、提取变量、处理缺失值184 4.3.4 类别划分-分类算[0法0]和聚类算[0法0]都是好手185 4.3.5 如何选择分类分析算[0法0]186 4.3.6 代码实操:Python分类分析187 4.4 关联分析195 4.4.1 频繁规则不一定是有效规则195 4.4.2 不要被啤酒尿布的故事紧固你的思维196 4.4.3 被忽略的“负相关”模式真的毫无用武之地吗197 4.4.4 频繁规则只能打包组合应用吗198 4.4.5 关联规则的序列模式199 4.4.6 代码实操:Python关联分析200 4.5 异常检测分析206 4.5.1 异常检测中的“新奇检测”模式207 4.5.2 将数据异常与业务异常相分离207 4.5.3 面临维度灾难时,异常检测可能[0会0]失效208 4.5.4 异常检测的结果能说明异常吗208 4.5.5 代码实操:Python异常检测分析208 4.6 时间序列分析212 4.6.1 如果有自变量,为什么还要用时间序列212 4.6.2 时间序列不适合[0商0]业环境复杂的企业213 4.6.3 时间序列预测的整合、横向和纵向模式214 4.6.4 代码实操:Python时间序列分析214 4.7 路径、漏斗、归因和热力图分析234 4.7.1 不要轻易相信用户的页面访问路径237 4.7.2 如何将路径应用于更多用户行为模式的挖掘?237 4.7.3 为什么很多数据都显示多渠道路径的价值很小?238 4.7.4 点击热力图真的反映了用户的点击喜好?239 4.7.5 为什么归因分析主要存在于线上的转化行为240 4.7.6 漏斗分析和路径分析有什么区别240 4.8 其他数据分析和挖掘的忠告241 4.8.1 不要忘记数据质量的验证241 4.8.2 不要忽视数据的落地性242 4.8.3 不要把数据陈列[0当0]作数据结论242 4.8.4 数据结论不要产生于单一指标244 4.8.5 数据分析不要预设价值立场244 4.8.6 不要忽视数据与业务的需求冲突问题245 4.9 内容延伸:非结构化数据的分析与挖掘246 4.9.1 词频统计246 4.9.2 词性标注249 4.9.3 关键字提取253 4.9.4 文本聚类255 4.10 本章小结258 [0第0]5章 [0会0]员数据化运营260 5.1 [0会0]员数据化运营概述260 5.2 [0会0]员数据化运营关键指标261 5.2.1 [0会0]员整体指标261 5.2.2 [0会0]员营销指标261 5.2.3 [0会0]员活跃度指标263 5.2.4 [0会0]员价值度指标265 5.2.5 [0会0]员终生价值指标266 5.2.6 [0会0]员异动指标266 5.3 [0会0]员数据化运营应用场景267 5.3.1 [0会0]员营销267 5.3.2 [0会0]员关怀267 5.4 [0会0]员数据化运营分析模型268 5.4.1 [0会0]员细分模型268 5.4.2 [0会0]员价值度模型269 5.4.3 [0会0]员活跃度模型270 5.4.4 [0会0]员流失预测模型271 5.4.5 [0会0]员特征分析模型272 5.4.6 营销响应预测模型273 5.5 [0会0]员数据化运营分析小技巧274 5 Python数据分析与数据化运营 计算机与互联网 书籍|6998727 下载 mobi epub pdf txt 电子书 格式 Python数据分析与数据化运营 计算机与互联网 书籍|6998727 mobi 下载 pdf 下载 pub 下载 txt 电子书 下载 2025Python数据分析与数据化运营 计算机与互联网 书籍|6998727 下载 mobi pdf epub txt 电子书 格式 2025 Python数据分析与数据化运营 计算机与互联网 书籍|6998727 下载 mobi epub pdf 电子书用户评价
评分
评分
评分
评分
评分
评分
评分
评分
评分
类似图书 点击查看全场最低价
Python数据分析与数据化运营 计算机与互联网 书籍|6998727 mobi epub pdf txt 电子书 格式下载 2025 分享链接相关图书
|