发表于2024-12-26
大嘴巴带你玩转数据挖掘
让你知道啤酒君和尿布君为什么会相遇,大数据的小科普让你成为"读心"魔法师!
数据挖掘私人定制 轻松掌控再无敌手
拒绝枯燥越过三境 火爆网络疯狂下载
《大嘴巴漫谈数据挖掘(全彩)》从基本的概率统计学开始,全面、系统、形象而又深入地描述了数据挖掘的基础概念、应用领域以及常用算法。其中每一种数据挖掘算法都辅以通俗易懂的实例,读者能够在直观性、趣味性中学习算法的具体流程,明白算法的实现过程。通过《大嘴巴漫谈数据挖掘(全彩)》的学习,读者可以对数据挖掘的概念、应用和算法技术有一个清晰的理解和认识,并可以熟悉相关统计学的基本原理。
《大嘴巴漫谈数据挖掘(全彩)》适合想从事数据挖掘方面的工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。
易向军,北京科技大学计算机硕士学历,长期工作于互联网和电信领域,目前创办dazui8.com,致力于数据挖掘知识的宣传推广以及相关技术的研发探索。关注公众号:dazui8bbs 与作者互动并收听免费在线配套讲座。一图一话千层意,千问千题一片情。有情有意!
★既有漫画小插图,又有七绝或者七律打油诗,相当的简明易懂啊。多次出场的啤酒君和尿布君,相当有喜感。但是看着看着就变成了概率统计教科书了有木有——贝叶斯、高斯。多希望我在考研前看到这本书啊,会对我的数学考试有帮助吧!
——展展
★看了这本书,确有解惑醒脑之功效,作者很明白我们这些科技小白的理解能力,不敢把话说得太专业,确实通俗易懂,深入浅出,层层推进,让初学者都有很强的兴趣学进去,对只想做了解的同学来说也不难接受,算是很好的科普作品了。
——大雄不贰
★漫谈类,减少了大数据的枯燥,感觉看一遍还不能及时消化,有空再慢慢精读一下。
——杨旭彬
★把数据挖掘写得深入浅出,很容易读懂,实用性强。
——傅志华
★书中关于数据挖掘章节的介绍,我特别喜欢,毕竟在数据爆炸的今天,只有从数据中找到别人没发现的亮点才是关键。
——由子木
★这本书非常值得每一个对数据感兴趣的人士细细研读!
——李洪宇
★很是喜欢易老师的这种写书风格,可以让我们轻松地学到知识,超赞!
——骆彬
★把复杂的统计知识和数据挖掘算法用图形化后,就很适合作为科普型的数据挖掘入门书籍,好干货!
——麒程
★比较简单,每个点都可以自行扩展学习,就像个全面的大字典目录一样,通读此书后,可以很好地把握常规的数据挖掘知识和思想。
——金石头
★总体来说通俗易懂,有一些总结和图片很有助于理解,总之是能把数据挖掘这种相对枯燥的东西让人读下去,这样来说总体是非常不错的。
——Woozy
第一境 昨夜西风凋碧树。独上高楼,望尽天涯路……
1.1数据挖掘简介
开篇点题引五问
大数据中求价值
定义概述归特点
知识决策跨领域
架构特征多形式
数据立方展多维
功能挖掘四大类
分类刻画类标识
数据聚类辨亲疏
预测未来训模型
关联源自购物篮
模型过程方法论
十大算法成经典
1.2数据挖掘应用
行业推广多应用
用户为王放心中
指导运营全周期
定位目标寻用户
精准营销成闭环
交叉产品有关联
细分用户刻画像
用户体验模型化
指标评测建体系
流失预警保用户
跟踪评估验效果
第二境 衣带渐宽终不悔,为伊消得人憔悴……
2.1概率定义
浮生难料尽偶然
一枚硬币抛正反
引出随机小试验
样本空间样本点
事件三分包万象
试验频率需频繁
次数无限值极限
描述概率定特点
古典概型等可能
事件B后A在前
求出概率称条件
独立事件A和B
抽签中奖公平性
常用概率两公式
交空并全划样本
综合状态全概率
前因后果贝叶斯
2.2随机变量
随机试验数量化
统计规律双类型
离散变量分布律
硬币抛掷是一零
分布函数连续型
函数求导得密度
高斯分布称正态
标准正态分位点
2.3数字特征
随机变量有特征
平均取值是期望
方差衡量偏离值
标准开根同量纲
变量关系协方差
相关系数相关度
研究总体要抽样
抽样分布统计量
2.4参数估计
最小二乘估参数
极大似然大概率
区间估计置信度
2.5假设检验
总体假设来检验
服从正态抽样本
统计量中验假设
弃真取伪两错误
显著检验小概率
小概率中拒绝域
检验流程出决策
已知总体方差值
检验中验均值
第三境 众里寻她千百度,蓦然回首,那人却在,灯火阑珊处。
3.1关联规则
购物篮中找关联
数据事务若干项
事务空间含项集
置信支持提升度
规则源于频繁项
k项连接和剪枝
生成非空规则集
关联效果来评估
3.2决策树
决策思维成树形
分类预测工作流
原理基于信息熵
信息增益条件熵
节点拆分选特征
3.3贝叶斯
预测分类贝叶斯
类别概率要最大
分类数据新预测
3.4聚类分析
物以类聚人以群
样本变量定矩阵
R型Q型换空间
距离度量相似度
系数聚类统计量
标准样本选欧氏
层次聚合归大类
3.5神经网络
神经网络神经元
神经元中有加权
输入映射输出层
求出误差调参数
权重偏置学习率
实例分析模型流
3.6线性回归
研究身高引回归
单自变量归一元
最小二乘估回归
数据差异总离差
分为解释和误差
判定系数拟合度
多元回归建方程
回归面中展二元
求得回归系数解
衡量拟合验效果
3.7逻辑回归
因变量中二分类
二项逻辑回归式
极大似然解方程
预测分类符合率
3.8因子分析
相关变量纳因子
因子构造筑模型
因子载荷统计性
衡量信息共同度
方差贡献重要性
因子分析四步曲
构造因子求载荷
旋转因子得命名
因子组合求得分
3.9信度分析
设计问卷来调研
信度检验可靠性
3.10效度分析
结构方程协方差
测量模型内外生
结构模型潜变量
效度分析路径图
提出假设依理论
固定负荷识模型
相关阵中估参数
数据挖掘,作为大数据时代的关键技术及核心内容,其应用价值与日俱增。本书希望能够成为一本涵盖最广泛读者受众的科普型数据挖掘入门读物,并传递一种知识图形化的书写理念,以图形化的展现、言简意赅的语言、通俗易懂的实例来描述复杂的概率统计知识和数据挖掘常用算法,使得读者在新颖性、趣味性和直观性中读完本书后,对于数据挖掘的整体架构和关键知识点有所理解和掌握。复杂问题的图形简约化表示是本书的主要特点。
为什么要写作本书
一般来说,学习数据挖掘要求读者已经具备一定的专业水平和相关技能。本书从最基本的概率统计开始,由浅入深,由易到难,由总到分,使得普通读者也能够了解和掌握常规的数据挖掘理论和知识。
管理者:虽不用到一线从事具体的数据分析工作,但也需要一本通俗易懂的数据挖掘基础读物,通过学习能够对下属的工作方向给予指导。
客户经理:如何开展针对性的营销活动,避免客户流失,这都需要数据挖掘知识。
产品经理:如何促进产品的用户活跃和业务的有效使用,不仅要靠经验,数据才最有说服力。
工程师:一线的数据挖掘开发人员必然要掌握的。
分析师:撰写经营分析报告数据挖掘知识必不可少。
教师:数据挖掘的参考书。
学生:想从事数据分析和挖掘方面的工作,肯定是要学习的。
数据分析爱好者:一本通俗易懂的入门读物。
本书主要内容
本书基本上涵盖了学习数据挖掘需要掌握的大部分核心知识点,分为三境17章。第一境总体介绍数据挖掘概况和应用领域,第二境讲解基本概率统计知识,第三境具体描述了数据挖掘常用的十大算法。
致谢
本书的顺利出版离不开电子工业出版社博文视点编辑老师们的辛勤工作,在此表示最诚挚的感谢!
同时,对于本书的创作形式和书写理念,本书的出版人孙学瑛女士给予了最大的支持和保留,并提供了大量的指导和帮助。衷心感谢孙老师对本书的重视和欣赏,以及为本书出版所做的一切,并将终身难忘!
由于作者水平有限,书中不足及错误之处在所难免,敬请专家和读者给予批评指正。
易向军
2014年3月
大嘴巴漫谈数据挖掘(全彩) 下载 mobi pdf epub txt 电子书 格式 2024
大嘴巴漫谈数据挖掘(全彩) 下载 mobi epub pdf 电子书【京东】嘿,您的包裹已投递板桥金~~~~~~
评分重磅推荐:
评分非常清楚明白
评分因为经常在京东买东西,东西很多,一一评价不过来,所以我决定用同一回复的形式进行评价。当然,这是针对没有问题的商品。也就是说当你看到我这个评价的时候,就说明这个产品没有问题。因为有问题的产品我会很认真的写差评,并且一个个的指出缺点。很显然,目前的这个商品是没有问题的,所以你会看到以上这段复制黏贴的文字。而且京东送货态度实在太棒,忍不住一直好评,东西绝对的正品。
评分不错 帮助大 很好 是用 好
评分刚刚看了前半部分,感觉还不错。
评分书没有塑封,内容还没开始看
评分很好啊很好啊很好啊很好啊很好啊
评分入门级,一般般
大嘴巴漫谈数据挖掘(全彩) mobi epub pdf txt 电子书 格式下载 2024