发表于2024-11-23
书[0名0]: | [1机1] 器[0学0]习算[0法0]|7955018 |
图书定价: | 69元 |
图书作者: | (意)朱塞佩·博纳科尔索 |
出版社: | [1机1] 械工业出版社 |
出版日期: | 2018-05-01 0:00:00 |
ISBN号: | 9787111595137 |
开本: | 16开 |
页数: | 0 |
版次: | 1-1 |
作者简介 |
作者简介 Giuseppe Bonaccorso是一位拥有12年[0经0]验的 [1机1] 器[0学0]习和[0大0]数据方面的专家。他拥有意[0大0]利卡塔尼亚[0大0][0学0]电子工程专业工程[0学0]硕士[0学0]位,并在意[0大0]利罗马[0第0]二[0大0][0学0]、英[0国0]埃塞克斯[0大0][0学0]深造过。在他的职业生涯中,担任过公共管理、军事、公用事业、医疗保健、诊断[0学0]和广告等多个业务[0领0]域的IT工程师,使用Java、Python、Hadoop、Spark、Thea[0no0]和TensorFlow等多种技术进行过项目开发与管理。他的主要研究兴趣包括人工智能、 [1机1] 器[0学0]习、数据科[0学0]和精神哲[0学0]。 审校人员简介 Manuel Amunategui是SpringML公司数据科[0学0]项目副总裁。SpringML是一家初创公司,提供Google Cloud、TensorFlow和Salesforce企业解决方案。在此之前,他曾在华尔街担任量化开发人员,为一家[0大0]型股票期[0权0]交易[0商0]工作,之后担任微软的软件开发人员。他拥有预测分析和[0国0]际管理硕士[0学0]位。 他是数据科[0学0]爱好者、博主(http://amunategui.github.io),担任Udemy.com和O'Reilly Media的培训师,以及Packt出版社的技术审校人员。 Doug Ortiz是ByteCubed的一[0名0]高级[0大0]数据架构师,他在整个职业生涯中一直从事企业解决方案方面的架构、开发和集成工作。他帮助企业通过一些现有的和新兴的技术,诸如Microsoft BI Stack、Hadoop、[0No0]SQL数据库、SharePoint以及相关工具和技术,重新发现和利用未充分利用的数据。他也是Illustris公司的创始人,可通过ougortiz@illustris.org与他联系。 在专业[0领0]域,他有多平台和产[0品0]集成、[0大0]数据、数据科[0学0]、R和Python方面的丰富[0经0]验。Doug还帮助企业深入了解并重视对数据和现有资源的投资,将其转化为有用的信息来源。他利用[0独0]特和创新的技术改进、拯救并架构了多个项目。他的爱好是瑜伽和潜水。 Lukasz Tracewski是一[0名0]软件开发人员和科[0学0]家,专攻 [1机1] 器[0学0]习、数字信号处理和云计算。作为开源社区的积[0极0]成员,他也是众多研究类出版物的作者。他曾在荷兰一家高科技产业作为软件科[0学0]家工作了6年,先后在光刻和电子显微镜方面帮助构建达到生产量与物理精度[0极0]限的算[0法0]及 [1机1] 器。目前,他在金融行业[0领0]导着一支数据科[0学0]团队。 4年来,Lukasz一直在自然保护[0领0]域利用他的专业技能提供无偿服务,如从录音或卫星图像分析中进行鸟类分类等。他在业余时间从事濒危物种的保护工作。 |
内容简介 |
本书介绍了数据科[0学0][0领0]域常用的所有重要 [1机1] 器[0学0]习算[0法0]以及TensorFlow和特征工程等相关内容。涵盖的算[0法0]包括线性回归、逻辑回归、支持向量 [1机1] 、朴素贝叶斯、k均值、随 [1机1] 森林等,这些算[0法0]可以用于监督[0学0]习、非监督[0学0]习、强化[0学0]习或半监督[0学0]习。在本书中,你将[0学0][0会0]如何使用这些算[0法0]来解决所遇到的问题,并了解这些算[0法0]的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助[0大0]家进行多种算[0法0]的实践。阅读完本书后,面对你所遇到的问题,你将了解如何选择合适的聚类、分类或回归的 [1机1] 器[0学0]习算[0法0]。 |
目录 |
译者序 前言 作者简介 审校人员简介 [0第0]1章 [1机1] 器[0学0]习简介1 1.1 [0经0]典 [1机1] 器和自适应 [1机1] 器简介1 1.2 [1机1] 器[0学0]习的分类2 1.2.1 监督[0学0]习3 1.2.2 无监督[0学0]习5 1.2.3 强化[0学0]习7 1.3 [1机1] 器[0学0]习——深度[0学0]习和仿生自适应系统8 1.4 [1机1] 器[0学0]习和[0大0]数据9 延伸阅读10 本章小结10 [0第0]2章 [1机1] 器[0学0]习的重要元素11 2.1 数据格式11 2.2 可[0学0]习性13 2.2.1 欠拟合和过拟合15 2.2.2 误差度量16 2.2.3 PAC[0学0]习18 2.3 统计[0学0]习方[0法0]19 2.3.1 [0大0]后验概率[0学0]习20 2.3.2 [0大0]似然[0学0]习20 2.4 信息论的要素24 参考文献26 本章小结26 [0第0]3章 特征选择与特征工程28 3.1 scikit-learn练习数据集28 3.2 创建训练集和测试集29 3.3 管理分类数据30 3.4 管理缺失特征33 3.5 数据缩放和归一化33 3.6 特征选择和过滤35 3.7 主成分分析37 3.7.1 非负矩阵分解42 3.7.2 稀疏PCA42 3.7.3 核PCA43 3.8 原子提取和字典[0学0]习45 参考文献47 本章小结47 [0第0]4章 线性回归48 4.1 线性模型48 4.2 一个二维的例子48 4.3 基于scikit-learn的线性回归和更高维50 4.4 Ridge、Lasso和ElasticNet53 4.5 随 [1机1] 采样一致的鲁棒回归57 4.6 多项式回归58 4.7 保序回归60 参考文献62 本章小结62 [0第0]5章 逻辑回归64 5.1 线性分类64 5.2 逻辑回归65 5.3 实现和[0优0]化67 5.4 随 [1机1] 梯度下降算[0法0]69 5.5 通过网格搜索找到[0优0][0超0]参数71 5.6 [0评0]估分类的指标73 5.7 ROC曲线77 本章小结79 [0第0]6章 朴素贝叶斯81 6.1 贝叶斯定理81 6.2 朴素贝叶斯分类器82 6.3 scikit-learn中的朴素贝叶斯83 6.3.1 伯努利朴素贝叶斯83 6.3.2 多项式朴素贝叶斯85 6.3.3 高斯朴素贝叶斯86 参考文献89 本章小结89 [0第0]7章 支持向量 [1机1] 90 7.1 线性支持向量 [1机1] 90 7.2 scikit-learn实现93 7.2.1 线性分类94 7.2.2 基于内核的分类95 7.2.3 非线性例子97 7.3 受控支持向量 [1机1] 101 7.4 支持向量回归103 参考文献104 本章小结104 [0第0]8章 决策树和集成[0学0]习105 8.1 二元决策树105 8.1.1 二元决策106 8.1.2 不纯度的衡量107 8.1.3 特征重要度109 8.2 基于scikit-learn的决策树分类109 8.3 集成[0学0]习113 8.3.1 随 [1机1] 森林114 8.3.2 AdaBoost116 8.3.3 梯度树提升118 8.3.4 投票分类器120 参考文献122 本章小结122 [0第0]9章 聚类基础124 9.1 聚类简介124 9.1.1 k均值聚类125 9.1.2 DBSCAN136 9.1.3 光谱聚类138 9.2 基于实证的[0评0]价方[0法0]139 9.2.1 同质性140 9.2.2 完整性140 9.2.3 修正兰德指数141 参考文献142 本章小结142 [0第0]10章 层次聚类143 10.1 分层策略143 10.2 凝聚聚类143 10.2.1 树形图145 10.2.2 scikit-learn中的凝聚聚类147 10.2.3 连接限制149 参考文献151 本章小结152 [0第0]11章 推荐系统简介153 11.1 朴素的基于用户的系统153 11.2 基于内容的系统156 11.3 无模式(或基于内存的)协同过滤158 11.4 基于模型的协同过滤160 11.4.1 奇异值分解策略161 11.4.2 交替小二乘[0法0]策略163 11.4.3 用Apache Spark MLlib实现交替小二乘[0法0]策略164 参考文献167 本章小结167 [0第0]12章 自然语言处理简介169 12.1 NLTK和内置语料库169 12.2 词袋策略171 12.2.1 标记172 12.2.2 停止词的删除174 12.2.3 词干提取175 12.2.4 向量化176 12.3 基于路透社语料库的文本分类器例子180 参考文献182 本章小结182 [0第0]13章 自然语言处理中的主题建模与情感分析183 13.1 主题建模183 13.1.1 潜在语义分析183 13.1.2 概率潜在语义分析188 13.1.3 潜在狄利克雷分配193 13.2 情感分析198 参考文献202 本章小结202 [0第0]14章 深度[0学0]习和TensorFlow简介203 14.1 深度[0学0]习简介203 14.1.1 人工神[0经0]网络203 14.1.2 深层结构206 14.2 TensorFlow简介208 14.2.1 计算梯度210 14.2.2 逻辑回归212 14.2.3 用多层感[0知0]器进行分类215 14.2.4 图像卷积218 14.3 Keras内部速览220 参考文献225 本章小结225 [0第0]15章 构建 [1机1] 器[0学0]习框架226 15.1 [1机1] 器[0学0]习框架226 15.1.1 数据收集227 15.1.2 归一化227 15.1.3 降维227 15.1.4 数据扩充228 15.1.5 数据转换228 15.1.6 建模、网格搜索和交叉验证229 15.1.7 可视化229 15.2 用于 [1机1] 器[0学0]习框架的scikit-learn工具229 15.2.1 管道229 15.2.2 特征联合232 参考文献233 本章小结233 |
机器学习算法 计算机与互联网 书籍|7955018 下载 mobi pdf epub txt 电子书 格式 2024
机器学习算法 计算机与互联网 书籍|7955018 下载 mobi epub pdf 电子书机器学习算法 计算机与互联网 书籍|7955018 mobi epub pdf txt 电子书 格式下载 2024