品味大数据 pdf epub mobi txt 电子书下载 2026

简体网页||繁体网页

☆☆☆☆☆

张玉宏著

图书标签:

大数据
数据分析
商业智能
数据挖掘
数据可视化
决策支持
行业应用
数字化转型
管理学
科技

下载链接在页面底部

facebook linkedin mastodon messenger pinterest reddit telegram twitter viber vkontakte whatsapp 复制链接

想要找书就要到图书大百科

book.teaonline.club

立刻按 ctrl+D收藏本页

你会得到大惊喜!!

出版社：北京大学出版社

ISBN：9787301276099

版次：1

商品编码：11993015

包装：平装

开本：16开

出版时间：2016-10-01

用纸：胶版纸

页数：420

字数：620000

具体描述

产品特色

编辑推荐

　　《品味大数据》与市面上图书不同的是从多维度对大数据的历史、内涵、哲学与技术四个方面对大数据进行了深入的探讨，用百位大牛的观点论辩来帮助读者形成自己的大数据认知体系。
　　图书行文幽默、结构完整、图文并茂通俗易懂，让读者寓学于乐。
　　率先采用正反辩论的方法对观点形成阐述，让读者可以从辩证的角度去品味大数据。

内容简介

　　当下，大数据是一个热门的话题，很多领域的学者，从不同的角度进行了深入的讨论。《品味大数据》从大数据的历史、内涵、哲学和技术四个角度，全面解析大数据，让读者对大数据有更深入的了解。

　　全书共11章，大致分为4块：第1-3章主要漫谈了大数据的有趣的历史，包括数据的启蒙、信息载体的演变和数据管理的发展脉络。第4-6章主要聊聊大数据的内涵，包括大数据与哲学及第四科学范式的关联。第7-9张是大数据的杂谈，包括大数据的用途、可能面临的陷阱以及通过小故事对大数据进行一些反思，第10-11章主要涉及大数据的技术，包括100余篇大数据论文的漫读及Hadoop的初级实战篇。

　　图书结构完整，行文幽默，并以图文并茂、通俗易懂的方式力图让读者心有余地品味大数据。图书援引了数以百计大家牛人的观点，或褒或贬，高手过招，精彩纷呈，是一本不容读者错过的大数据图书。

作者简介

　　张玉宏留美博士，曾跟随导师Alok Choudhary教授参加了奥巴马总统办公室有关Big Data（大数据）研讨会。

精彩书摘

5.2 大、小数据的“质”不同

大数据的实质是什么？在第四章中，我们已经讨论过这个议题。虽然当前学术界和实业界对此都还没有一个统一的定义或认知，但从狭义的字面来理解的话，它应该与小数据相对应，大数据是指数据量特别巨大，超出了常规的处理能力，需要引入新的科学工具和技术手段，方能够进行处理的数据集合。
于此对应的，所谓的小数据指的是，数据规模比较小，用传统的工具和方法就足以完成处理的数据集合。下面我们用一段天文学家第谷·布拉赫和约翰尼斯·开普勒的故事来举例说明小数据的应用。
在16 世纪，有位杰出的占星学家、天文学学家，名叫第谷·布拉赫（TychoBrahe，1546—1601）。第谷出生于丹麦的一个贵族家庭。早在1572 年，第谷凭借自己出色的观察能力，发现仙后座中的一颗新星，后来受惜才的普鲁士国王腓特烈二世（Friedrich Ⅱ）b 的邀请，他在汶岛建造天堡观象台，经过20 年的观测，发现了许多新的天文现象。第谷是天文史上的一位奇人。他对于星象所做的观测精度之高，是他同时代的人望尘莫及的，他编纂的星表的数据甚至接近了肉眼分辨率的极限。
1597 年，有位才华横溢的年轻人约翰尼斯· 开普勒（Johannes Kepler，1571—1630）渐露头角，年仅26 岁的他出版了自己对宇宙模型猜想的著作——《神秘的宇宙》（Mysterium Cosmographicum）。在这本书中，开普勒设计了一个非常有趣的、由许多有规则的几何形体构成的宇宙模型。
1599 年，第谷看到这本书，十分欣赏开普勒的智慧和才能，立即诚邀他做自己的助手。开普勒来到第谷身边以后，师徒二人“珠联璧合”，朝夕相处，对天文学领域共同的狂热，让他们结成忘年交。
但是，好景不长，开普勒受多疑的妻子的挑唆，突然和第谷决裂，不辞而别。开普勒的离去，使爱才如命的第谷非常伤心。他意识到这完全是一种误会，立即写信给开普勒解释，并胸怀宽广地请他回来继续合作。开普勒读了第谷的诚挚来信，感到十分愧疚。当两人重修旧时，第谷不记旧怨，不但把才华出众的开普勒推荐给国王腓特烈二世，还把自己20 多年辛勤工作积累下来的观测资料和手稿，全部交给开普勒使用。他对开普勒说：“除了火星所给予你的麻烦之外，其他一切麻烦都没有了。现在我把火星的研究也要交托于你，它够你一个人麻烦的了。”
开普勒在接手第谷观测的数据后，这批花费第谷20 多年时间得到的数据，很快就在开普勒手中“妙笔生花”，开普勒经过手工计算，从中发现了著名的“行星运动三大定律”，即轨道定律、面积定律和周期定律。这三大定律最终使开普勒赢得了“天空立法者”的美名。开普勒的成就，来自坚实的数据支撑。他凭借手工，就能处理完第谷20 多年收集而来的数据。这一案例反映的是他处在一个“小数据时代”。
随后，与开普勒同时代的牛顿，通过论证开普勒行星运动定律与他的引力理论间的一致性，证明了地面物体与天体的运动都遵循着相同的自然定律，从而发现了万有引力和三大运动定律，现在看来，这也是基于小数据的。这些经典理论的提出，奠定了此后三个世纪里物理学领域的科学观点，并成为了现代工程学的基础。再后来，随着科学的发展，数据量有了较大的增加，为了处理那些在当时看来的“大数据”，统计学家发明了抽样方法，其基本要求是，在确保所抽取样品具备“随机性”的基础上，来保证样本可以对全体具有充分的代表性，从而推断全体样品的特性，由此解决了“大”数据处理的难题。
而当前的大数据，不仅是所谓数据海量，而且各种数据的差别非常大，用抽样方法难以保证它的有效性。传统的统计方法，之所以不能适用于现在的大数据，大致源于如下三点原因。
（1）在第四章中，我们讨论了大数据的“4V”特征，其中最能反映大数据和小数据不同之处，就是它的“多样性”（Variety）：由多种数据来源组成的一个全面的数据。在多种数据源的应用环境中，抽样很难保证它的“无偏性”（unbiasedness）。
（2）统计学家们设计的统计模型，其结论的准确性，强烈依赖于与结论有关的应用类型。目前大数据的主力军——网络数据呈现长尾分布（长尾理论将在后面的小节介绍），使得传统的标准方差等衡量标准失效，“长相依”和“不平稳”常常超过了经典时间序列的基本假设。
（3）传统的机器学习方法，通过先在较小的数据集样本中学习，然后调整参数，验证分类、判定等“假设”和“模型”的适用性，再推而广之到更大的数据集上。通常来说，一般的NlogN、N2 N2 等级别的算法复杂度，是可以容忍的，然而面对PB 级别（1PB=1 024TB=1 024×1 024GB=1 125 899 906 842 624 Bytes）的大数据处理，这种算法复杂度已经难以忍受，因此需要设计新的数据处理算法来适应这一新情况。江西财经大学科技哲学教授黄欣荣，对小数据和大数据“质”的区别也做了比较到位的描述。
（1）从采集手段上来说，小数据属于人工数据，是有意测量、采集的数据；而大数据大多数是由智能系统自动采集或人们无意留下的数据（比如，用户在搜索引擎中使用的搜索关键字、服务器运行的各种日志等），因为当时没有什么明显的用途，很多大数据一度被称为“垃圾数据”。目前，“数据排放”（data emission）——互联网用户留下的点点滴滴（如点击记录、浏览时间、评价内容等），都可以发掘出价值，目前正成为网络经济主流。在大数据时代，有个口号就是，记录一切数据，等待有趣的事发生。在特定的生态环境下，用适合的工具挖掘，大数据中的所谓“垃圾数据”就不再垃圾。
（2）从存储介质和处理平台来看，小数据因为容量较小，常存储于本地存储介质中，其处理平台仅需单机即可完成，数据的处理者清楚地知道数据“身处何地”，可以“亲力亲为”地编写对应的数据分析程序。而现在的大数据，往往因数量过大，而不得已存放于“云端”中，“云深不知处”，云计算利用自己的“虚拟化”技术，让用户不知道也不需要知道数据存在哪台“云计算”的服务器上。就如同用水、用电一样，用户无须知道自来水厂和发电厂在哪里一样，仅仅打开水龙头、按下开关就能得到水资源和电资源。所谓的云计算，就其本质而言，就是一种以互联网为连接中介，以租赁服务的方式，为用户提供动态可伸缩的虚拟化资源的计算模式。中国宽带资本基金董事长田溯宁先生曾总结说，大数据与云计算就好比一个问题的两面。如果说大数据是有待解决的问题，那么云计算就是问题的解决方法。通过云计算对大数据进行分析、预测，会使决策更加精准，释放出更多的隐藏价值。大数据，这个21 世纪人类探索的新边疆，正在被新的计算模式——云计算所发现和征服。
（3）从数据性质来说，小数据因“有意采集”来支持研究者的假设或观点，因此可归属于“主观数据”。相比较而言，大数据则因没有事先渗透主观意图，数据的生产者反而能“真情流露”，从而更显客观性，因此属于“客观数据”。此外，根据舍恩伯格教授的观点，大数据不再是随机样本，而是全体数据。全数据是由多维度数据构成的。一个事物的全息可见，自然比单维度的采集要来得客观。有些商家（特别是大型电商）就是利用顾客的多维度、多层面“用户画像”来更全面刻画客户特征，从而达到精准营销。舍恩伯格教授在其著作《大数据时代》一书中，开门见山地提出了大数据的哲学意义：“大数据开启了一次重大的时代转型。就像借助望远镜，让我们能够感知浩瀚的宇宙，借助显微镜，我们能够观测渺小的微生物一样，大数据正作为人类认知世界的新手段、新方法、新工具，改变我们的生活、工作以及理解世界的方式，成为新发明和新服务的源泉，而更多的改变正蓄意待发……”由此可见，大数据，除了在信息科学领域成为研究热点外，在哲学层面的认知，也应有所突破，这也是人类进一步认识世界的迫切需求。

品味大数据：深入洞察，驱动决策在这个信息爆炸的时代，数据已成为衡量价值、驱动创新的核心引擎。我们身处一个由数据编织而成的世界，每一次的点击、每一次的购买、每一次的互动，都在悄然生成庞大的信息流。然而，数据的海洋浩瀚无垠，如何从中提取有价值的信息，洞察事物本质，并将其转化为切实的商业洞察与战略决策，已成为个体、企业乃至社会面临的重大课题。《品味大数据》正是一本致力于揭示这一过程的书籍。它并非一本枯燥的技术手册，也不是对某个特定领域的浅尝辄止，而是以一种更广阔的视角，带领读者深入理解大数据背后的逻辑、方法与应用，学会如何“品味”数据，从中咂出最精髓的价值。数据世界的浪潮：为何我们必须理解大数据？首先，《品味大数据》会带领读者回顾数据发展的宏大历程。从最初的简单记录，到如今的复杂分析，数据的重要性是如何一步步被凸显的？互联网的兴起、移动设备的普及、物联网的部署，这些技术变革如何以前所未有的速度和规模催生了海量数据？书中将详细阐述这些驱动大数据时代的要素，帮助读者建立起对数据产生根源的深刻认知。进而，我们将探讨大数据在各个领域的颠覆性影响。无论是在商业决策、科学研究、医疗健康、城市管理，还是在社会治理、环境保护，大数据的应用都展现出惊人的潜力。书中的案例分析将覆盖金融风控、精准营销、产品推荐、疾病预测、交通优化等多个维度，生动展示数据分析如何帮助企业提升效率、降低风险，如何为科研人员提供新的探索方向，如何为城市规划提供科学依据，以及如何促进社会公平与进步。读者将在此过程中，清晰地看到大数据并非抽象的概念，而是实实在在影响我们生活和工作的强大力量。 “品味”的艺术：大数据分析的核心方法论理解了数据的价值与影响，下一步便是学习如何“品味”数据。本书并非一股脑地堆砌复杂的算法和模型，而是从更宏观的层面，梳理大数据分析的核心方法论。数据的收集与清洗：任何有效的分析都始于可靠的数据。书中将深入讲解数据收集的渠道、策略，以及在海量、异构数据中识别、处理噪声、缺失值、异常值等问题的关键技术。这就像烹饪前精心挑选食材、去除杂质，是保证菜肴品质的第一步。数据挖掘与模式识别：数据本身是沉默的，需要通过挖掘才能发现其隐藏的模式和关联。本书将介绍诸如关联规则挖掘、聚类分析、分类与回归等经典数据挖掘技术，并解释它们如何帮助我们发现用户行为规律、市场趋势、潜在风险等。我们将学习如何从纷繁复杂的数据中，“品”出那些不易察觉但至关重要的信息。可视化与洞察：冰冷的数据报表难以直观地展现信息。书中将重点介绍数据可视化的重要性及其多种表现形式，如散点图、折线图、柱状图、热力图、仪表盘等。通过生动的图表，将复杂的数据转化为易于理解的图形语言，使读者能够快速把握数据核心，形成直观的洞察，这便是“品味”出数据故事的关键。预测与决策：基于对数据的深刻理解和分析，我们便能尝试预测未来的趋势。本书将介绍一些基础的预测模型，以及如何将分析结果转化为可执行的决策。无论是预测销售额、用户流失率，还是评估新产品成功的可能性，都是大数据驱动决策的体现。超越算法：大数据分析的实践智慧《品味大数据》深知，大数据分析的价值并非仅仅体现在技术层面，更在于其在实际应用中的智慧与落地能力。业务场景的理解：成功的分析离不开对业务场景的深刻理解。书中将强调，数据分析的目标是为了解决实际问题，因此，分析师必须具备跨领域的知识，理解业务逻辑，才能提出有针对性的分析方案。数据的伦理与安全：随着大数据应用的深入，数据隐私和安全问题也日益凸显。本书将严肃探讨数据收集、使用过程中的伦理边界，以及如何保护个人隐私，确保数据安全，构建负责任的大数据生态。团队协作与沟通：大数据项目往往是复杂的系统工程，需要不同专业背景的人才协同合作。书中将分析数据科学家、业务分析师、IT工程师等角色之间的协作模式，以及如何进行有效的沟通，将分析成果传达给决策者。持续学习与迭代：大数据技术和应用场景都在飞速发展，唯有保持持续学习的心态，不断迭代分析方法和模型，才能在大数据时代保持竞争力。让数据说话：实践者的指南《品味大数据》的目标是赋能每一位对数据感兴趣的读者，无论是技术背景的专业人士，还是希望利用数据提升决策能力的业务人员，都能从中获得启发。本书将通过丰富的案例研究、图文并茂的讲解，以及通俗易懂的语言，帮助读者：建立数据思维：培养用数据说话、用数据分析问题的习惯。掌握分析方法：理解并初步掌握常见的大数据分析方法。识别应用场景：发现大数据在自身工作和生活中潜在的应用价值。做出明智决策：学习如何基于数据洞察，做出更科学、更有效的决策。结语大数据时代已经到来，它带来了前所未有的机遇，也伴随着挑战。《品味大数据》并非要将读者塑造成顶尖的数据科学家，而是希望引导大家认识到数据的力量，学会如何用一种更系统、更深入的方式去理解和利用数据。通过“品味”大数据，我们不仅能看到数字背后的故事，更能从中汲取智慧，驱动创新，最终实现更明智的决策与更卓越的成就。这是一次关于数据、关于洞察、关于未来的探索之旅，而《品味大数据》将是您最贴切的向导。

用户评价

评分☆☆☆☆☆

这本书给我最深刻的印象，莫过于它对于“品味”这个词的独特解读。我原以为“品味大数据”会是一本纯粹的技术指南，讲解各种算法模型和工具的使用。然而，读完之后，我发现它远不止于此。作者似乎想传递一种“数据思维”的哲学，一种如何用更敏锐的眼光去审视和理解数据背后的故事。书中不仅仅是罗列数据，更侧重于如何从看似杂乱无章的数据洪流中，提炼出有价值的信息，发现那些隐藏在表象之下的规律和联系。我尤其喜欢其中关于“数据洞察”的章节，作者用了很多生动的比喻，比如将数据比作“土壤”，将分析师比作“农夫”，将洞察比作“收获的果实”。这种形象的描述，让原本抽象的概念变得鲜活起来。在阅读过程中，我常常会停下来，回味书中的观点，思考自己的工作和生活中，是否有被忽略的数据信号。这本书让我意识到，真正的“品味”大数据，不仅仅在于技术手段的娴熟，更在于一种对数据的敏感度，一种从数据中发现美、发现价值的能力。它像一位经验丰富的向导，引领我在数据世界的丛林中，找到前行的方向。

评分☆☆☆☆☆

这本书最大的特点，我认为在于它对“用户体验”的关注。在很多关于大数据的讨论中，往往聚焦于技术本身，而这本书则将视角巧妙地转向了大数据如何影响和改善我们的生活体验。它让我明白了，我们每天接触到的各种APP、网站，背后都在悄悄地收集和分析着我们的行为数据，而这些数据，最终的目的都是为了提供更个性化、更便捷的服务。书中的一些案例，比如推荐系统是如何学习我们的喜好，个性化广告是如何精准投放，甚至是智能家居是如何根据我们的习惯自动调整设置，都让我感到非常惊叹。作者用一种非常贴近生活的方式，揭示了大数据在我们日常生活中的“幕后故事”。这让我对周围的技术应用有了更深刻的理解，也开始重新审视自己的数据隐私。更重要的是，这本书让我看到了大数据不仅仅是冰冷的算法，更是连接人与技术，人与人之间的一种全新的沟通方式。它让我觉得，大数据并非遥不可及，而是与我们每个人息息相关，甚至在潜移默化中塑造着我们的生活方式。

评分☆☆☆☆☆

这本书给我带来的最大冲击，是它对于“数据伦理”的深度探讨。在如今这个信息爆炸、数据泛滥的时代，我们常常听到关于数据隐私泄露、算法歧视等负面新闻。《品味大数据》这本书，并没有回避这些敏感话题，而是选择正面应对，并给出了自己独到的见解。它详细分析了大数据在应用过程中可能带来的伦理困境，例如如何平衡数据收集与用户隐私，如何避免算法中的偏见，以及如何确保数据使用的公平性和透明度。作者在书中提出了一些非常具有建设性的观点，比如构建负责任的数据使用框架，加强数据伦理教育等，这些都让我受益匪浅。读到这部分内容时，我常常会陷入沉思，思考作为信息时代的个体，我们应该如何保护自己的数据权益，同时也要认识到数据在推动社会进步中的积极作用。这本书让我明白，技术的发展固然重要，但与之相伴而生的伦理问题，同样不容忽视。它不仅仅是一本关于大数据的科普读物，更是一本关于如何在数据时代保持理性、负责任的思考指南，让我对这个时代有了更深刻的理解和敬畏。

评分☆☆☆☆☆

这本书的封面设计就透着一股子沉稳大气，厚重的质感让人忍不住想翻开一探究竟。我一直对数据分析和可视化有着浓厚的兴趣，但总觉得理论知识有些枯燥，不够接地气。《品味大数据》这本书，从我拿到它开始，就给我带来了惊喜。它没有那种高高在上的说教感，而是用一种非常亲切、甚至可以说是“分享”的方式，把大数据这个看似高深的概念，一层层剥开，展现出它在日常生活和商业应用中的真实模样。书中的案例分析非常扎实，不是那种停留在表面的“大数据能做什么”的泛泛而谈，而是深入到具体场景，比如如何通过用户行为分析优化电商平台的推荐算法，如何利用社交媒体数据洞察市场趋势，甚至是如何在城市管理中运用大数据提升效率。作者在讲述这些案例的时候，语言通俗易懂，即使是对大数据完全没有基础的读者，也能很快理解其中的逻辑。而且，书里穿插的一些关于数据伦理和隐私保护的讨论，也让我受益匪浅，这在当前信息爆炸的时代，显得尤为重要。总而言之，这本书给我最大的感受就是“实用”和“启发”，它让我看到了大数据不仅仅是冰冷的数字，更是连接人、连接世界，甚至改变生活的一股强大力量。

评分☆☆☆☆☆

坦白说，我一开始对这本书抱有的期待，是希望能找到一些可以直接应用到工作中的实操技巧，比如如何搭建数据仓库，或者如何运用某种特定的分析工具。而《品味大数据》这本书，确实也在一定程度上满足了我的需求，但它的价值远不止于此。它提供了一个非常全面的视角，让我看到了大数据在不同行业、不同领域是如何发挥作用的，从金融风控到医疗健康，从市场营销到内容创作，几乎涵盖了我们生活的方方面面。我印象最深的是关于“数据驱动决策”的部分，书中详细阐述了企业如何建立一套科学的数据分析体系，如何将数据分析的结果有效地转化为商业策略。这对于我来说，非常有借鉴意义。而且，书中的语言风格比较轻松，没有那种学术论文的生硬感，读起来非常流畅。作者在举例的时候，也尽量选取了读者容易理解的场景，并且会追溯到最初的数据采集和处理过程，让我们清楚地知道，每一个分析结果的背后，都有着严谨的逻辑链条。读完之后，我感觉自己的视野被极大地拓宽了，对大数据的认知也从“是什么”提升到了“怎么用”和“为什么这么用”的层面。

评分☆☆☆☆☆

考试必备。不错。会继续关注的。

评分☆☆☆☆☆

正版书，京东搞活动买书买到停不下来，囤一批好书细细品味

评分☆☆☆☆☆

京东买书一如既往的方便快递，书店很少去了

评分☆☆☆☆☆

书店看到了，翻了下，感觉还不错，就京东下单了一本。

评分☆☆☆☆☆

上面说的优点，但也有缺点：（1）定位于科普读物（或者作者所言的科技随笔），就决定了讲解的深度就比较有限，不过作者倒是给出很多一些参考文献，也算是一个不错的导引。（2）校稿还是不够细致，还有部分错别字，比如说，后记里的“同仁”，敲成了“同人”，希望再版时能修订好。（3）排版密集，看起来比较累，全书在这种情况下已经400多页，如果像中信出版社那样稀疏排版，估计得500多页，想来是出版社想节省成本：(（4）纸张确实不太好，难道又是出版社节省成本？？？

评分☆☆☆☆☆

方便

评分☆☆☆☆☆

我之前的在博客上的看过很多他的文章，感觉他这个人非常细腻有想法，分析问题总有一些独到的视角，导致我订阅他的博客，然后他写的每篇文章我们都仔细的研究。这本书我就是在他博客里看到的，就直接买了五本，自己留一本，剩下的送给朋友。快递到了之后，我用一个星期的时间仔细的看了一遍。一句话就是这本书没让我失望。这本书语言通俗易懂，而且很有幽默感，能够激发读者的兴趣，有一种一直看下去的冲动，而且有些话细细品味确实很有道理，不像我之前看的有些书籍，只是罗列事实而不分析其中的逻辑。这本书感觉有一种思辨、全面的态度。而且有大量的注解，专门强调了注解来源，让读者有证可考，可见作者的用心，也多少可以看出作者确实是博览群书。我觉得这本书在大数据科普读物中，除了大数据时代等极少数书能够超过它之外，其他大部分书在各方面都不如他。从这本书来看，作者在大数据方面肯定是有很深建树。在此呢！给大家推荐一下这本书。哈哈?，不知不觉评论已经折磨长了。

评分☆☆☆☆☆

看了下目录，了解大数据的最佳入门读物

评分☆☆☆☆☆

写得不错，很好啊，值得一读的，推荐！GG…