发表于2024-12-24
专业数据分析团队“城市数据团”全新力作,“团支书”结合社会热点,用大数据和数据挖掘分析数据背后的故事。趣味性强,语言幽默,知识丰富,教会读者用大数据做出正确的判断。
这是一本让你“脑洞大开”的图书,让你尝试从大数据角度来解读这个世界,你会发现,有些问题,和你的直觉完全不一样。本书内容分为三部分:第一部分可概括为“脑洞大开”,以淘宝、旅游、餐馆取名等不同的角度切入,说明数据可以用于做许多有趣的事情。第二部分数据与工作,包括了做公务员、二三线城市的衰落、创业等若干热门话题。第三部分数据与生活,包括用数据帮助理解生活现象、用数据挖掘生活中的趣味、以及用数字看房市三个专题。
城市数据团的媒体平台包括微信公众号“城市数据团”和知乎账号“团支书”。2015年2月以来,我们持续发表原创数据研究,希望能让更多普通人热爱数据,并用数据重新认识我们身边的世界。截止2016年底,我们的文章在互联网上累计传播数千万次,拥有20万订阅读者。其中,《逃离你终将衰落的家乡》、《人口疏解,让城市更拥堵》、《淘宝改变了哪些城市》、《上海的房子都被谁买走了》等均有百万级别阅读量。
第1章
数据,另一种视角 / / 0011.1数据之下的中国 / / 003
1.1.12015年,中国人是怎么花钱的 / / 003
1.1.2游遍全国,我们的假期够吗 / / 017
1.1.3淘宝改变了哪些城市 / / 025
1.2数据之下的城市 / / 35
1.2.1人口疏解,让城市更拥堵 / / 035
1.2.2在上海上班,地铁和开车哪个快 / / 048
1.2.3上海餐馆取名大法 / / 056
第2章
数据之于工作 / / 0672.1学习/就业指南 / / 069
2.1.1好好学习,是另一种童年 / / 069
2.1.2应该去哪里买书呢 / / 077
2.1.3月薪多少才配坐高铁 / / 086
2.1.4哪些公务员最辛苦 / / 095
2.1.5奔赴大城市,还是回家乡 / / 103数据不说谎: 大数据之下的世界目录 2.2在创业的风口上 / / 112
2.2.1一个估值10亿美元的养猪O2O项目 / / 112
2.2.2大鹏猪肉,为红烧而生 / / 121
2.2.3如何在上海开一家靠谱的餐馆 / / 130
2.2.4快捷连锁酒店选址的空间陷阱 / / 140
第3章
数据之于生活 / / 1533.1理性生活: 那些你所不知道的事 / / 155
3.1.1你的消费水平给上海拖后腿了吗 / / 156
3.1.2如何面对注定平庸的人生 / / 165
3.1.3下雨天外卖会变多吗 / / 175
3.1.4“双12”规避“假折扣”指南 / / 183
3.1.5上海的水源安全吗 / / 189
3.1.6“控制人口”——开给上海的一剂毒药 / / 198
3.2感性生活: 八卦新玩法 / / 212
3.2.1高颜值的人都在哪儿 / / 212
3.2.2中国正在二次元化吗 / / 221
3.2.3如何像白富美一样生活 / / 232
3.2.4长三角城市那些不得不说的八卦 / / 242
3.2.5上海哪所高校的吃货最幸福 / / 249
3.3生活之重: 生为房奴 / / 259
3.3.1上海的房子都被谁买走了 / / 259
3.3.2上海购房攻略 / / 268
3.3.3遥不可及的学区梦 / / 278
3.3.4房地产泡沫有多大 / / 287
附录1:
我们是怎么学会玩城市数据的? / / 297
附录2:
城市数据团工作方法简介 / / 305
第章
////第1章
数据,另一种视角你消费吗?旅游吗?上班吗?
你知道别人是怎么消费、怎么旅游、怎么上班的吗?
我们对于世界和城市的认知,往往来源于自己和身边其他人的生活经验。
所以,我们的认知往往是主观化和碎片化的。
但是,当我们拥有了“数据”这个工具的时候,我们就获得了重新认识世界的机会。
1.1数据之下的中国
本节内容主要涉及一个主题:如何脑洞大开地搜集和利用各种数据,以非常规的方式呈现出中国经济发展的三个截面。
数据之下的中国,是一个让你既熟悉又新鲜的中国。
1.1.12015年,中国人是怎么花钱的
在一波接一波的寒潮侵袭之后,期盼已久的春节假期终于到了。同事同学们纷纷放假回家,连亲爱的学姐也不在上海,只留我一个人凄冷地坐在工作台前,独自迎接假期前最难熬的几天。
一个人的时候,总是会想很多。
是的。回首即将逝去的羊年,我感慨万千。虽然不出意外地又(为什么要加一个又字呢)穷困潦倒地度过了漫长的一年,但幸运的是在这期间认识了不少天南海北的朋友。
因此,虽然还在孤独地加班,但我仍然心系着祖国人民,安静地准备完成春节前的最后一项数据工作:
数据不说谎:大数据之下的世界第1章数据,另一种视角0000年度全国消费数据总盘点。
好吧,问题来了——
Q1:2015年,全国人民到底花了多少钱?
2015年全球范围内可使用银联卡商户共3390万家,ATM共200万台,境外共发行银联卡5200万张。
根据刷卡交易统计,2015年全年,全国人民的刷卡交易总金额达到53.9万亿元。
53.9万亿元,是个什么概念呢?
我们可以想象一下:如果把这53.9万亿元全换成100元的人民币钞票,并将其一张一张紧挨着排列起来的话,这些钱大概可以绕地球赤道2100圈;从地球排到太阳的话,可以走一半多一点的路程。
假如这还想象不出来的话,我们可以换个角度来看:
根据国家统计局的数据,2015年,全国GDP总额约为67.7万亿元。也就是说,仅是刷卡消费,全国人民就刷掉了年度国内生产总值的79.6%。
亲爱的,你2015年创造了多少GDP?又刷掉了多少份额呢?
算好了吗?
好的话,我们不妨再来研究一下第二个问题,看看你的消费和全国总体水平相比如何呢?问题来了。
Q2:这53.9万亿元,都是怎么花掉的呢?
首先,让我们来看看这些钱是在什么时间内被花掉的呢?
我们统计了境内日均刷卡的交易金额,并将其细分到每一个小时。2015年日均逐小时交易曲线见图1��1,银联卡交易类型占比见图1��2。
图1��1日均逐小时交易曲线
图1��22015年银联卡交易类型占比
假如我们把2015年全年浓缩到一天来看的话,可以发现:14:00~15:00和8:00~9:00是全国人民刷卡的高峰时段,分别占全天交易总额的12%与8%。
亲爱的,你的卡是不是在这个时段内被刷爆的呢?
看完了交易时间,我们再来看一下交易的类型。我们将年度刷卡交易总金额分配到交易类型上,如下所述。
(1)从全国尺度上来看,最多的刷卡交易金额发生在批发行业,份额第一,大概可以购买16个阿里巴巴。
(2)份额第二的是金融行业,大概可以购买7个中国工商银行。
(3)份额第三的是零售行业(俗称买买买),大概可以购买5个沃尔玛。
也许你会觉得,这种全国宏观尺度上的消费特征,和个人没什么关系。那么,我们不妨从个人消费者的角度出发,看一下与市民生活关系最大的消费门类吧。
一般而言,各种消费类型中,与市民生活关系最大的应该是衣食住行金融教育六个大类。结果如何呢?
(1)排名第一:金融。毫无悬念。
(2)排名第二:住房。其交易总额大约是金融类的三分之一。
(3)排名第三:旅游。虽然交易总额排名第三,但也不过是住房类的零头而已。
(4)排名第四:衣(衣物类零售)。其总额大约是旅游的三分之一。
(5)排名第五:吃(餐饮)。交易总额与衣物类零售不相伯仲。
(6)排名最后:教育。其交易总额大约是餐饮的70%。没错,这个结果毫不意外、发人深省。
亲爱的,你的消费结构和全国人民相比,究竟怎样呢?
每个人的消费结构自然千奇百怪。
且不说个人,即使从省市的角度上去区分,也可以看到消费结构上的巨大差异。我们来看看:
Q3:全国各省的消费结构有什么样的偏好呢?
我们仍然将数据聚焦在衣物、餐饮、住房、旅游、金融和教育六个大类上。然后将各类消费金额占总消费金额的比例作为消费偏好的核心指标,分配到各省,可以得到以下结果。
(1)衣物类消费偏好前五名省市:云南、浙江、甘肃、山西、湖北。
想必云南四季如春,民族众多,姑娘们想怎么打扮就怎么打扮吧。见图1��3。
(2)餐饮类消费偏好前五名省市:海南、上海、西藏、宁夏、北京。
吃货集聚在上海、北京,这点毫不意外。但没想到海南、西藏、宁夏等边远地区的吃货能量同样惊人,见图1��4。
图1��3各省衣物类消费占比
图1��4各省餐饮类消费占比(3)住房类消费偏好前五名省市:海南、四川、贵州、北京、安徽。
非常出乎意料的,前三名竟然不是以高房价著称的北上广哦!看来虽然北上广的绝对房价居高不下,但从真实的消费结构上,海南和四川的房价水平也不容小觑。相比北京排名第四,而上海甚至都没有挤进前五,见图1��5。
图1��5各省住房类消费占比
(4)旅游类消费偏好前五名省市:西藏、海南、青海、新疆、云南。
从图1��6可以看到,西部的旅游消费偏好明显高于东部。而排名前五的省市,也都是以旅游胜地著称的地区。
图1��6各省旅游类消费占比
(5)金融类消费偏好前五名省市:福建、重庆、广东、湖南、上海。
从图1��7可以看到,我国东南地区在金融类消费偏好中可谓一枝独秀,福建省拔得头筹。排名前五的省市中,上海市已经是最北方的地区了。
图1��7各省金融类消费占比
(6)教育类消费偏好前五名省市:陕西、四川、北京、海南、湖南。
从图1��8可以看到,陕西省、四川省在教育类消费上的偏好明显高于全国其他地区。我在想,这些地方的孩子们是不是从幼儿园就开始上补习班了?
图1��8各省教育类消费占比
说明一下:本书消费数据中没有统计到中国台湾地区的数据,所以地图上台湾地区的颜色与其他省市不同。
看完各省的比较,我们不妨再来聚焦北上广深四个一线城市的情况。
00哪个城市最土豪呢?
从卡均消费金额的平均数来看,
深圳市人民卡均消费金额达到11.7万元,高居首位;广州市以7.6万元居第二位;而上海市以6.4万元的微弱优势战胜北京市的6.3万元,位居第三。
在感叹深圳市人民真土豪的同时,你是不是发现自己又拖后腿了?没关系,我们再来看看中位数,这次数字就变得和谐多了,见图1��9。
图1��92015年四大城市卡均消费金额(中位数)(单位:元)深圳市人民卡均消费的中位数金额达到20000元,仍然居首,北京市、上海市以15000元并列第二,而广州市则以11000元收尾。
顺便说一句题外话:从刷卡消费特征上看,四个城市的市民最爱的餐饮品牌也截然不同。
(1)北京市民最爱海底捞,热气腾腾的火锅既热闹又抵御寒气。
(2)上海市民则最爱王品,上海市民依然很小资,对牛排情有独钟。
(3)广州市民最爱百胜(肯德基、必胜客的老东家),原来除了当地特色美食,肯德基、必胜客等西式快餐同样也受市民欢迎。
(4)深圳市民则最爱春满园,经典粤式老牌餐厅还是深深地征服了深圳人民的胃口,让其他外来饮食逊色不少。
以上,我们盘点了全国刷卡总交易、各类型及各省市交易的特征。接下来,我们聚焦进入一个更核心的问题:
Q4:2015年,都是哪些人在花钱呢?
我们以上海为参照吧。
我们选出了常住城市在上海、一年中刷卡交易笔数在20笔以上的银行卡50万张,作为研究的样本。并按照性别、年龄将持卡人分为6组,统计其在零售方面的消费特征。
结论来了:
男性花钱多、老人花钱多。
首先,我们不区分消费类别,计算出各个分组的刷卡交易总金额,得到图1��10。
图1��102015年交易金额的年龄性别分布
从交易总金额来看,各个分组之间的差异并不太明显,但仍然可以看到:
(1)消费最多的是老年男性,其次是中年男性和青年男性;
(2)而在女性组中消费能力最强的中年女性,其消费份额也没能超过男性组中份额最小的青年男性。
这不科学啊!难道女性的花钱能力还不如男性?
我们再计算出每个组别的人均(取中位数,下同)刷卡交易金额,见图1��11。
图1��11各组持卡人年均交易金额(单位:元)
没错,无论在哪个年龄组,男性的人均交易金额都比女性要高。
另外,可怕的是,随着年龄的增长,男性会花得越来越多!
……
我们在用数据做什么
在这本书的最开始,我们想要提出这样一个问题:
谁最了解你?
是自己?
是配偶/恋人?
是父母/子女?
是同学/同事/朋友?
毫无疑问,以上几种人都存在于我们的生命中。
但是,跟“它”比起来,以上几种人对我们的了解恐怕都不够全面和客观。
没错,“它”就是手机,与我们形影不离的手机。
看看你手机上的那一大堆APP——
微博和朋友圈知道,你今天心情好不好。
支付宝知道,你买了什么东西、花了多少钱。
微信和QQ知道,你都有哪些朋友,你跟哪些朋友的交流更密切。
豆瓣、知乎、每日头条知道,你都喜欢浏览哪些帖子和新闻。
虾米和酷狗知道,你喜欢听什么歌。
优酷和B站知道,你喜欢看什么视频。
饿了么和美团知道,你喜欢什么菜系和口味。
……就算你什么APP也没装,只要你有一部手机,“它”就知道你什么时候工作,什么时候休息,知道你去了哪里,待了多久。
在手机面前,我们简直无所遁形。手机所知道的你,可能比你所知道的自己,更为真实。
而这些,都是我们自己告诉手机的。我们的每一次浏览、点赞、评论、下单、聊天,都以数据的形式被记录、被沉淀,最终塑造出了我们自己。
所以,请不要被“大数据”“开放数据”“数据挖掘”“深度学习”“神经网络”“云计算”“DMP”等奇奇怪怪的词汇所吓倒。我们每个人每天的生活起居、衣食住行,都在产生数据,并享受着数据给我们带来的便利服务。
事实上,数据已经和我们的视觉、听觉、触觉一样,成为了帮助我们去了解自己、了解他人、了解事物的重要方法。
与其他信息源相比,数据更有可能提供全面和客观的信息,从而帮助我们更快速和高效地了解问题、解决问题。
数据不说谎:大数据之下的世界前言我们在用数据做什么例如,你母亲催你去相亲,并提供了100位相亲者的资料。显然,你不可能一个个把他们约出来见面,一个个去了解和评价他们——你甚至都不可能仔细读完这100份资料。
我们通常的做法是,设立一些限制条件,对年龄、身高、学历、收入等进行筛选,再逐份阅读符合条件的相亲者的资料,直到将相亲对象数量减少到个位数。如此,我们的相亲效率就大大提高了。
然而,在享受数据给我们带来的高效便利的同时,我们还必须意识到:数据分析只能提供结果,不能提供结论;数据之所以能做许多事情,是因为使用数据的人做了很多的思考。
例如,2013年,AmazonStudios和Netflix,美国的两家传媒公司,都对自己网站上客户的视频浏览行为进行了分析。接受分析的浏览行为包括客户看了什么视频、什么时候看的、在何处暂停、在何处跳过、在何处反复观看、给视频的评分等。
根据数据分析的结果,两家公司一致认为观众会对政治主题感兴趣,但在视频的体裁、制作等方面则有着完全不同的认知。而后,AmazonStudios推出了由四位议员作为主角的情景喜剧,Netflix则推出只有一位议员作为主角的电视连续剧。前一部作品名为《阿尔法屋》(AlphaHouse),观众反应平平;后一部作品则是风靡一时、获奖无数的《纸牌屋》(HouseofCards)。
所以,即使在一个“大数据”炙手可热、喧嚣尘上的时代,人仍然是主体,是人的智慧让数据具有了价值。
我们,城市数据团的小伙伴们,就是这样一群人:利用数据去了解城市的发展、挖掘城市生活中有趣的故事。对我们而言,数据是帮助我们认识城市的工具、帮助我们在城市里更好地生活的工具,而通过数据发现的东西才是价值和乐趣所在。我们乐意将这些发现拿出来共享。
本书由城市数据团组织编写,并写作了本书的大部分章节。城市数据团的主要成员包括高路拓、汤舸、王咏笑、王宇鹏等。参与了本书部分章节写作的其他数据团成员和合作伙伴包括(按文章收录顺序):
陈宇佳(1.1.2)、郭斌亮(1.2.1)、陈至奕(1.2.3/2.1.1)、冯里婧(2.1.2)、钱骏杰(3.1.2)、张慈(3.1.3)、曹新(3.1.5)、曹湛(3.2.4)、韩旭(3.2.5)、方娴(3.3.1)、张健(3.3.2)、衣霄翔(3.3.3)、陈晨(3.3.4)。
除写作团队之外,感谢以下机构对本书内容提供了数据支持和技术支持(按文章收录顺序):
�r银联智惠信息服务(上海)有限公司(1.1.1/3.1.1/3.2.3)
�r滴滴大数据研究中心(1.2.2/3.2.2)
�r小猿搜题(2.1.1)
�rBDP个人版(2.1.2/3.1.4)
�rTalkingData(2.1.4/3.2.2/3.2.4)
�r阿里研究院(2.2.1)
�r大众点评研究院(2.2.2/3.1.2/3.1.3/3.2.5)
�r上海道融自然保护与可持续发展中心(3.1.5)
�r同策房产咨询(3.3.1)
本书由城市数据团这个活跃在互联网上的大数据团队完成。如果您看完本书以后,能够增加一些对这个数据时代的了解、愿意去热爱数据和使用数据,将是对我们莫大的鼓励。
城市数据团
2017年3月
数据不说谎:大数据之下的世界 下载 mobi pdf epub txt 电子书 格式 2024
数据不说谎:大数据之下的世界 下载 mobi epub pdf 电子书公众号文章的集结 对于有兴趣的话 可以直接关注公众号
评分用数据论证事实,参考参考
评分单位购买,配送及时!!!
评分看过一些关于大数据的书,这本写的挺不错。
评分书籍很好,物流也很快。
评分简单易学,帮助比较大
评分用起来很顺手,东东不错的。
评分单位购买,价格实惠!!
评分数据不说谎:大数据之下的世界
数据不说谎:大数据之下的世界 mobi epub pdf txt 电子书 格式下载 2024