成果
阅读量 660

腌do鲜 第五锅|鲜肉说:数据证明“人丑就要多读书”是有道理的!

成果简介:

鲜肉说第五锅 | 王咏笑

 

90后城市数据团团支书” | 复旦大学在读研究生



【核心猛料预告】

-开房数据,东南角亮了!

-有钱的人都在买房,穷人都在收快递?

-颜值高的人都在哪里活动?

 

 

『我们是怎么学会玩城市数据的』


各位在场的老师同学大家好,我第一次看到腌do鲜的这个名字的时候,反应也是:什么鬼?当然我现在知道,他是一味菜,而且我也成为了这个食材。我想应该是蛮好玩的,事实上也的确如此。我和数据团的小伙伴,我们对待数据的态度就是玩,因此今天跟大家分享的就是我们怎么学会玩城市数据的。

 


如果你一天花了600元,你已经打败了75%的人

 

在正式开始这个话题之前,想问大家一个问题,你觉得自己有钱吗?这个问题,其实每个人都想知道,但是每个人都没办法回答。因为我们不知道去跟谁比,所以一切都只是觉得,但是数据时代为我们提供了解决这一问题的方案。

 

今年6月份,我的学姐问我:为了庆祝生日,我和男朋友逛了一天,我们这个消费在上海算什么水平呢?我们算不算有钱人啊?

 

为了回答这个问题,我们找到了当天银联刷卡消费的一组数据。可以看中间的中位数,买衣服大概花了270元,吃晚饭花了200元,开房花了500元。大家可以自己定位,如果你花了600元,你已经打败了75%的人。

 

 


除了数字之外,还可以看一下这些消费在空间上的分布,图中峰值越高表示消费金额越大。可以发现衣服、晚饭和开房这三类消费都高度集中在中环以内的市中心,上海在消费上是一个集中化程度相当高的城市。但是如果单从开房数据来看,东南角非常亮,这个地方在川沙,靠近浦东机场,飞行员作为一个高危职业,可能比较开放,希望大家理解他们。

 


除了这些活动,还有很多别的数据可以探查。在这张图中,红色代表的是最有钱的1%的人的消费结构,蓝色的是剩下的99%。看左边,有钱的人都在买房,再看右边,穷人都在结婚、吃饭,收付快递。当然,刷卡数据并不能特别好地描摹日常的消费情况,但在我们目前也没有找到更好的替代数据。



城市数据团是如何一步步沦落的?


数据团目前为止发表了约30篇文章,收到最多的反馈就是一本正经的胡说八道。其实我们也不想的,这个故事要从头说起。

 

20146月份,我第一次以实习生的身份到城市数据团。当时我们接到的第一个课题是上海市某政府部门委托给我们的关于人口预测的研究。我们的结论是,为了维持上海人口的竞争力,到2040年的时候,上海的常驻人口至少需要维持在3000万。而上海市政府一直想把这个数字严格控制在2400万左右。

 

这是我们当时的一些研究成果,画风跟前面不同,我们当时还是很正经的一个组织。当时听完我们的汇报之后,在座领导专家表示我们的数据不是很能接受,但是方法还是有理有据,令人信服的。我们很开心,觉得自己为上海的未来建设贡献了一些微不足道的小小建议。

 


在那之后,我们又陆续接到一些关于交通,城市建设的课题,感觉前途一片光明。那我们是怎么一步一步沦落到现在这样的呢?其实在课题完成不久,我们看到一篇政府报告,虽然不是很正式,但里面已然写着到2040年,上海市的常住人口要控制在2480万,我们再一问,原来委托我们做课题的局长,都没有看过我们的研究!

 

我们觉得有点生气咯,觉得应该有一个自己的平台,发出自己的声音。于是在20152月份,我们有了城市数据团的微信公众号和团支书的支部帐户。



“我们不想成为权威,我们就是要玩,要好玩

 

我们最初发表的文章都是关于人口疏解和交通的文章,并迅速收获了一批粉丝。而且我们发现,这些粉丝大多都有城市规划背景,很少有跨界。后来有粉丝告诉我们,你们的文章都是写给政府部门的,跟我们普通人的生活有什么关系呢,我们为什么要去看?于是我们意识到,城市数据的研究者应该放下自己的身段,以一颗平常心去体察城市数据背后的故事,并分享出来。

 


下图是当时做的一些研究,右下角是我们传播最广的一篇文章——《逃离你终将衰落的家乡》。这些文章发表以后,我们确实受到了更多的关注,也受到了更多的质疑。不过我们没有一一回应质疑,因为我们对自己的定位不是要成为一个数据的大V,我们就是普通人,我们就是在茶余饭后写写小文章的数据爱好者,我们不想要成为权威,我们就是要玩,而且要好玩。

 

 


“人丑就要多读书,绝对不是乱说的

 

在现代社会,只要有手机,我们每天的生活、生活痕迹就会被记录下来,一个城市市民生活痕迹的积累,就成为了城市的数据。我们在创造数据,我们也想在数据中看到自己。

 


基于这种想法,我们发起了两个互联网的数据众筹活动。其中一个是颜值地图,志愿者可以给我们的公众号发送自己的照片和位置,我们会反馈给离他最近的三个人,给他颜值打分。

 

下图是结果,志愿者的足迹遍布世界各地,包括南极洲,当然他可能是一只有手机的企鹅。我们也分析了志愿者在高校的分布,像未名湖畔,各个艺术馆、体育馆,颜值都是比较高的。颜值低的人主要分布在图书馆和教学楼,所以人丑就要多读书,绝对不是乱说的。


 

我们还做了另外一个活动,在今年5月份复旦110周年校庆当天,我们抓取复旦所有在职教授的信息,都是志愿者帮我们搜寻到的。图上就是这些教授的最高学历的毕业院校,线条表示与复旦的联系,颜色越深联系越强。跟复旦联系最紧的两个国内学校是北大和中科大,国外是哈佛和东京大学。这个很有意思。但是它也有缺陷,遗漏了很多数据。

 


 

做一个平台,用社群的方式来创作有趣的文章

 

这些活动之后,有越来越多的数据方找到我们,愿意为我们来提供专业的数据;也有越来越多的数据爱好者,希望我们提供数据,由他们做一些研究。我们也觉得这才是一个正确的玩法,当你分享出一个数据,会有更多的人可以针对此数据做研究,数据的价值就得到了最大化;而当你分享一个观点,一些可能原本不感兴趣的人,感受到了数据的魅力,也会愿意加入到数据研究的队伍中来。

 


我们就是想做这样一个平台,把数据的提供方和数据的研究者对接起来,用社群的方式来创作一些有趣的文章。

 

下图是我们与合作者共同完成的。如利用大众点评数据完成的如何面对注定平庸的人生;利用阿里的数据完成的养猪O2O”红烧肉;以及利用移动设备数据完成的一些文章;还有用房地产代理中介完成的上海的房子都被谁给买走了

 

 

我们鼓励这些数据的研究者去做一些专业的研究,但是我们也希望他们找出研究中比较简单和有趣的部分,在我们的平台上发表。

 


点子才是最重要的

 

这些文章为我们带来了更多的关注,我们也收到了非常多的反馈,最多的就是这四个问题:你们学什么专业?你们数据从那来的?你们图用什么做的?你们用什么分析软件?

 

看到这些反馈,我觉得既欣喜又遗憾。欣喜的是这些人因为看到我们的文章对城市数据产生了兴趣;遗憾的是其实很多初入门的爱好者并没有意识到,在数据研究中点子是最重要的,一个好的点子不常有,但实现它的分析工具比比皆是,我相信我们在座的每一个人都可以做。

 


数据的时代才刚刚开始

 

城市数据团,在过去现在和未来,都会是一个非营利性质的数据研究者和爱好者的平台。我们也在研究一些新的玩法,比如我们想做一个中国的年轻人有多苦逼的系列活动,可能会从找工作、找对象、租房、买房等多个角度来进行。我们希望有更多的爱好者加入我们,和我们共同来完成。

 

加入数据团,你能获得怎样的经历呢?以我自己为例吧,在加入数据团之前,我已经在上海待过五年了,但是我对它了解还局限于东方明珠和学校门口的10号线。在加入数据团以后,其实我还是只知道东方明珠和十号线,但是当我看到东方明珠的时候,我想起来它承载的上海建设四个中心的梦想;我挤地铁的时候,就知道为什么会这么拥挤,可能它背后有着人口和功能的空间错位。

 

我觉得我越来越喜欢上海,一方面是因为她越来越好,一方面也是因为通过数据我加深了对她的了解,越来越熟悉她,加深对她的依赖,也对她越来越宽容。这种情感对于我未来的研究是非常有帮助的,因为我将能够怀着这样一颗心去研究它,她也能指导我更加理智和优雅的生活。

 

数据的时代才刚刚开始,会有更多的玩家和玩法,让我们一起把数据玩起来!

 

 

『互动问答』

 

 

【春笋问】:我想问,你们自己期待这个数据团之后的方向,可以带给大家什么样新的一些理想?对于城市规划方面,会有哪些改变?

【鲜肉答】:其实数据团创立之初,一直有一个理念——用数据阅读城市,用数据丈量城市,我们现在第二点做的不是特别好。我现在特别希望,我们知道现在很多地方都会征求民众的意见,我们将来也希望做这样一个社区,让大家都来做,比如说你将来有什么想法,你发现了什么样的问题,我们可以提供一个把大家的idea出说来的平台,我们希望通过这种方式,把大家的声音传达出去,我相信这也是一种为社会发展建言献策的方式。

 

 

【西南某高校真爱粉提问】:我今天就是冲着团支书来了,我非常赞同你们对于数据的打开方式。对于你们的结论,大部分文章我都是赞同的,但是传播最广的那几篇,我是不赞同的。比如说双子座是买房最多的年份,我是不认同的,在我出生的那个年份,双子座的人口比天蝎座少了二分之一,所以这也可以解释为什么我的女朋友是天蝎座的。

【我旦活泼鲜肉答】:您提到这个问题,我们也经常会被问到,您说的星座这个问题,我们更好的解决方案是找到上海常住人口,或者买房人口,考察他们出生年月的分布,我们再算这个比例,这个肯定更好,但是我们为什么不这样做?因为我们没有这个数据。

 

【友校真爱粉提问】你们有没有考虑把一些专业性的研究成果展示出来?

【鲜肉答】:非常感谢您到这里给我们捧场。您说到这个问题,我觉得非常有意义,我们一直希望能够获取到更好的数据源,并且能够用更加专业的方式对这些数据进行处理。但是如果看到我们的公众号文章,发的是您可以在一本学术期刊上看到的文章,您肯定会说不行。我们现在希望做的更加有趣味性,有些数据我们可能会经过检验,但是我们不会把这个检验的过程放在文章里面,所以我希望您能够带着一种更加开放和更加包容的心态。

 

【友校真爱粉提问】:结论我是赞同的,但是我觉得你们很多结论是超越你们分析过程,你们可能没有把你们写的比较复杂的东西体现出来。但我觉得是不是可以用一个更科学的方法表达出来。

【鲜肉答】:其实我们每一次做完分析,我们能大概出三四十个图,但是我们最后放文章只有十来个图,因为我们要讲述故事,我们希望选取一些最有趣,而且跟主线更密切的结论,有一些也比较有趣,但是因为没有特别大的关系,所以就舍弃了。

 

【友校真爱粉提问】:你们的数据好像很少有官方来源,为什么不利用一下官方数据呢,是不是存在获取困难?

【鲜肉答】:其实我们也一直非常希望获得政府的官方数据,因为我们认为这是目前是最靠谱的一个数据源。但是政府数据有一个非常大的缺陷,就是更新频率非常低。比如像人口普查和经济普查,一个是十年一次,一个是五年一次,发展速度已经与其数据的发布速度,根本无法匹配,所以我们很多时候没有办法,只能找一些替代数据。政府数据另外一个问题就是公开的目录不够细,在上海统计局网站找到的数据,与在东京统计局网站找到的数据,其广度和细致程度完全不一样。因此如果做一个娱乐性的分析,也许我能够包装这些东西,但是如果要进行更为严谨、细致的研究,这个数据就可能不是特别好。当然我们也看到了数据开放的趋势,所以我们相信这一块将来会做的越来越好,我们也希望用更好的数据,更好的了解这个城市。