中国城市规划学会官方网站

您当前的位置:中国城市规划网>学会> “大数据与城乡治理”研讨会> 正文

茅明睿:基于某电子商务公司用户数据的市民画像及应用思考

2015-06-05 16:33 来源:中国城市规划网

编者按:

2015年5月23日至24日,由中国城市规划学会承办的中国科协年会分会场“大数据与城乡治理”研讨会于广州举行。北京市城市规划设计研究院信息中心副主任茅明睿并作了题为《基于某电子商务公司用户数据的市民画像及应用思考》的报告。茅明睿主任通过和某电商的合作,思考了互联网公司对规划的启发。指出互联网数据与规划的结合能够帮助规划师更好地理解需求、迎合需求、引导需求,从而评估公共政策、指导新区开发、优化资源配置等等。电子商务公司与规划领域的进一步合作还有着广阔的前景。

一、互联网公司的“用户画像”

去年在乌镇举办的世界互联网大会上百度公司所做的手机用户洞察,是一个对用户画像的案例。按百度公司的说法,针对百度每一个用户有2万个标签去描述,通过对某一个用户的2万个标签的表述,会得出这一用户的各种特征,从而进行各种个性化的服务和推送。    除了百度,阿里巴巴也有一个非常庞大的用户版图是覆盖了电子商务、移动互联网、文化、娱乐、金融、旅游、医疗健康、交通等等各行各业,它通过部署这样一个大的业务版图渗透到我们的生活和行为中,渗透到手机和电脑上,然后去获取信息,对我们进行画像,给我们打上标签。

画像到底是什么,通过一系列的APP、互联网行为或者是移动支付行为等获取到用户信息,然后对这些数据进行分析、分类等给用户打上标签,这个标签包括人的自然属性:性别、年龄、星座等等;也有人的社会属性:是否单身、学历、职业和消费能力等等;还有行业的兴趣,你是什么行业的,你的兴趣点在什么地方。这就是对用户的描述,可以看到互联网公司是无所不用其极去描绘我们,在某种程度上可能比我的父母更加了解我。

二、城市规划转型

1.物的维度和人的维度

城市规划研究的维度(90后通常称之为次元)可以分为两类,一类是物的维度,比如自然属性(用地区位、景观特性、形态和地质条件)和社会属性(比如功能、性质、权属和合法性)等等。另一类是人的维度,比如人的自然属性(人的性别、年龄、健康等等)和人的社会属性(职业教育、收入兴趣等等)。

2.城市规划的实际情况及对“千人指标”的反思

我们的规划在过去若干年当中是一个瘸腿的状况,是高度建立在物的维度上,而对人的维度所知道的信息是非常少的,所以我自己称之为过去的规划是目中无人的规划,我们所拥有的人的维度信息非常有限,可能只有一个城市的,或者说一个城市某一个统计单元的总人口、常住人口、户籍人口、农业和非农业等等。我们有这样一个千人一面的“千人指标”,我们每个人都长成这个样子,无论是在哪个社区,在哪个区位都是这样的。当我们试图去了解人的时候,我们也只能做到由人到物的间接方法,我曾经跟房地产开发商聊天的时候,地产商说你们规划师老说你们以人为本,他说我觉得你们一点儿都不以人为本,你们的规划做成什么样,最后都有人买单,我们开发商不一样,如果开发商做的房子,一开始不去想我们的客户群体是什么,我们的定价什么,客户需要什么样的房子,我们的房子是卖不出去的,所以规划师在我们面前没有资格说你们以人为本,我这个规划师显得非常无言以对。针对“千人指标”有很多规划师做过一系列的反思,比如有的人针对社区的大小用不同的指标,也有人提出针对居住区的年代应该是用不同的“千人指标”等等,但是这也做不到直接由人的维度去做人,而是把人通过物的维度间接量化去做。

3.规划转型

以人的视角从事规划面临着一个好的机遇。增量规划时代,人是规划的成本或者是建设项目的成本,由于是增量规划所以规划大量依赖一级开发的方式,一级开发的区域有多少人,是什么构成,他们的个体需求是什么,一点都不重要,我们只需要计算有多少人口,给他们足够多的钱,把他们搬迁就可以了,所以人是成本,人根本不是这个规划项目的客户。但是存量规划不一样,存量规划是在建成区范围对它的提质和城市更新,这里的居民是这个规划的客户,所以在存量规划时代我们的规划是看人的,人是我们的客户。

4.景观异质性不能取代人群的异质性的分析

人群是存在着异质性的,而且景观的异质性不能取代人群的异质性分析,比如广州的三元里,在几十年以前这里是广州的老城区,居住的是广州的“土著”。改革开放之后,大量的农民工到广州打工,这里成了一个外地打工者居住和租住的空间,但是从景观的异质性来说,它没发生非常本质的变化,还是一个老城区的面貌。2000年之后,大量的黑人来到广州,非常多的黑人涌入到三元里这个区域去居住,仍然是景观的异质性并没有大的变化,但是这里的人群的异质性却发生了多次变化,所以我们认为不能直接用景观异质性去取代人群的异质性。我们也做过非常多的讨论,大家有一些共识,基于大数据,我们要观察到基于普遍的规律,要找到个性,能够在个体规律和群体模式中找到一个平衡,同时我们要去研究社区和社群等等,这都是从人的异质性去做规划和城市研究的尝试。

三、柴彦威:居民行为日志VS王德:手机信令

柴彦威老师做的居民时空和行为日志,这是转换城市的视角去研究城市的社区的居民生活圈,柴老师的工作做得非常详细,它拥有了700多居民两个月的全的样本,也有这700多居民的个体特征,所以我们可以看到这个研究是有维度的,非常丰富的人和物的维度,同时有非常好的粒度,精确到个体,精确到家庭。但是我认为柴老师这个工作没有尺度,因为是局限在两个社区,他把他所有的研究团队都投入到这两个社区的调查当中了,所以这种调查的数据不好用,手机新型的数据是否好用呢。手机新型数据很好,这是北京的一个手机新型数据表现的居民的OD,我们可以看到手机新型数据表现出来的特征和传统的调查方式完全不一样。比如王德老师的手机信令应用分析,利用手机新型数据来看城市的空间结构和商圈分析,做得非常细致,我们认为这是目前规划行业做得最好的手机新型数据的应用,但是这个数据有很好的尺度,有覆盖上海全市,有很好的粒度,这里面每个点都代表着一个人,但是它没有维度,我们并不知道这每个点之后的特色是什么,这也是非常遗憾的。

四、面对来自互联网巨头的颠覆,怎么去竞争?

到底怎么样才有尺度,又有粒度和维度。互联网巨头比如过去看到的百度一系列的基于自己的数据所做出来的东西只是冰山一角。在去年年底我写了一篇文章,说来自互联网巨头的这种颠覆,这个引起了规划界一个不少的反响,很多人参与了争论,我觉得我写的是有问题的。既然“BAT(Baidu Ali Tentent)”这么厉害,我们规划师怎么去竞争,我的看法是你有科学我有成功,我们提几个问题,既有科学又有成功意味着什么,它意味着我们的规划可以不仅有1万个物的维度,还可以乘以1万个人的维度,能够提供1万倍乘以1万倍的研究可能,是一个乘数的效应,所以大数据是一个乘法,而不是一个加法。

1.人群画像与棚户区改造

在过去这一两年当中,我们做了一系列“抱大腿”的工作,向互联网公司展示我们有能力去做大数据,我们有能力让大数据在城市规划当中发挥价值,他们的数据对我们有价值,你们互联网公司是有很好的外部性,应该为城市服务。我们也做了一些基于我们自己的数据所做的一些工作,也是从市民画像的角度去做的,比如利用公交IC卡去识别城市贫困人群,大学生人群的识别与画像等等,这些我们都在后续研究成果和论文中会去发布。我们去年年底做的一个试点项目奶西村棚户区改造,是利用IC卡数据做的一个棚户区居民的画像工作,我们发现有三条公交线路在这里设站,周边没有商品房,可以猜想在这三个站上下站的人群是这个棚户区的居民,跟踪他们的刷卡记录,看看他们在城市当中的什么区域活动,发现这个棚户区的居民跟城市什么区域之间的联系,这个是柴老师所说生活圈的表达。

2.棚户区研究的目的

试图去区分同一个社区的人群行为,基于出行对他们的职业进行推测,基于出行对他们的出行目的进行推测。我们认为人是一个数字,但不是一个平均值,棚户区的居民是待拆迁的户主,本地人和租户是有巨大的异质性的,对于棚户区的居民,我们试图去跟踪他们的生活,假设做了一个棚户区的改造之后,这些被迁走的居民是否还在从事过去的工作,租户过得是更好还是更差,对于棚户区改造的影响和评估,我们觉得是城市是否应该去容忍贫民窟,这都是我们之前所做的一系列的画像工作。

3.市民画像的应用价值

在去年的年中,我们去跟“BAT(Baidu Ali Tentent)”这些互联网巨头进行洽谈试图可以使用他们的数据,经过了半年的努力我们获得的某电商平台的合作机会,拿到了他们在北京已经毕业的20-30岁大学生群体的抽样数据。我们初步对这个数据有这样一个思路,分析在同样一个社会特征的人群对他们进行画像,能够区分已经毕业的大学生的异质性,比如收入、区位、职业和通行,再进一步去分析原因,是跟他们的学历有关系,还是学校或者户籍有关系,这是一些初步的成果。

第一,可以看到这个群体在北京的居住分布,我们对他们的消费能力进行了不同的分级,看到了北京20-30岁的大学毕业生人群居住地的分布,高消费群体在城市当中是这样一些区域。在北京金融街附近的社区居住着一个高消费的群体,在CBD的南侧和北侧都形成了高消费群体的居住点,在中关村的周边和高校的周边,中关村软件园附近都有很多的高收入人群的居住,还有朝阳区的望京区域也形成了高收入人群的居住点。

第二,中等消费群体也形成了一个分布的特征,与高消费群体大体的特征相似。低消费群体,他们可能更多是在城市北部或者是一些更外围区域居住。

我们分析了这些高消费群体、中等消费群体和低消费群体的就业分布,消费能力最强的群体跟他们居住地的特征差不多,在金融街、CBD、机场、望京、中关村等等。分析他们的户籍特征,看到像高消费群体形成了一个典型的南北分异,南部城市的老城区包括往西边和西南边,本地人的比例是比较高的,但是北部外地人的比例是占到90%。从就业来看也是一个南北的差异。从中等消费和低消费群体来说,已经不是一个南北分异,而是一个倒C的包围,也就是说城市的本地人形成了一个狭窄的带,从城市中心城的老城区往西这样一个狭长带,北京人高度聚集在这里,而外地人呈现一个倒C形,包围了本地人。还看到这些群体对购买空气净化设备和防护设备的比例,我们发现高消费群体的特征,比如CBD区域的人对自我健康的关注度是比“码农”这个群体的自我健康关注度是要更高的。女性群体对于自我的健康、运动商品和空气净化商品、旅游特征跟男性是不一样的,女性用户越多的社区,他们的关注度越高。不同消费群体的自有住房比例,自有住房比例越高的群体,消费能力越低,自我住房比例越低的群体,消费能力越高,这也说明20-30岁的人群如果都买了房,一定背负着很大的房贷的压力,所以呈现一个相反的特征。

通勤OD分析,分析每一个TAZ的OD,比如高消费群体的就业地和居住地平均的距离,每一个就业地反过来的通行直线距离是怎样,以及每个区域,比如CBD居住的人他们OD的情况,通过某电商的收货地址发现,可能一个地址是他的工作地,一个地址是他的居住地,可以产生居住地和工作地的OD等等,我们是可以对每个TAZ做出这种分析。

市民画像其实有非常多的应用价值,比如用来评估公共政策,去指导新区开发,去优化资源配置。我提出一个观点,规划师跟互联网的这些产品经理是一样的,我们的客户正在发生转变,所以我们要学会理解客户和发现需求,要去理解客户静态的信息,客户行为的逻辑,客户群体的特征,他们动态的需求,短周期和长周期的需求,以及我们怎么规划去迎合这些需求,因为通过画像得到一个人的标签未必是这个人想保留的,所以我们还要去研究怎么用规划去引导这些需求,这就是我目前正在做的一个工作,谢谢大家。

(根据速记整理,未经专家审阅)