导读
2024年9月7日-9日,2024中国城市规划年会在合肥举办。在专题会议十四“新技术赋能规划分析评价”上,钮心毅教授作了题为《从知识维度认识人工智能与城市规划》的报告,从历史角度回顾了人工智能在城市规划领域的三个发展阶段,并谈及了大模型的发展,尤其是近年来在城市规划中的应用。
钮心毅 中国城市规划学会城市规划新技术应用专业委员会副主任委员,同济大学数字城市研究院副院长,同济大学建筑与城市规划学院教授
城市规划中的人工智能
在去年下半年开始,我认识到生成式人工智能在规划研究领域应用潜力。我开始关注此议题,为此做了不少的工作,大概到今年上半年有一些心得和收获。在7月下旬的广州规划信息化年会上,我跟各位汇报了怎么用生成式人工智能传递规划中的隐形知识。我这段时间工作最大的收获就是认识了到城市规划人工智能的核心可以用“知识”来归纳。今天来回归一下城市规划人工智能中的历程是什么,各个历程的重大事件,看能不能用规划知识的角度来解释其中的关系。
我们经常说到人工智能在我们学科行业,大致会遇到两个方面的题目,第一是数字技术的人工智能。现在用大模型做文字处理,比如大模型语言论述一下报告,生成一个总结,这样的工作大家正在做,而且技术在迅速发展。大家以后马上会用到或者正在用到,我不把这些当作规划技术,因为是各行各业通用的,跟其他学科没有差别。
把人工智能技术用到规划的技术调查、规划的现状分析、规划的建模、规划的方案制定、规划选择、规划实施全生命周期当中。这里用到的人工智能的技术跟方法是学科特有、行业特有的。今天主要跟各位交流我们应该怎么看这里面人工智能。
城市规划中人工智能的历程
二十几年前,我曾有幸在叶嘉安院士指导下进行了一段时间的学术访问,这段经历对我影响深远。其中之一,就是城市规划人工智能成为了我持续关注领域之一。在不久前,即7月26日的广州规划信息化年会上,叶院士再次启迪众人,深入探讨了人工智能在城市规划领域的起源与演变,这不禁让我思绪万千。
人工智能技术的演进历程,大致可以划分为四至五个鲜明的阶段。从1960年至1980年代,专家系统横空出世,引领了人工智能的首次热潮,它标志着机器开始模拟人类专家的智慧与决策过程。随后,1980年至2000年代,神经网络技术的兴起,则开启了人工智能的第二次浪潮,为机器学习领域注入了新的活力。进入21世纪,统计机器学习方法逐渐成熟,从2000年至2010年代,这一技术分支取得了显著进展。而自2010年起,深度学习方法的迅猛发展,不仅推动了人工智能技术的第三次飞跃,更引领我们步入了生成式人工智能的新纪元。尤其是2022年以来,大模型的崛起,更是给人工智能领域带来了前所未有的震撼与变革,生成式人工智能与大模型的结合,正引领着新一轮的技术热潮。
将这一技术脉络映射到城市规划学科的研究中,我们同样可以清晰地看到城市规划人工智能三个主要阶段的发展轨迹。首先,是专家系统时代,大约兴起于1980年代,这一时期的研究成果与尝试,虽因时间久远而未能广泛为人所知,但其对城市规划智能化的初步探索具有重要意义。其次,是近十年来的机器学习方法应用阶段,这一时期的城市规划研究开始深入探索并实践机器学习技术,为城市规划的科学性与精准性提供了有力支持。而今,我们正站在第三个阶段的门槛上——“规划专业大模型”的探索与实践。
人工智能与城市规划:知识(knowledge)
这三个阶段深刻揭示了人工智能的多维视角,首要探讨的便是“知识”这一核心要素。当我们思考人工智能的本质时,实质上是在探索如何让机器掌握并应用人类的知识体系。这不仅仅是一个简单的知识传递过程,更涉及到机器如何理解、分类及应用这些知识的复杂机制。我们大致可以将知识划分为三类:事实性知识,如“地球是个椭球体”,这是基础且客观存在的事实;程序性知识,比如“如何烧菜”的步骤,它指导我们完成一系列有序的操作;此外,还有一类知识可以称之为“启发性知识”,涉及复杂的决策与判断。
将这些知识分类应用于城市规划领域,我们的目标是让机器能够获取并内化规划工作的专业知识。这些专业知识是城市规划研究与实践中不可或缺的基础,它们指导着从规划构思到实施的全过程。通过将我们的专业知识有效传递给机器,我们可以借助人工智能的力量来辅助甚至部分替代人工完成规划工作,这已成为当前城市规划领域应用人工智能的基本范式。
回顾人工智能发展的历程,特别是与城市规划相结合的三个阶段,第一个阶段便是专家系统时代,可追溯至20世纪60年代,而在城市规划领域则大约兴起于1980年代。
(1)专家系统——基于知识的系统
为何这一理念易于理解呢?原因在于技术背后所依托的,实质上是一个庞大的规则化知识系统。简而言之,这种技术根植于知识之中,其核心在于将专家的知识提炼、编纂成知识库,随后用户通过推理引擎与这一知识库进行交互,最终经由解释系统满足其特定需求。这一过程的首要步骤,便是将特定领域的专家知识转化为明确的规则体系,这些规则如同指引,引导系统对问题进行逻辑推理,从而给出答案。这一过程在医学领域尤为典型,如1970年代MYCLN诊断系统通过预设的数百条规则,模拟医学专家的诊断流程诊断具有传染性的血液病,并给出治疗建议。这个系统的诊断准确率介于全科与专科医生之间,但它无疑已掌握了医学专家的知识。
在规划领域,我们同样遵循着这一路径。回溯至1980年代末至1990年代初,即有先驱者将这一思想引入规划研究,尤其是在设施选址等领域,通过构建规则集,让机器辅助决策。这些尝试虽显古老,却标志着人工智能在城市规划研究中的早期萌芽。然而,随着探索的深入,我们很快遇到了两大难题:一是知识获取与提取的艰巨性,专家的隐性知识难以转化为明确的书面规则;二是知识表达的局限性,规划学科中大量的空间关系与经验智慧难以用简单的等式或公式来概括。正是这些特性,使得早期的探索虽具开创性,却难以跨越某些障碍,导致1990年代后该领域的研究一度陷入沉寂。
(2)机器学习——从数据中学习知识
自2015年起,规划学科领域迎来了机器学习的蓬勃发展期,众多学者纷纷投身其中,共同推动了这一领域的繁荣。与早期的专家系统相比,机器学习在知识理解与应用的路径上展现出了截然不同的风貌。它不再依赖于人工总结与提炼的专家知识,而是转向了一种更为动态与自适应的学习方式——通过构建庞大的训练数据集,让机器在海量数据中学习而掌握知识。
这一转变的契机,正是大数据时代的全面到来。自2010年代中期以来,随着数据量的爆炸性增长,机器学习技术得以在规划学科中迅速崛起。它不再受限于知识的显式表达与规则制定,而是能够从复杂多变的数据中挖掘出隐藏的模式与规律,进而形成具有预测与决策能力的模型。这些模型在面对新情境时,能够迅速给出判断,其背后所蕴含是机器通过大量学习所积累的知识。
从这一视角来看,机器学习巧妙地绕过了知识提取与规则制定的两大难题。它不再要求研究者将专业知识转化为机器可读的规则集,而是让机器在数据的海洋中自由航行,自行发现与构建知识体系。这种转变不仅极大地降低了知识传递的门槛与成本,还使得机器学习技术在规划研究中得以迅速普及与应用。
以同济大学叶宇教授的研究为例,他通过机器学习技术,对上海中环以内道路的街景图片进行了大规模的训练与评估。这一过程中,建筑系的研究生们作为“导师”,对每张图片进行了细致的环境质量评价。随后,机器便能够基于这些训练数据,自动完成对上海整个中环以内道路沿线景观的建设环境品质评估。这一案例不仅展示了机器学习在处理大规模、重复性任务上的巨大潜力,还揭示了其在提升规划研究效率与精度方面的独特优势。
(3)大模型的“再学习”:从知识维度理解专业大模型与通用大模型
我们当前正处于一个备受瞩目的大模型时代,这一时代的来临促使我们重新审视并调整我们的思维方式。尽管大模型的概念看似复杂,但实质上,其核心依然可以归结为“知识”二字。从广为人知的GPT语言模型,到规划界新兴的图像生成大模型,这些通用大模型通过大规模的学习与预训练,已经积累了海量的通用知识。这些知识虽不专注于某一特定领域,却为跨领域应用奠定了坚实的基础。
然而,当我们将这些通用大模型引入专业领域时,便需要进行一次针对性的训练,即所谓的“微调”或“专题训练”。这一过程旨在将特定领域的专业知识融入通用模型之中,使其能够胜任更为专业、复杂的工作。正如病理图像分析领域的多模态模型所展示的那样,经过专题训练的通用模型能够模拟医生阅片的过程,准确判断病情与病灶,这正是专业知识与通用模型深度融合的典范。
受此启发,我们也尝试将这一方法引入规划领域。通过构建通用的图像模型,并探索其掌握规划专业知识的程度,我们发现了一些有趣但也值得深思的现象。例如,在尝试使用图像模型对照片进行局部重绘时,虽然生成的图像在视觉上可能颇具吸引力,但从专业角度来看,却存在明显的尺度与用途不符的问题。这些问题提醒我们,通用大模型在未经专业训练之前,尚难以直接应用于规划专业领域。
因此,我们不应轻视预训练的通用大模型,而应充分认识到其潜力与局限性。通过针对性的再训练与再学习,我们可以有效地将规划专业知识传递给这些模型,使其在专业领域内发挥更大的作用。
专业大模型案例一
规划设计总平面渲染图生成模型
首先,我们来讲第一个案例。在座的各位或许都曾亲手绘制过那些总平面渲染图,尤其在规划设计院中,这类工作更是家常便饭。从线稿到色彩填充,无论是为了评审、投标还是其他目的,这一步骤都不可或缺,且往往耗时数十小时。我的愿景是颠覆这一传统流程——将线稿直接交由机器,仅需短短十几分钟,便能完成高质量的渲染图,极大地缩短后期处理时间。若专业人员在此环节耗费超过半小时,那无疑是低效的,因为这本质上已接近于机械化操作。但渲染图的重要性不言而喻,因此,我们尝试将渲染图的绘制技巧融入通用大模型中,使用常用的开源Stable diffusion模型进行专题训练,旨在实现这一目标。
我们的初衷是将总平面渲染图的绘制知识整合进通用的大模型中,通过程序化的输入指导如何绘制渲染图。但这一过程并非一帆风顺,经过多次尝试与反思,我们意识到,要让机器学会如何像人类一样绘制渲染图,首先需要明确图稿的类型(如居住区、工业区或商业区),因为不同的类型决定了表达的重点与方式。紧接着,是识别并强调设计中的亮点,无论是轴线、滨水特色还是其他设计元素,都应成为渲染的焦点。同时,选择何种色彩风格(水彩、油画、对比强烈或单色系)也是至关重要的。
为了将人类绘制渲染图的知识体系化,我们训练模型的研究生同学首先总结了渲染图绘图方法,构建出色彩体系的知识图谱,涵盖整体效果、色彩关系及细节处理等多个方面。随后,我们精选了少量优质的设计图作为训练素材,这些图稿在色彩搭配、空间关系等方面均符合我们的设计判断标准。通过功能结构、要素细节、色彩基调及关系等多维度的训练,我们提炼出关键提示词,让大模型能够捕捉并学习这些核心要素。
值得一提的是,尽管我们在阴影处理、文字注记等方面仍面临挑战,但通过微调训练与后期处理,我们取得了令人满意的初步成果。当输入一张线稿图并配以简洁的提示词(如“清洁明亮”、“邻近色部分着色”)时,机器能够迅速生成风格各异的渲染图,无需再逐一指定设计要素。这种以思路驱动模型的方式,不仅提高了工作效率,更使得渲染图更加贴近设计者的意图与审美。
尤为惊喜的是,大模型在渲染过程中还能自动识别并添加一些隐性设计元素,如树木、丰富的滨水细节等,这些都是基于它对优质图稿的学习与理解。这充分展示了大模型在捕捉设计隐性知识方面的潜力。
专业大模型案例二
融入空间形态设计知识的图像生成模型
第二个案例是街道空间更新专业模型,我们想法是用在设计前的交流。输入几个提示词,展示今后的特定更新倾向之后场景以供讨论,并不是指想让模型做完设计,而是需要模型按提示生成对应建成环境效果。
我们着重深化了设计理念训练。例如,其中一个核心理念是聚焦于营造浓厚的商业氛围,旨在将训练环境转化为一个充满商业活力的社区街道范本。首要目标即是确立并强化这一商业氛围,进而探索其如何在具体场景,如步行商业街与混合功能街区中得以体现。我们不再仅仅依赖罗列众多元素来构建场景,而是聚焦于关键要素的精准布局与效果呈现,力求通过少量而精准的训练实现最终愿景。在此过程中,我们收集并分析了大量优质设计案例,这些案例不仅展示了理想商业街的具象形态,还深入剖析了设施配置、空间组合以及活动流线。通过约八十幅商业街道场景微调训练,实现了输入不同设计导向提示词,模型生成不同商业氛围下的街道空间。
此外,我们还探讨了街道改造的另一重要方向——无障碍设计。在此训练中,我们梳理了无障碍设计的基本概念,着重于如何将这一理念运用到训练专业模型之中。训练后的专业模型具备了理解无障碍设计要求的能力,例如在与花坛、台阶等元素的结合处理上兼顾无障碍需求。
“知识”:人工智能规划技术“关键词”
今天,我的主旨并非深入探讨训练模型的技术细节,而是聚焦于知识本身,特别是人工智能规划技术中不可或缺的关键知识。回望专家系统的发展历程,其核心在于人类主动提取并明确化知识,随后将这些知识转化为规则,以供机器遵循进行决策。而机器学习则开辟了一条新途径,它使机器能够从海量数据中自主提炼知识。
那么,面对当前炙手可热的大模型,我们应如何审视其角色与潜力?通用大模型通过大规模的预训练,已积累了广博的通用知识。然而,值得注意的是,这些模型在踏入特定专业领域时,往往显得力不从心,因为它们尚缺乏该领域的专业知识。因此,对于大模型而言,再学习成为了必经之路,而再学习的内容,正是我们专业领域内的知识。
在进行任何形式的模型微调时,我们应明确想要传递的知识类型,并沿着这一知识传递的路径去精心训练模型。切勿陷入盲目训练的误区,即仅仅针对模型本身或追求特定效果而进行训练。无论是让机器绘制图纸,还是辅助设计,其本质都是在一个传递专业知识的过程。
在这个过程中,作为训练模型的人,首先必须是一位专业领域专家,对你所在领域的专业知识有深入的理解和掌握。换句话说,你需要精通规划领域的专业知识,才能有效地将这些知识传递给模型,让它成为你专业智慧的延伸。
“知识”:AI for Science
在过去的一年里,“AI Science”这一概念频繁出现在我的讨论与思考中。直至两周前,我细读了《Nature》上一篇论文,其中明确提出了“人工智能时代的科学发现”,即“AI for Science”。这并非旨在取代科学家,“AI for Science”这一理念是人工智能驱动科学进步的体现。它意味着AI在科学研究中承担数据的收集与管理,数据的表达、科学假设的生成,乃至实验与模拟驱动。在我们所专注的城市规划领域,城市科学同样需要这一转变。我们的学科若要真正融入人工智能的浪潮,就必须迈向“AI for Urban Science”的道路,让AI成为我们规划研究的有力助手,从数据采集、数据解读到假设构建,再到实验与模拟的每一个环节。
我的研究生和博士生们有时会疑惑,我们的学科似乎并不以实验为主导。但我坚信真正的科学探索离不开实验的验证与检验。因此,我们的“AI for Science”之旅还任重道远。我们期待有一天,人工智能能够深度挖掘并揭示城市发展与运行的内在规律与知识,为城市规划提供更加精准、科学的指导。这一过程,实则是AI在科学探索中的深度应用,是AI驱动学科进步的关键步骤。从更宏观的视角来看,无论我们处于城市规划人工智能发展的哪个阶段,知识始终是核心要素。
我总结为四句话:从知识维度审视人工智能,其发展历程可划分为三个阶段,而知识始终是贯穿其中的关键词。即便在未来“AI for Science”的高级阶段,知识的重要性依然不言而喻。因此,推动城市规划领域的人工智能发展,必须紧密围绕规划专业知识展开,以专业知识为指引,不断探索与实践。
供稿单位:中国城市规划学会城市规划新技术应用专业委员会、广州市规划和自然资源自动化中心
版权声明:
凡本网注明“来源:中国城市规划网”的所有作品,均为本网合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中国城市规划网”。违反上述声明者,本网将追究其相关法律责任。授权事宜请邮件至www@planning.org.cn,中国城市规划网保留最终解释权。
凡本网注明“来源:XXX(非中国城市规划网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。