日前,2023年世界人工智能大会(WAIC)主论坛科学前沿全体会议在上海举办。多位全球人工智能及相关交叉领域顶级科学家、高校教授及业内外人士齐聚一堂,共同探讨全球化视野下的“通用人工智能与科学未来”。
(潘洁 摄)
上海市副市长刘多在致辞中指出,面向未来,上海将抢抓通用人工智能发展机遇,发挥城市功能、技术积累、产业集聚、应用场景、人力资源等综合优势,进一步加强人工智能基础理论和关键技术研究,着力提升自主创新能力,打造具有全球影响力的创新高地和世界级产业集群。
(资料图片)
科技部战略规划司司长梁颖达表示,展望未来,我们将聚焦人工智能发展和治理等重大议题,与国际业界同仁共推发展、共护安全、共享成果。
开启通用大模型新时代
会议期间,上海AI实验室与商汤科技联合香港中文大学、复旦大学、上海交通大学及清华大学发布全新升级的“书生通用大模型体系”(简称“书生大模型”),包括“书生·多模态”“书生·浦语”和“书生·天际”等三大基础模型,以及首个面向大模型研发与应用的全链条开源体系。
目前,“书生大模型”在130多个评测中性能达世界领先或先进水平。其中,“书生·多模态”无缝整合了语言、图像、视频等多种模态,首次实现通过自然语言定义视觉任务,并具有多模态交互和跨模态生成能力;升级后的“书生·浦语”为国内首个正式发布的支持8K语境长度的千亿参数级语言大模型;“书生·天际”则是全球首个城市级NeRF实景三维大模型,具备千亿参数,在全球首次实现对100平方公里城市实景进行4K高精度建模及编辑。
在全面升级的同时,书生·浦语也正式开源了一个70亿参数的轻量级版本InternLM-7B,以及贯穿数据、预训练、微调、部署和评测五大环节的全链条工具体系。
共商AI过去与未来
论坛现场,两位AI顶级学者对人工智能研究的前沿课题进行了回溯与展望。
图灵奖得主、美国科学院院士、美国工程院院士、谷歌杰出工程师David A. Patterson(大卫·帕特森),香港科技大学首席副校长、英国皇家工程院院士郭毅可分别带来了主题演讲。
David A. Patterson发表了题为《A decade of Machine Learning Accelerators: Lessons Learned and Carbon Footprint》的视频演讲。他提到,当前训练某一模型需要产生大量碳排放,如果进一步提升模型准确度,排放数字可能会更大。而在未来,我们有办法让机器学习的能耗和碳排放降低。研究人员有望从模型、硬件、数据中心能效、数据中心位置四方面协同着手,大幅降低机器学习的能耗与碳排放。
在主题为《The Human Use of Human Bing: University Education in the AI Era(人有人的用处:人工智能时代的大学教育)》的演讲中,郭毅可表示,生成式人工智能对教育的影响是根本性的,人工智能赋能的时代,教师及学习者都更需要创造力和批判思维能力。“我相信人有人的用处,我觉得聪明的我们应该用我们创作的机器培养更聪明的人,而这些人又去创造更聪明的机器,更聪明的机器培养更聪明的人,这是一个健康的循环。”
AI如何保障人类社会的可持续和良性发展
随着模型规模的不断扩大和性能的不断提升,大模型已成为推动人机交互革命的重要力量。由上海AI实验室林达华教授主持,加拿大工程院外籍院士、IEEE/IAPR/CAAI Fellow、HiDream.ai创始人兼首席执行官梅涛、清华大学教授唐杰、复旦大学教授邱锡鹏、普林斯顿大学教授王梦迪、南洋理工大学助理教授潘新钢、微软研究院高级研究员杨健伟以及上海AI实验室青年科学家戴勃展开了以“大模型驱动的交互新范式”为主题的圆桌讨论。
(潘洁 摄)
当下,绝大部分大语言模型依旧是Transformer模型,这基本也成为标准结构。“Transformer的成功有必然因素,首先它的模型容量非常适合GPU,因为它是GPU诞生之后形成的模型,所以考虑设计模型时基于现在的GPU架构,非常适合通过GPU把规模扩大,这是其成功的主要原因,包括它的容量要足够大。”邱锡鹏表示,这同样带来一个问题,包括算力消耗,它需要非常大的计算量,比如把模型规模进一步扩大时,可能就难以承受了。
“未来应该会出现深的架构,而且成本会非常低,这种架构长什么样,还不确定,基本可以借鉴人的记忆机制,现在的Transformer没有状态的,所以引入记忆之类的是可以大幅地减少计算量。”大模型这波浪潮,很大程度上影响或改变了世界交互的方式。潘新钢则表示,交互的方式也取决于硬件技术,苹果前不久发布新的VR设备,对于3D建模师来说将是新的创作方式,大模型也可以和新兴硬件交互方式结合,让设计师们更好地进行创作。
“大模型擅长模仿人的推理和创作方式,但它从0-1的创新能力目前达不到人的水平。”潘新钢同时表示,人可以从没有文字创造出文字,可以从有文字再发展出三次工业革命,但目前来说,大模型在模仿人进行机械或推理任务时,没有从0-1的创作能力,“大模型可以替代人的机械式劳动,比如你有一个想法,把它变成电影草图,大模型就可以帮你做,但如何想一个好的甚至数据中没有出现过的想法,这反而体现了设计师的可贵或任何利用AI作为工具的人的更加重要的能力。”
人工智能如何赋能科学研究日益成为科学家们关心的话题。大会围绕“AI for Earth”召集全球地球科学专家展开讨论。对话由上海AI实验室教授欧阳万里主持,聚焦于AI技术在地球系统基础研究的最新技术进展和成果,以及AI大模型在地球科学基础研究领域的挑战和发展趋势。美国工程院院士、中国科学技术大学讲席教授张捷、国家气象中心副主任代刊、欧洲中期天气预报中心副总干事兼预报部主任Florian Pappenberger、慕尼黑工业大学教授Niklas Boers、北京大学长聘副教授林金泰及上海AI实验室青年科学家白磊共同开展了主题为“AI for Earth: Building a Sustainable Future”的圆桌对话。