自然语言处理战略研讨会
LLM与AGI:正确之路,垫脚石,还是拦路石?
汇聚自然语言处理领域的学者与产业实践者,在技术爆发与愿景纷争的十字路口展开思辨。我们将超越对现有模型性能的简单探讨,聚焦LLM在通向AGI的漫长征程中的本质角色——它究竟是勾勒出AGI雏形的关键跃迁,还是固化范式、掩盖真实认知挑战的舒适区陷阱?研讨旨在通过多角度碰撞,厘清技术路径的底层逻辑与现实约束,为前沿探索注入清醒的洞察。
研讨会安排
时间:2026年6月13日 08:30–12:00 地点:琥珀厅
| 日期 | 时间 | 报告题目 | 报告人 |
|---|---|---|---|
| 6月13日 | 08:30-08:50 | 大语言模型能力来源与边界 | 张奇 |
| 08:50-09:10 | 大语言模型能否成为 AI Scientist:从数学证明到物理理论发现的前瞻性思考 | 刘凯 | |
| 09:10-09:30 | 下一词元的暴政:为什么预测一切反而可能比预测一件事更容易 | 孔令鹏 | |
| 09:30-09:50 | 如何防止被蒸馏——闭源大模型的防盗指南 | 贺笛 | |
| 09:50-10:10 | 从Openclaw看智能体技术发展趋势 | 林衍凯 | |
| 10:10-12:00 | 自然语言处理战略研讨:LLM与AGI:正确之路,垫脚石,还是拦路石? |
引导专家
大语言模型能力来源与边界
张奇
复旦大学,教授
张奇,复旦大学计算与智能创新学院教授、国家级领军人才。兼任上海市智能信息处理实验室副主任,中国中文信息学会理事、CCF大模型论坛常务委员、CIPS大模型专家委员会委员、CIPS信息检索专委会常务委员。主要研究方向是自然语言处理和信息检索,聚焦大语言模型、自然语言表示、信息抽取、鲁棒性和解释性分析等。在ACL、EMNLP、COLING、全国信息检索大会等重要国际国内会议多次担任程序委员会主席、领域主席、讲习班主席等。近年来承担了国家重点研发计划课题、国家自然科学基金、上海市科委等多个项目,在国际重要学术刊物和会议发表论文200余篇,获得美国授权专利4项,著有《自然语言处理导论》和《大规模语言模型:理论与实践》,作为第二译者翻译专著《现代信息检索》。获得WSDM 2014最佳论文提名奖、COLING 2018领域主席推荐奖、NLPCC 2019杰出论文奖、COLING 2022杰出论文奖,ACL 2025杰出论文奖。获得上海市"晨光计划"人才计划、复旦大学"卓越2025"人才培育计划等支持,获得钱伟长中文信息处理科学技术一等奖、汉王青年创新一等奖、上海市科技进步二等奖、教育部科技进步二等奖、ACM上海新星提名奖、IBM Faculty Award等奖项。
报告摘要
随着大语言模型能力的不断增强,剖析其能力来源与边界愈发关键。大语言模型为什么有"幻觉"?推理能力来源是强化学习吗?大模型真的具备推理能力吗?等等问题受到越来越多的关注。本次报告将从大模型能力边界的实践研究和大模型能力来源两个方面,结合国内外最新研究进展与报告人及团队工作进行介绍。
大语言模型能否成为 AI Scientist:从数学证明到物理理论发现的前瞻性思考
刘凯
宁德时代,首席AI科学家
刘凯博士现任宁德时代首席 AI 科学家,负责推动公司 Scientific AGI / AI4Science 方向建设,致力于发展下一代大语言模型、多模态基础模型、AI Agent 与类脑智能架构,探索人工智能在理论物理、化学、材料科学和能源科学中的原创突破。
刘凯本科毕业于北京大学物理系,后在约翰霍普金斯大学获得神经科学博士学位,并接受系统的机器学习与计算科学训练,具有物理学、神经科学、人工智能和产业研发交叉背景。此前,他曾在 Genentech 担任 AI 科学家和负责AI的总监职位,领导 AI 药物研发、癌症疫苗设计、TCR-pMHC 建模、多模态病理组学、空间转录组分析和临床数据智能化等多个方向,推动 AI 模型进入生物医药研发流程,并获得公司高层认可。
随后,他在 SES AI 担任负责AI的副总裁,主导电池材料 AI 发现、分子宇宙、AI Agent 和科学大模型建设,推动大模型、机器学习与实验验证结合,用于电解液分子设计和新材料发现。他领导开发的 OmniScience 科学大模型,基于大规模科学语料和高性能 GPU 训练,面向科学推理、材料发现和 AI4Science 应用进行了系统探索。
目前,刘凯博士正在宁德时代推动 Scientific AGI 战略,目标是打造面向科学发现的下一代人工智能体系,使 AI 不仅能够回答问题和辅助研发,更能够理解物理概念、提出科学假设、推导新理论、设计实验,并在仿真与实验闭环中持续进化。他重点关注下一代大语言模型架构、科学推理数据、长期记忆、Loop LLM、Agentic RL、材料多模态模型和 AI Scientist 系统,希望将宁德时代在能源、材料和制造场景中的产业优势,与前沿人工智能结合,推动 AGI4Science 时代的原创科学突破。
报告摘要
近年来,大语言模型在数学推理、代码生成、复杂规划和工具调用等方向取得显著进展,使我们开始重新思考一个重要问题:大模型是否有可能从"知识问答工具"进一步走向"科学发现系统"?本报告将围绕这一问题,讨论推理大模型在数学证明、物理理论推导和未来 AI Scientist 架构中的潜在方向。
首先,数学为大模型推理能力提供了一个相对清晰的验证场景。数学问题通常具有明确的问题定义、严格的证明标准和形式化验证路径,因此大模型可以通过生成证明、调用证明助手、搜索反例和自我修正来不断提升表现。然而,当前 AI 数学推理仍存在重要局限:它可能重复证明已有定理,缺少对证明结构的把握,不善于抽象可复用引理,也可能在技术上完成证明却无法提供真正的解释和理论洞察。这提示我们,数学 AI 的核心挑战已不只是"能否证明",而是"能否理解证明、组织知识,并形成新的数学结构"。
相比数学,物理发现对大模型提出了更高要求。物理学的突破往往不是单纯的公式推导,而是从实验现象、理论矛盾和异常数据中重构概念体系。爱因斯坦之所以开创相对论,并不仅在于数学形式的推导,而在于重新定义了时间、空间、引力等基本概念。因此,面向物理发现的大语言模型不能只是文献总结器或公式计算器,而需要具备物理概念表征、长期推理、反事实思考、理论构建和实验验证能力。
报告将进一步提出一个前瞻性设想:构建"1925 年量子力学大模型"作为 AI 科学发现能力的思想实验和潜在评估框架。设想中,模型只接触 1925 年以前的人类科学文本、实验事实和数学工具,然后面对黑体辐射、光电效应、原子稳定性、光谱线等历史问题,测试其是否能够重新组织已有知识,提出类似矩阵力学、波动力学、概率解释和泡利不相容原理等关键思想。这并不是一个已经完成的工作,而是一个用于思考和评估下一代科学大模型能力边界的研究设想:如果 AI 能够在历史知识边界内重建重大理论,就意味着我们可能获得了一种衡量原创科学发现能力的新型 benchmark。
最后,本报告将讨论下一代大模型可能需要的发展方向。现有大模型主要依赖大规模预训练、指令微调和强化学习,已经具备强大的语言和推理能力,但距离真正的 AI Scientist 仍有明显差距。未来模型可能需要引入长期记忆机制、Loop LLM 式反复思考、自我反思与内省、科学概念表征、多模态物理世界模型、工具调用能力、形式化验证能力。
下一词元的暴政:为什么预测一切反而可能比预测一件事更容易
孔令鹏
香港大学助理教授
孔令鹏,香港大学计算机科学系助理教授、博士生导师,香港大学NLP实验室联合主管,卡内基梅隆大学博士,师从ACL Fellow Noah A. Smith。曾任谷歌DeepMind研究科学家。主要研究领域为自然语言处理与机器学习,专注于生成模型及模型架构等基础研究。在ICLR、ICML、ACL等人工智能顶级会议发表论文100余篇,谷歌学术引用12000余次,曾获ACL及EACL杰出论文奖。代表成果包括扩散语言模型Dream和字节级大语言模型EvaByte。主持或参与国家自然科学基金委与研究资助局联合科研资助基金、香港创新科技基金等项目。担任ICLR、NeurIPS、ICML等顶级会议(高级)领域主席及TMLR期刊执行编辑。
报告摘要
在过去三十年里,语言建模的进步看起来像是一场对结构性偏置(structural bias)的持续撤退:符号文法让位于统计模型,手工特征让位于学习到的表示,显式的语言结构让位于"预测下一个词元"这一看似简单的目标。每一步都是用归纳偏置去交换规模,而每一次,都是规模取胜。
本次报告是一次回顾与反思。我想沿着这条历史脉络,重新追问那些被我们逐步移除的结构性偏置究竟去了哪里——我的看法是,它们并未消失,而是一次次换了形态:从输出层搬进特征,从特征搬进网络的中间表示,再从表示压进权重。而在今天这个由"预测下一个词元"主导的范式里,还藏着一个我们很少审视的偏置:从左到右的分解次序(factorization order)本身。
串起这次回顾的,是多年前我们在一份研究提案中写下的一个反直觉的问题:在什么条件下,预测许多东西会比预测一件东西更容易? 自回归把全部概率质量压在一个困难的条件分布上——给定全部上文,唯一正确的下一个符号——并为此付出严格串行计算的代价。如果换一种问法、一次预测许多东西,这个学习问题是否反而会变得更容易?近年兴起的离散扩散语言模型(text diffusion)正是对这个问题的一种当代回应。在报告的最后,我会以它作为收尾,简短地谈谈它给我们留下的开放问题,以及——如果下一件该做的事并不只是下一个词元——我们接下来或许该往哪里走。
如何防止被蒸馏——闭源大模型的防盗指南
贺笛
北京大学,助理教授
贺笛,智源学者,北京大学智能学院助理教授。主要从事机器学习模型、算法与理论方向的研究工作,已发表ICML、NeurIPS、ICLR等重要期刊/会议论文50余篇,谷歌引用数超过10000。所设计的模型、算法多次被DeepMind、OpenAI、微软、Meta等国际顶尖研究机构使用。获得机器学习顶级国际会议ICLR 2023杰出论文奖和ICLR 2024杰出论文奖提名。
报告摘要
前沿商业生成模型正面临日益严峻的蒸馏(distillation)威胁:攻击者可以通过大规模收集模型生成数据,以远低于原始模型训练成本的代价训练出具有竞争力的替代模型。现有防御方法通常依赖两类思路:一类通过修改模型输出实现防护,但不可避免地会牺牲正常用户的生成质量;另一类依赖行为检测机制,但这类方法容易被多账号分布式查询策略规避。为此,本文提出一种面向多账号蒸馏攻击的无损反蒸馏采样方法(Lossless Anti-Distillation Sampling, LADS)。该方法保证对于任意正常用户,其每次访问所获得的响应均等价于从原始模型中独立采样得到,因此用户体验与模型原有行为保持完全一致,不引入任何质量损失。相反,对于试图通过多账号收集数据的蒸馏者,LADS 会在跨账号层面引入受控相关性,使其难以通过增加账号数量获得线性收益,从而削弱所收集数据的有效多样性与下游学生模型的泛化能力。实验结果表明,在图像生成、数学推理和代码生成等任务上,LADS 能够显著降低蒸馏所得学生模型的性能,同时对单个正常用户保持完全无损的统计一致性。
从Openclaw看智能体技术发展趋势
林衍凯
中国人民大学,预聘副教授
林衍凯,中国人民大学高瓴人工智能学院预聘副教授、CCF NOI科学委员会委员、IOI 2025中国国家队领队,主要研究方向为预训练模型和大模型智能体,Google Scholar统计引用达到2.8万次,2020-2025年连续六年入选爱思唯尔(Elsevier)中国高被引学者和斯坦福大学全球前2%顶尖科学家年度榜单、入选北京市科技新星、吴文俊人工智能青年科技奖、《麻省理工科技评论》中国与DeepTech联合发布的"AI100青年先锋"、NOI 2008金牌等。其成果获评教育部自然科学一等奖、世界互联网大会领先科技成果。
报告摘要
过去数月,AI领域很难绕开一个名字——OpenClaw。这个项目在极短时间内获得了爆发式关注:数十万星标、惊人的Token消耗,以及几乎所有大厂的快速跟进。从表面上看,它像是又一个现象级AI产品;但如果进一步审视,一个更值得思考的问题随之浮现——OpenClaw的出现,究竟意味着什么?它真的是一次技术突破,还是某种更深层变化的信号?本报告讲围绕这些问题进行讨论。
研讨会召集人
冯岩松
北京大学,副教授
北京大学王选计算机研究所副教授。主要研究方向包括自然语言处理、法律人工智能。担任国际计算语言学学会ACL Rolling Review高级执行编委、自然语言处理领域重要期刊Computational Linguistics执行编委,AI & Law执行编委,中国计算机学会自然语言处理专委会副秘书长,长期担任人工智能领域重要国际会议ACL、EMNLP、NAACL等的(高级)领域主席。已承担多项国家自然科学基金、NSFC-RGC联合基金、科技部重点研发项目课题以及北京市自然科学基金、中央引导地方大模型专项课题等。
熊德意
天津大学,教授
天津大学教授,博士生导师,自然语言处理实验室负责人,国家重点研发计划项目首席科学家,牛顿高级学者,天津市引进领军人才,青海省"昆仑英才"柔性引进领军人才,天津市"一带一路"联合实验室语言智能与技术中外联合研究中心主任,兼任天津师范大学计算机与信息工程学院执行院长。主要研究方向为自然语言处理,特别专注于大语言模型、机器翻译、AI对齐与安全、AI for Science等方向的研究。在IEEE TPAMI、AI、AAAI、ACL等国际著名期刊和会议上发表论文200余篇,出版中英文专著各一部,牵头/参与编制大模型相关标准多项。建立了省部级科技创新合作平台,承担国家级、省部级及社会委托科研项目30余项,获得北京市科学技术奖二等奖,多次获得自然语言处理领域顶级国际会议最佳长论文/杰出论文奖。主持研制"伏羲传语"等多个多语言大模型,建立了多个校企联合实验室。担任NeurIPS、ACL等多个知名国际会议的领域主席、TACL及CL执行编委、ACM TALLIP副主编等。