智者访谈

机器之心

Technology

Latest episode

11 episodes

11. 上海交大张拳石：思维链只是表象，DeepSeek凭什么更强
27/03/2025 | 1h 2 mins.
DeepSeek-R1 等模型通过展示思维链（CoT）让用户一窥大模型的「思考过程」，然而，模型展示的思考过程真的代表了模型的内在推理机制吗？在医疗诊断、自动驾驶、法律判决等高风险领域，我们能否真正信任 AI 的决策？
本期《智者访谈》邀请到上海交通大学张拳石教授，他在神经网络可解释性研究领域开创了新的理论框架。
不同于传统的工程技术层面的解释方法，张教授提出了「等效与或交互」解释性理论，用严谨的数学符号化方式证明神经网络的内在表征逻辑，为理解泛化性、鲁棒性和过拟合提供了新的视角。
面对大模型发展的各种挑战，张教授强调了理论创新的重要性。他说：「所谓十年磨一剑，相比用十年时间去优化一个复杂系统，更多是用十年去等待一个真正值得投入的问题。」
【时间线】
01:20 思维链是模型的真实思考过程吗？
05:39 将表征逻辑严谨解释为符号化交互概念
14:16 幻觉、欺骗与创意：本质相同
20:49 结果导向，模型的自我纠正与提升：潜在风险
28:00 从表征角度理解泛化性、鲁棒性的根因
31:56 过拟合的内在机理
38:43 大模型的质量评估、安全与商业发展
46:06 从 Scaling 的维度到维度的 Scaling
50:10 用 CoT 数据反哺训练的潜在风险
52:36 如何在 AI 研究中找到真正的「大问题」
【栏目简介】
这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。
【主播】
闻菲，机器之心合伙人总监
【嘉宾】
张拳石
• 上海交通大学长聘教轨副教授，博导
• 上海交通大学电院计算机科学与工程系长聘教轨副教授，博士生导师，入选国家级海外高层次人才引进计划，获 ACM China 新星奖。在神经网络可解释性方向取得了多项具有国际影响力的创新性成果。
• 担任 TMLR 责任编辑，NeurlPS 2024领域主席以及 AAAI 2019，CVPR 2019，ICML 2021 大会可解释性方向分论坛主席。
【联系方式】
公众号：机器之心
收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅
其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）
联系我们：[email protected] | [email protected]
10. 清华翟季冬：DeepSeek 百倍算力效能背后的系统革命
26/03/2025 | 31 mins.
2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划，Meta 在建规模超 130 万 GPU 的数据中心时，这个来自中国的团队打破了大模型军备竞赛的既定逻辑：用 2048 张 H800 GPU，两个月训练出了一个媲美全球顶尖水平的模型。
这一突破不仅撼动了英伟达万亿市值，更引发了整个行业的反思：在通往 AGI 的征程上，我们是否过于盲信算力规模，而忽视了一条更加务实且充满创新可能的路径？
与 2023 年「更大即更好」的粗放发展观不同，2025 年 AI 发展或将更像是一场精打细算的技术炼金：如何用最少的资源最大化模型效能，如何在特定场景实现极致效率。DeepSeek 已经展现出这种方式的威力——开发者总是倾向于选择性价比更高的开源方案，当千千万万的应用都以 DeepSeek 为基座，由此构建的生态将如何重塑 AI 产业格局？
本期《智者访谈》邀请到清华大学计算机系长聘教授、高性能计算研究所所长翟季冬，深入探讨大模型时代的 AI 算力优化之道。翟季冬教授指出，DeepSeek 实现百倍性价比提升的一个重要原因，是其在系统软件层面的深度创新。
「性能优化是一个无止境的过程，」翟季冬教授表示，在中国面临算力资源挑战的背景下，通过系统软件创新提升算力效能，是产业突围的关键。这不仅需要在编程语言、编译器、通信库、编程框架等多个技术层面发力，更需要建立起完整的基础软件体系。
当下，一个值得深思的现象是：尽管 AI 算力需求持续攀升，但国内众多智算中心的国产算力资源却存在闲置。供需错配的背后，暴露出基础软件体系的短板。
但困境也蕴含着重要机遇：如何打通从应用到系统软件，再到自主芯片的完整链路，探索出一条符合中国现实的发展路径？这不仅是技术创新，更是战略抉择。
在算力主导 AI 竞争力的时代，如何让每一份计算资源都能释放最大价值，这个问题本身，与答案同样重要。
【时间线】
03:35 DeepSeek 与算力需求未来趋势
06:41 算力效能评估新视角
10:26 中美硬件差异下的软件思考
14:00 为何还没 Transformer 专用芯片
17:41 万卡集群训练难点
21:01 降本增效：推理优化的关键
24:41 Infra 如何为下一代大模型做好准备
27:19 大规模异构集群的算力管理
29:42 智算供需错配：系统软件如何补位
【栏目简介】
这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。
【主播】
闻菲，机器之心合伙人总监
【嘉宾】
翟季冬
• 清华大学计算机系长聘教授，博导，高性能计算研究所所长
• 青海大学计算机技术与应用学院院长
• CCF高性能计算专委副主任
• 清程极智首席科学家
【联系方式】
公众号：机器之心
收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅
其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）
联系我们：[email protected] | [email protected]
09. 小米语音首席科学家 Daniel Povey：语音识别卷完了，下一个机会在哪里？
25/03/2025 | 29 mins.
多模态能力的融合正在改写AI发展路径。语音、视觉与自然语言处理的边界日益模糊，以Transformer为代表的通用解决方案，正在重塑传统技术领域。
在这个技术范式转变的关键时期，那些长期深耕细分领域的研究者又在思考什么？他们如何看待这种技术融合的趋势？
本期《智者访谈》邀请到著名开源语音识别项目Kaldi的创始人、小米集团语音首席科学家Daniel Povey博士。作为推动全球智能语音处理产业化的关键人物，他见证了语音识别技术从实验室走向大规模应用的全过程。十多年前，他在微软研究院的实习生，如今已成为Google Gemini等标志性项目的负责人。
当整个行业都在追逐大模型和通用方法时，Povey博士却选择专注于不那么热门，但更有潜力的方向。「有这么多聪明人都在试图改进AI，那些容易被发现的方法早就已经被人发现了。」
在他看来，技术进步不应被某一主流范式所限制，AI领域的进步往往源于解决特定领域的具体问题，每个领域都应该保持自己独特的视角和方法——也许语音领域的下一个解决方案，会给机器学习带来全新的启发。
Transformer确实好，也确实可能是未来发展的方向，但如果所有人都只基于现有模型做改进，可能阻碍整个领域的根本性创新。在访谈中，Povey博士还分享了技术创新的方向选择、规模与效率的权衡，以及如何在紧跟前沿的同时保持独立思考。
对于年轻一代的研究者，他的建议直白而务实：你必须诚实面对自己真正想要的。学AI就能年薪百万的时代已经过去了，现在进入AI领域很难做出突破，除非你真的才华横溢；很多时候，你职业生涯的最终目标，要么很难实现，要么实现了也没有想象中那么美好。
希望这番坦诚的对话，能为我们在AI发展的万千可能性中，找到属于自己的方向。
【时间线】
01:35 Kaldi 之后的新探索
02:51 语音成了神经网络的子领域
04:37 多模态：Transformer 大一统？
07:54 大模型 vs 小模型
11:13 会议不再是交流研究的最佳方式
14:01 如何判断真正的技术进步？
18:10 Scaling Law 与数据极限
21:18 未来机遇展望
23:52 别把生活卷丢了
【栏目简介】
这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。
【主播】
闻菲，机器之心合伙人总监
【嘉宾】
Daniel Povey
• Kaldi之父
• 小米集团首席语音科学家
• lEEE Fellow
• 清华大学杰出访问教授、武汉大学客座教授
• Daniel Povey 博士毕业于英国剑桥大学，先后就职于 IBM 和微软。2012年加入美国约翰霍普金斯大学，任语言和语音处理中心副教授。2019年10月加入小米，担任集团语音首席科学家。2022年12月，Daniel Povey 凭借在语音识别和声学建模方面的杰出贡献入选IEEE Fellow。
【联系方式】
公众号：机器之心
收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅
其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）
联系我们：[email protected] | [email protected]
08. 图森未来陈默：自动驾驶无以为继急转AIGC游戏，拿下金庸群侠传、三体IP
24/03/2025 | 30 mins.
自动驾驶行业正经历新一轮洗牌。其中，全球自动驾驶第一股图森未来的沉浮，折射出整个行业的阵痛：从 2021 年 IPO 时 85 亿美元的估值，到 2024 年初退市，短短三年间历经管理层动荡、美国监管调查、业务收缩及大幅裁员等一系列剧变。
退市之后，转折仍在继续：2024 年 8 月，公司出人意料地宣布进入生成式 AI 应用领域，计划打造基于《三体》的动画电影及视频游戏。伴随这一战略转型的是愈演愈烈的管理层风波，多起法律诉讼和股权纠纷相继浮出水面。
从图森未来的一系列人事变动和公开信息中可以看出，管理层在企业战略上存在根本分歧：一方坚持加大自动驾驶技术研发，另一方则更强调现金流和盈利能力。创始团队最终分道扬镳，联合创始人、前 CTO 候晓迪现已另创自动驾驶公司。
在风险投资驱动的科技创业中，技术理想与商业现实如何平衡？创始人、投资人与董事会之间的权责边界又在哪里？
本期《智者访谈》对话图森未来联合创始人陈默，他认为 AI 技术与新需求的产生没有必然联系，无论是自动驾驶还是大模型，都应回归工具本质，以降本增效为目的。陈默直言，L4 级自动驾驶要实现商业化，必须在营运成本上比人工驾驶更有优势，而这一点在当前技术和市场环境下遥遥无期，因此图森转向动漫游戏，正是看中了该市场的盈利能力和持续增长潜力。
在访谈中，我们将尝试还原图森未来的转型决策，探讨科技创业中的关键议题：在追求技术突破的同时，如何建立可持续的商业模式？在波动的资本环境下，创业者该如何平衡多方诉求？面对科技创业的不确定性，如何建立稳定且有效的公司治理机制？
这些问题不仅关乎图森的未来，在 AI 技术不断突破的今天，如何将创新转化为真正的价值，是每一位创业者需要直面的命题。
注：本期节目录制于2024年，如对话中提及年份相关时间点，默认「今年」为「2024年」。
【时间线】
00:47 让公司活下来
05:05 自动驾驶无以为继
09:09 理想与现实
13:17 90°急转，切入 AIGC 游戏
15:58 大模型做得好 ≠ 商业上成功
17:50 IP 破局：从三体到金庸的游戏野心
24:40 创业者的底线思维
【栏目简介】
这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。
注：本期节目录制于2024年，如对话中提及年份相关时间点，默认「今年」为「2024年」。
【主播】
闻菲，机器之心合伙人总监
【嘉宾】
陈默
• 图森未来联合创始人、首席制作人
• 在人工智能、媒体和游戏行业超过15年以上的连续创业经历
• 创立多家初创企业并担任公司高级管理层，拥有丰富的战略规划、资源匹配和复杂项目管理经验
【联系方式】
公众号：机器之心
收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅
其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）
联系我们：[email protected] | [email protected]
07. 清华赵明国：智能人形机器人≠智能+人形
23/03/2025 | 43 mins.
2024 年，人形机器人领域迎来爆发式增长。特斯拉 Optimus 的持续迭代、OpenAI 对 1X 的战略投资，众多初创公司异军突起，以及包括 Mobile ALOHA 在内学术界的不断创新，共同描绘出一幅激动人心的未来图景。
技术进步的浪潮固然令人振奋，但保持清醒和冷静，在开放探索的基础上，审慎选择最符合时代需求和技术发展规律的路径，才是引领人形机器人走向成熟的关键。
本期机器之心《智者访谈》邀请到清华大学自动化系研究员、机器人控制实验室主任赵明国教授，从运动控制的视角看人形机器人发展。赵明国教授在机器人控制领域有二十多年的研究与实践，他认为当前人形机器人领域呈现出如春秋战国般多元化的发展态势，这既是蓬勃发展的象征，也潜藏着方向迷失的风险。
赵明国教授强调，「智能人形机器人」不能只是「智能」和「人形机器人」的简单叠加，而应当是一个全新的研究主题和技术范畴，需要机器人学和人工智能两个领域更深层次的融合，制造能够在复杂环境中自主适应和学习的智能体。
对大模型技术在机器人控制领域的应用，赵教授认为单纯依赖「大脑」解决运动控制问题并不合理。人类的运动控制是一个复杂的多层次系统，涉及本体反射、中枢控制和大脑控制等多个层面。我们需要更深入地研究生物系统的运动控制机理，重新思考机器人控制系统的架构，并探索更有效的学习和优化方法。
赵教授主张技术的先进性并不等同于实用性，只有与时代需求和经济发展相匹配的技术，才能真正落地生根，开花结果。例如，维纳控制论中的很多思想因为过于超前而未能对早期的计算机和人工智能起到重大的推动作用。
注：本期节目录制于2024年10月，如对话中提及年份相关时间点，默认「今年」为「2024年」。
【时间线】
00:47 人形机器人多元发展现状
02:47 智能人形机器人≠智能+人形
08:33 双足运动控制难点
15:49 学习 VS 优化
20:21 用大模型解决运动控制：不合理
29:36 智能机器人控制系统发展方向
31:30 人形机器人应用
【栏目简介】
这是国内人工智能垂直媒体机器之心旗下的「智者访谈」播客栏目。栏目聚焦于人工智能领域的顶尖专家和学者，旨在洞悉人工智能的核心技术与行业趋势，深化行业认知，激发创新思考。
【主播】
闻菲，机器之心合伙人总监
【嘉宾】
赵明国
• 清华大学自动化系研究员，机器人控制实验室主任，无人系统中心类脑机器人中心主任
• 发表百余篇论文，授权国家发明专利10余项
• 在人形机器人领域，提出了虚拟斜坡行走方法，广义模型预测控制、全身控制等方法，研究成果获得RoboCup人形组亚军等多项国际奖项
• 在类脑计算领域，利用神经形态技术创建了高性能、高能效的机器人控制系统，成果发表于Nature封面，获得2019年度中国科学十大进展及“科技创新2030”计划的资助。
【联系方式】
公众号：机器之心
收听渠道：Apple Podcast | 小宇宙 | 喜马拉雅
其他平台：bilibili（机器之心官方） | 视频号（机器之心）| 小红书（机器之心）
联系我们：[email protected] | [email protected]