
晚点聊 LateTalk
《晚点聊 LateTalk》由《晚点 LatePost》出品。 最一手的科技访谈,最真实的从业者思考。
Episodes
163 episodes
163: 详解DeepSeekV4:Infra巨鲸、百万上下文走进现实、极致效率优化
2026年4月30日1:33:52Episode 163「走进不同团队的成果,创新从来是连续的,不是跳跃的。」 上周五,DeepSeek V4 发布。我们邀请了两位一线 AI 从业者一起详解 DeepSeek V4 的技术实现和创新想法。 如果一句话概括:DeepSeek V4 并没有带来新的“范式变化”,它是继续在 R1 的“测试时扩展”范式下,用一系列组合创新和工程优化,让百万上下文从理论进入实用。 超长上下文上的稳定表现,正是 Agent 和多步复杂任务亟需的能力之一。 本期访谈之后也会发图文版。本期涉及的诸多技术术语见 Shownotes 末尾注释。 本期嘉宾 赵晨阳,RadixArk 工程师,SGLang 开源推理框架开发者 刘益枫,UCLA 博士生 本期主播 程曼祺,晚点科技报道负责人 时间线: 体感、对比、消失的成本、DeepSeek 的节奏 03:01 编程能力与“御三家”有差距;不再采用 DeepSeek 自己提出的 MLA 07:44 不再披露训练成本,“用模型能力说话” 09:23 延期推测:四个耦合的新 feature (新注意力+Muon+mHC+FP4)一起上,难度爆炸 12:36 不是范式创新,沿现有范式仍有巨大提升空间 性能与效率 14:32 提出新的能力方向比刷单个 benchmark 重要 16:41 坦诚的内部评测:9% DeepSeek 工程师不会把V4 Pro 作为编程首选 23:03 单 token 推理的计算量和 KV cache 大幅优化,但解决同样问题的 token 消耗更多了 V4 具体进展 28:32 整体思路:极致的稀疏 33:45 混合稀疏注意力:放弃 MLA,SWA滑动窗口+CSA稀疏压缩+HCA稠密压缩,层间预定义分工 39:37 Muon 优化器已成检验工程能力试金石 48:52 mHC:从 Seed 提出 HC 到 mHC;Kimi 的 Attention Residuals 54:24 Infra 两个关键词:TileLang & FP4 01:10:11 多专家训练+蒸馏的后训练 01:13:20 评测危机:benchmark会过时饱和,evaluation是永恒追求,agent评估未共识 更多讨论 01:19:25 近期模型共性:架构趋同(MOE+Muon),优化方向驱动(agent、coding) 01:25:18 美国追新能力、高定价;中国追性价比、工程极限 01:28:00 V4 最有可能被记住的思想:极致压缩+低激活比+低单token成本,成为后续开源模型起点 剪辑:Nick 相关链接: 158期:V4发布前的DeepSeek:人才竞争、组织特点和独特的AGI目标 143期:再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进 104期:我给线性注意力找“金主”,字节 say No,MiniMax say Yes 103期:用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进 102期:DeepSeek 启动开源周,大模型开源到底在开什么? 附录:术语、概念解释 - 模型架构相关 Token-wise(词元级)改进:优化模型处理单 token 的过程,通常用于提升注意力计算、上下文建模或推理效率。 Layer-wise 的改进:优化模型不同网络层的结构或计算方式,通常用于提升训练稳定性、表达能力或整体计算效率。 MoE:Mixture of Experts 混合专家网络,让不同“专家”子网络处理不同输入,降低单次计算成本。 哈希路由:把 token、样本或请求分配到不同专家、节点或存储位置的方法。V4 在前几层 MoE 用了哈希路由,避免起始层路由塌缩。 Engram:DeepSeek 之前提出的一种带 N-gram 编码器的辅助模块,通过额外编码连续 token 片段,帮助模型利用局部短语级信息。V4 未使用 Engram。 - 注意力相关 MLA:Multi-head Latent Attention,多头潜在注意力,引入潜在表示压缩 KV 信息的注意力机制,能降低显存占用和计算开销。 MQA:Multi-Query Attention,多查询注意力结构,共享 Key/Value,仅保留多头 Query,提升推理效率并减少 KV cache。 线性注意力:通过核函数或近似方法将注意力复杂度从二次降低为线性(一维),是改进原初注意力随上下文长度增加,计算和显存爆炸的方向之一。 稀疏注意力:仅计算部分 token 间的注意力(而非全连接),改进原初注意力问题的另一主流方向。 滑动窗口注意力:限制注意力仅在局部窗口内计算的一种稀疏注意力。 CSA:Compressed Sparse Attention,压缩稀疏注意力。用于长上下文建模的注意力机制。把序列分组压缩成更少的token,query再从中挑选出最相关的部分。V4中的压缩比是4:1。 HCA:Heavily Compressed Attention,高度压缩注意力。同样用于长上下文建模。相比CSA压缩比例更高(128:1),query无需挑选token。 NSA/DSA:V4发布之前,DeepSeek 在年初和 9 月先后提出的两种稀疏注意力方案。 - 优化器相关 AdamW:一种改进的 Adam 优化器,通过解耦权重衰减(weight decay)提升训练稳定性和泛化能力。 Muon:一种面向大模型训练的优化算法,通过改进梯度更新或内存效率来提升训练性能。 Learning Rate:学习率,控制模型参数每次更新步长的超参数,对训练稳定性和收敛速度至关重要。 牛顿-舒尔茨迭代:一种用于矩阵归一化或求逆的数值迭代方法。Muon 作者 Jordan 提到通常使用 5 次迭代,V4 中采用了 10 次迭代。 - 残差相关 HC:Hidden/Highway Connection,一类改进残差连接的信息通路设计,用于增强信息传递或控制梯度流。 mHC:Manifold-Constrained Hyper-Connections 流形约束超连。DeepSeek 在 HC 基础上的改造,解决了 HC 在大规模训练时的数值不稳定问题。mHC 使用了双随机矩阵,即每行和、每列和都等于 1 的矩阵,以约束信息流。 Attention Residuals:注意力残差连接,将注意力模块输出与输入相加,用于稳定训练并保留原始信息。 - Infra 相关 矩阵乘法:深度学习中最核心的基础计算操作(如向量与权重相乘)。 Kernel:算子核,指在底层硬件(如 GPU)上执行的高效计算函数,是深度学习算子的实现基础。比如矩阵乘法就要写 Kernel 去实现。 CUDA:英伟达开发的能使用 GPU 的一层软件系统,也指一套语言,本次访谈语境里指编写 GPU 算子 kernel 的语言。 Triton:由 OpenAI 开源,是对 CUDA 的一层抽象,能更简单的写 Kernel。 TileLang:一种面向 AI 高性能算子的 tile 级 DSL / 编译框架,把矩阵乘法、注意力等张量计算映射到 GPU 等硬件上执行,在 Triton 的易用性和 CUDA 的控制力之间取得了较好的平衡。 FP8、FP4、INT4:低精度数值格式,分别用 8 位、4 位浮点和 4 位整数表示模型中的权重或中间数据,用于降低显存和带宽压力、提升训练或推理效率。 FP4 比 FP8 更省显存和带宽,又比 INT4 更保留浮点动态范围,因此更适合复杂训练/采样链路,但收益取决于硬件、缩放策略和 kernel 实现。V4 在 1.6T 参数规模上实现 FP4 训练是个不小的挑战。 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
162: 批量生素材、模型筛网红,与飞书深诺Meetsocial沈晨岗聊AI时代的出海营销
2026年4月26日1:11:22Episode 162出海对于中国企业来说并不新鲜,无论是早年的华为、中兴,还是大疆、影石、拓竹这样的消费硬件公司,再到 Tiktok、腾讯游戏、Temu 等互联网公司,成功的例子有非常多。但之所以我们说它是一个新的话题,是因为我们来到这个 AI 的时代,不仅看到大批的 AI 创业公司正在积极的向海外拓展,也见证着 AI 改造他们出海的路径、方式、增长、营销。 过去一年,我们也看到了很多借助 AI 营销翻车的案例,比如麦当劳在荷兰上线的一支几乎是由 AI 生成的节日广告,上线后就迅速遭到了大量的吐槽:不仅仅是画面看起来比较粗糙,更在于这个广告它传达出来的气质被认为是廉价的、偷懒的,没有什么诚意。 今天的播客,我们与飞书深诺 Meetsocial 的创始人兼 CEO 沈晨岗先生一起聊了聊,AI 在今天究竟是如何改变中国企业出海模式的?中国与美国的 AI 营销生态究竟有什么区别?在 AI 时代到来以后,企业需要建立起哪些新的能力,才能在营销战中脱颖而出? 本期节目由飞书深诺特别支持播出 本期嘉宾 沈晨岗,飞书深诺集团创始人兼 CEO 本期主播 高洪浩,晚点 latepost 主笔 时间线: Part 1 中国企业出海变迁史 04:17 中国企业出海的三个阶段:产品、公司、品牌 07:43 早年中国出海企业没有认识到营销的力量 09:45 2025 年开始中国企业出海营销范式发生变化 12:32 转型成功的出海企业案例:安克 16:18 衡量企业出海能力的模型指标:D-MES Part 2 AI 时代下,中国企业出海的新变化 22:47 出海营销领域在 AI 上的共识与非共识 25:29 AI 的使用应该与企业的商业化目标相匹配 30:38 过去三年,AI 如何改变出海营销 Part 3 中国与美国的 AI 营销 34:07 硅谷观察记:中美 AI 营销的差异 38:30 美国营销公司的历史包袱导致 AI 难落地 Part 4 AI 在未来将如何改变出海营销 42:16 Agent 时代的出海营销模式 48:42 案例:Agent 变革短剧投流 51:46 AI 时代,创意和审美变得更重要 57:07 出海服务商如何适应 AI 时代 01:01:30 三年和五年后,AI 将如何改变出海营销 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
161: 中国最早AI创业者的故事,与唐文斌聊天才策略、旷视、十年前的机器人和具身新创业
2026年4月23日2:09:50Episode 161「不做人形机器人的具身智能创业。」 本期嘉宾是原力灵机的联合创始人和 CEO 唐文斌。 2011 年,他和两位清华同学,印奇、杨沐一起创立旷视,这是中国最早的 AI 创业公司。比 DeepMind 晚一年。 2025 年初,唐文斌成立原力灵机,开始具身智能的新创业。 在本科到研究生时,他做过七年中国信息奥赛国家队的总教练,认识了大量奥赛 “小天才”,其中不少人之后加入了旷视,现在又在原力灵机和文斌一起创业。 本期节目也有视频版,可在小红书、B 站、抖音、视频号平台关注「晚点聊 LateTalk」收看。 本期节目的图文版也已经发布:对话原力灵机唐文斌:当中国最早的 AI 创业者做具身,他选择先不做人形 这期我们聊了竞赛往事、旷视的创业复盘和原力灵机的这 1 年:这是一家不做人形机器人的具身智能公司。也是一家会直接参与多模态基模预训练的公司。 这两件事都是非常规的少数派选择。 原力灵机会给中国具身市场带来哪些不同?请听完整节目吧。 本期嘉宾 唐文斌,原力灵机联合创始人 & CEO 本期主播 程曼祺,晚点科技报道负责人 剪辑:杨 时间线: 竞赛、姚班、IOI 国家队总教练:解题的本质是优化,出题比难题更难 01:49 同时参与三项奥赛:信息奥赛的乐趣是解法不唯一 05:50 本科继续 TopCoder :Challenge 机制下,一次干掉 19 个队 08:29 七年 IOI 国家队教练:出题比做题难 10:31 唐杰的第一个研究生,与印奇相约创业 旷视创业:从体感游戏到 AI 技术平台 15:30 以 CV 技术做体感游戏,登上 App Store 免费榜前三 21:56 Face++ 开放平台,技术驱动 vs 产品驱动的两种创业 24:45 高中生范浩强成为旷视 6 号员工,“强进(周而进)组合” 夺得 ICCV 人脸识别全球冠军 30:19 AI to B 三个总结:价值可量化、不占客户太高成本、避免项目陷阱 十年前的智能机器人 34:31 调度系统才是提效核心,5 轮竞标拿下优衣库上海大仓 41:08 从差点搞砸到见到柳井正,拿下优衣库全球订单 从旷视机器人到原力灵机:参与预训练、不做人形机器人 49:21 从范浩强到张祥雨:旷视的一些 “老人” 为何不散? 53:37 再看「天才策略」:大牛口头禅是 “这不本质”,而影响客户体验的所有东西都本质 01:00:38 具身原生:参与 VLM 预训练,一开始就加入机器人数据 01:11:01 只有具身公司能做的事 01:23:34 不做人形机器人,用模块化组合避免 overkill 或 underkill 01:27:14 RoboChallenge 和 Dexbotic,为何创业公司要开源 Infra? 01:39:39 具身行业会先分散再集中,幸存的个位数公司多数会是中国公司 01:46:34 为了低谷的绸缪:备足干粮、专注投入相信的事 01:55:33 曾做过太多加法,发现 A+B+C≈max(A,B,C) 02:03:50 创业 15 年:感谢一波又一波浪潮,依旧兴奋 02:04:51 真正的通用智能机器人,“这值得投入 lifetime” 02:06:14 连点成线 相关链接: 157 期:具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手 155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
160: 群核IPO后与黄晓煌聊这15年:被嫌弃的GPU、冠军酷家乐、空间智能、六小龙
2026年4月17日1:40:26Episode 160「杭州六小龙开始上市了。」 4 月 17 日上午,群核科技登陆港股,成为 “杭州六小龙” 中第一家上市的企业。我们在第一时间专访了群核董事长黄晓煌。 2011 年黄晓煌从英伟达回国,和陈航、朱皓创立群核,当时科技创业还不是主流,英伟达自己也在低谷期。 过去这 15 年,黄晓煌说,他们经历过的 90% 的明星科技企业都消失了或变得默默无闻,而群核一直存在,业务还在增长,做出了中国市占率第一的在线设计软件酷家乐,历经与互联网巨头的竞争而幸存,现在又在 AI 热潮中投入空间智能。黄晓煌说: 活下来比活得亮眼重要。 如果想了解更加 “穷人版” 的 AI 创业故事,或者群核上市后的潜力如何,听听创始人怎么说吧。 本期播客也有视频版,可在小红书、抖音、B站、视频号,搜索《晚点聊》观看。 本期节目的图文版也已经发布:群核 IPO 后与黄晓煌聊这 15 年:被嫌弃的 GPU、冠军酷家乐、空间智能、六小龙 本期嘉宾 黄晓煌,群核科技联合创始人 & 董事长 本期主播 程曼祺,晚点科技报道负责人 时间线: 从 GPU 上云到家装设计软件酷家乐 01:14 2011 年回国创业,在英伟达工作过是 “减分” 的 06:54 酷家乐的诞生:13 年上线,14 年爆发,15 年赚钱 10:53 群核底层是 GPU,提前进入 “token 经济”,也跑不通广告模式 14:37 遭遇巨头竞争,更看清什么是壁垒:单纯的算法是纸老虎 从 “怀疑技术自嗨" 到投入 AI 29:48 2018 年注意到 AI 机会,但一度怀疑自嗨了 38:53 2021 年赴美上市戛然而止,山峰到谷底 40:33 2023 用 Copilot 写代码,意识到 SaaS 要变天→两条路的抉择:自己训练空间模型 vs 为大模型做配套 50:16 复盘错过:2018 年是一个做具身硬件的黄金时期 空间智能 52:10 空间智能是底层能力,不是新业务 54:27 群核的 bet:3D 路线,而非视频生成 01:00:00 欧美具身企业喜欢合成、仿真数据,国内普遍倾向真实数据 01:02:52 两百家具身智能公司不算多,各种设备都会需要智能 01:08:53 从纵到横:英伟达的启发 我创业经历的 90% 明星企业都消失了 01:12:46 先活下来,再选最大的机会 01:05:07 六小龙之后,反对的声音一下子变少了 01:21:25 现在对自己的定位:科研 leader 01:24:10 最痛苦的部分总是跟人相关 01:32:11 自由女神像下的对话,“我不是这么算的” 01:34:15 把公司带向空间智能,一半收入来自空间智能 本期剪辑:杨建宇 相关链接: 157 期:具身季报26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手 图文版:《具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手》 155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士 图文版:《至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活》 152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识 图文版:《独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识》 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡 图文版:《陈亦伦和李震宇创立的具身公司它石智航,不做 VLA、不仿真,不走主流路线》 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 | AI 大爆炸 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
159: 马斯克Terafab太空算力、英伟达重拾CPU,与Fusion Fund张璐聊AI算力新趋势
2026年4月7日1:05:04Episode 159「马斯克不仅要成为太空经济参与者,也想成为规则制定方。」 这期节目邀请了 Fusion Fund 的创始合伙人张璐,她是 SpaceX 的投资人,而马斯克刚刚在 3 月底发布了一个大计划——Terafab,要联合特斯拉、SpaceX 和 xAI,自建史上最大芯片厂,掌握从设计到制造到部署应用的全栈产能。 其中最科幻的部分,是马斯克希望把 Terafab 80% 的算力部署到太空,建太空数据中心。 Terafab 的目标年产耗电量是惊人的 1TW,是目前全球 AI 算力年耗电量(40~50 GW,1 GW 是 100 万度电,即 100 万 kW)的约 20 倍。 从马斯克的雄心壮志出发,本期聊了太空经济的创业机会和 AI 基础设施领域的变化与机会机会,尤其是英伟达在 GTC 上展现的最新规划。 本期节目的图文版也已经发布:马斯克 Terafab 太空算力、英伟达重拾 CPU,与 Fusion Fund 张璐聊 AI 算力新趋势 | 晚点播客 本期嘉宾 张璐,Fusion Fund 创始合伙人 本期主播 程曼祺,晚点科技报道负责人 时间线: Terafab:1 TW 的超级算力计划 02:29 Terafab 的多重驱动力: 需求、机器人原生、SpaceX 上市、更少监管 06:46 对地服务有延迟,但太空应用本身也需要算力 17:57 马斯克的带动效应: 太空算力相关创业机会 AI 算力层与 Infra 层新趋势 22:48 英伟达 GTC 发布: 统一平台,异构芯片 30:00 LPU 和 CPU 背后: 是推理(使用模型)和 Agent 需求提升 41:09 xAI 动荡: 招人诚、开人快,“马斯克是一个迷人的暴君” 45:13 Google TPU,足以挑战英伟达 GPU 吗? 企业级 AI 48:54 掌握预算的大企业 CIO/CTO 在想什么? 52:15 看好医疗行业、金融行业 AI 应用 55:14 大企业收购 AI 初创企业带来退出,又催生更多连续创业者 01:02:13 连点成线 剪辑:甜食 相关链接: 115 期:华为发布超节点,如何搅动 AI 算力市场?与魔形智能徐凌杰聊芯片层新变化 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
158: V4发布前的DeepSeek:人才竞争、组织特点和独特的AGI目标
2026年4月6日30:44Episode 158这期 30 分钟的单口,聊一聊 DeepSeek 这家公司和它近期的变化。 上周四,《晚点 LatePost》发布了关于 DeepSeek 的报道:《V4 发布前的 DeepSeek:人才竞争、组织特点和独特的 AGI 目标》,写了 DeepSeek 的近况,以及这家公司过去的历史和它的一些特质,还有梁文锋对 AGI 以及如何实现 AGI 目标的独特理解。 如果你已经看过这篇文章,其实播客并不会有太多新增信息,而是多了一些个人感受和观察,以及文章发布后的一些反馈与补充。 DeepSeek 真的是一朵 AI 界的奇葩,这里是“奇葩”的原意——“阆苑仙葩”,怎落凡家?在非常追求效率、追求投入的性价比,追求“用实力说话”的市场环境中,DeepSeek 的目标和风格都非常独特,它的存在本身就是小概率事件。 这包括,梁文锋和 DeepSeek 的目标:不是仅卷模型性能,也看重生态建设和探索一些“少数派”方向。也包括工作氛围:DeepSeek 是全球都少有的、不信奉超长时间工作的核心 AI Lab。 梁文锋认为,一个人每天能高质量输出和工作的时间很难超过 6~8 小时,疲劳状态下的昏庸判断反而会浪费宝贵的算力,得不偿失。 这造就了 DeepSeek 的独特和不平凡,某种程度上,也是它如今的一些内外部变化和张力的源头之一。 时间线跳转: 01:37 3 位研究员春节至今离开,为何受关注? 03:43 V4 相关信息(信息有限) 04:27 AI 人才竞争激烈,DeepSeek 要解决公司定价问题 07:54 张力的底层来源:DeepSeek 的目标不是最主流的目标 17:48 更多人为何留下,这是一个怎样的组织 本期主播:程曼祺,晚点 LatePost 科技报道负责人 剪辑:Nick 相关链接: 《V4 发布前的 DeepSeek:人才竞争、组织特点和独特的 AGI 目标》 154 期:从千问变动到「AI 英雄传」,与 DINQ 高岱恒聊传奇 AI 研究员们 153 期:阿里Qwen人事变动:误读、近况、伏笔和未来 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
157: 具身季报26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
2026年4月2日2:06:07Episode 157「不仅是比特,不仅是语言。」 这期节目是我们的第一期具身智能季报,邀请了我很喜欢的一位投资人,Alphaist Partners 创始合伙人陈哲 Peter。 Alphaist 也有自己的播客,就叫《The Alphaist》,这期节目之后也会在 The Alphaist 串台播出。 过去七年,Peter 在五源专注投资机器人和硬件科技,投资过海柔、松灵、本末、地瓜等公司。在去年创立 Alphaist 之后,他想放开手去寻找更多 Alpha Founders。我对这类创始人的理解是:哪怕不被认同,他们也极其笃定自己的判断,是可以定义规则或打破规则的人。 在跨学科、高复杂度、需要开拓精神的具身智能领域,就有不少这样的创始人,也需要更多这样的创始人。 这期节目,我们从本季度的进展着手,Peter 分享了三月中旬去 GTC 与全球从业者的交流,同时也带到了过去两年具身智能的发展。 在讨论人形机器人的部分,我们盘点了中美几家头部公司,如宇树、银河、特斯拉 Optimus、Figure 的近期进展,以及那些在智能能力或数据上给行业带来启发的公司,如 Pi、Sunday 和 Generalist。 图注:银河通用人形机器人打网球 demo。 接着重点讨论了当前具身智能的两个前沿研究方向:灵巧手和世界模型: 在灵巧手部分,我们重点聊了 Sharpa 的进展,和 Optimus 绳驱方案的争议; 在世界模型上,英伟达近期连续发布 DreamZero、DreamDojo 和 EgoScale 数据框架,提出 WAM 世界动作模型,被视为比 VLA 天花板更高的方向。 之后的季报里,我和 Peter 会邀请更多从业者一起分享。 图注:Sharpa 灵巧手 本期节目的图文版也已经发布:具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手 | 晚点播客 本期嘉宾 陈哲,Alphaist Partners 创始合伙人 本期主播: 程曼祺,晚点科技报道负责人 时间线: 04:48 Q1 TOP 5 进展 -宇树春晚表演,一致性 -Sharpa 灵巧手实机展示,长程任务组装风车 -英伟达发布 DreamZero、DreamDojo,WAM(世界动作模型)而非 VLA -银河通用机器人打网球 -波士顿动力新版电动 Atlas 人形机器人丨中国 10:37 宇树春晚门道:25 年下半年新技术的集中展现,一致性是大亮点 20:13 宇树做科研市场,从来不被投资市场「喜欢」,但专注才造就 G1 的成功 24:20 王兴兴和汪滔:不极致,不成活;目前的智能能力不影响宇树整体竞争力 28:22 银河通用人形机器人打网球,Karpathy 说“这肯定是 AI 生成的” 34:13 双足价值再思考,波士顿动力 Stretch 机器人的启示 人形机器人丨美国 39:45 新版 Atlas:模块化设计、左右腿可互换,人形也可超人 42:29 Optimus Gen3 再延期,已缩水的 1 万台年产目标仍激进 44:58 Optimus 灵巧手,绳驱vs直驱:绳驱真符合“第一性原理吗”? 48:57 “浮夸”的 Figure 和它“浮夸”的创始人 Brett,顺势而为 52:59 美国本土供应链复兴有长期挑战 57:58 Pi、Sunday、Generalist;Sharpa 提出的三层架构:System2(低频、规划)、System1(高频、动作执行)、System0(触觉) 灵巧手创业友好,世界模型的底层属于大厂 01:07:06 灵巧手市场可能存在宇树在人形市场的 G1 机会 01:14:30 世界模型和英伟达的 WAM(DreamZero、DreamDojo):不再以语言为底层 01:27:18 英伟达 EgoScale 数据框架 & 具身数据的金字塔 01:37:47 视频生成的底层更大厂友好,但世界模型也有创业公司:Rhoda AI 融了 4.5 亿美元 机器人端侧算力:越到新兴市场,英伟达统治力越弱 01:43:42 从云端→车载→机器人:英伟达 GPU 统治力逐步减弱,“创新者窘境” 01:46:26 国产芯片机会:地平线、地瓜在量产机器人市场领先 01:48:24 机器人终局可能高度集中 中国具身上市潮 & 下季度展望 01:53:59 宇树上市,是一家高质量公司的上市,不是泡沫 01:59:59 下季度展望:世界模型超越 VLA、灵巧手进展、马上举行的机器人马拉松比赛从“搞笑”走向竞技 02:04:20 连点成线:前几期具身访谈共性总结;触觉和语言之外 本期剪辑:甜食、Nick 相关链接: 《对话宇树科技王兴兴,造出 9.9 万元人形机器人的 90 后偏才》 155 期:贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士 图文版:《至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活》 152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识 图文版:《独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识》 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡 图文版:《陈亦伦和李震宇创立的具身公司它石智航,不做 VLA、不仿真,不走主流路线》 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 | AI 大爆炸 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
156: AI季报26Q1:OpenClaw、OpenAI vs Anthropic的三重对阵、自进化
2026年3月31日1:52:13Episode 156「Coding→Agent 大主线明细,从模型的竞争到系统的竞争。」 本期播客本周内也会在《晚点 AI》公众号发布「图文版」,发布后会更新到 Shownotes 和评论区。 从 26 年 Q1 开始,《晚点聊》推出季度总结系列,会分为 AI 季报和具身季报。 其中,AI 季报的嘉宾是身在硅谷的 MoE capital 创始合伙人 Henry Yin。他此前已经两次做客晚点聊,分享过 Agentic 工具链的创新机会,和 Gemini 3 后的新进展,分别是 137 期和 146 期。 本期节目我们从 OpenClaw 开始聊 Q1 的进展,进而延展到 Anthropic 的 Claude Code 和 Cowork 产品的强劲增长,Anthropic 应用形态与 OpenClaw 的相向而行,以及 OpenAI vs Anthropic,两家公司的 coding 产品 Codex vs ClaudeCode 和这背后的最新模型 Opus 4.6 vs ChatGPT-5.4 的三重对阵。所有这一切的快速进展,居然都发生在过去 3 个月。 在 Coding 到通用 Agent 和个人 Agent 这条主线之外,我们也讨论了 AutoResearch 等项目的 AI 自进化能力,和仍处于探索中的其它方向,如持续学习和世界模型。 Henry 也分享了,他在硅谷这个 AI 密度最高的地方,感受到的社会情绪变化:科技大裁员。而我则补充了我了解的中国公司的情况。 不管是 Agent 主战场的快速发展,还是自进化开发方式端倪初现,26 年前 3 个月的变化显示,AI 越来越不只和科技圈相关。 本期节目的图文版也已经发布:AI 季报 26Q1:OpenClaw、OpenAI 与 Anthropic 的三重对阵、自进化 | 晚点播客 本期嘉宾 Henry Yin,MoE Capital 创始合伙人 本期主播 程曼祺,晚点科技报道负责人 时间线: Openclaw:AI Agent 的 iPhone 时刻 04:30 Q1三件大事:Openclaw异常火爆、头部模型厂商竞争焦点转移、AI自我进化贴近现实 07:35 Openclaw 做对的三件事:本地运行、接入聊天APP、定时任务和长期记忆 10:42 两个使用案例:一周卸载 vs 深度试用 14:03 热度差异:中国国民级、美国不出圈,Why? 17:02 中国开源模型乘势增长:OpenClaw 之父 Peter 安利 MiniMax 22:41 三个不足:贵、不稳定、安全隐患:Meta 对齐负责人的龙虾“生死时速” OpenAI vs Anthropic 的三重竞争 30:10 大公司竞 “吃龙虾”:英伟达、Anthropic、OpenAI 各自动作 37:14 190 亿 vs 250 亿:Anthropic 收入猛追 OpenAI,Claude Code 也超过了 Cursor 43:53 CodeX 是会编程的 “弱智”,Claude Code 是驱策编程奴隶的主人 48:30 OpenAI 的反思:“我们分心了” 49:57 xAI 的人员动荡,Google 的产品发力 53:04 竞争焦点从模型转向平台:开发者生态、企业信任、成本 AutoResearch 自进化出现端倪 01:07:09 AutoResearch,明确目标的有限搜索空间里,AI 已展现 “自进化” 01:17:00 持续学习的两种方法:贫穷版外挂 & 更新权重的新探索 01:22:48 新方向上的创业机会:几个水下 (Stealth Mode) 公司案例 算力变化:推理↑ CPU↑ 01:27:00 GTC 要点回顾:推理重要性提升 01:29:05 Agent 应用带来 CPU 需求提升 科技大裁员 01:31:27 Meta 停工学 AI 一周,Token 消耗量成关键指标 01:35:20 从 “一流人才 + 二流人才” 到 “超一流人才 +AI” 01:42:39 给 Token 收税 ? 下季度展望 01:44:07 DeepSeek-V4、更新权重的持续学习从复杂到简单 01:49:21 连点成线:从 Devin 到龙虾的 1 年半,Agent 即将带来更多变化 剪辑:甜食 相关链接: 150 期:年末 AI 回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线 150 期图文版:《年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线》 146 期:Gemini 3 翻盘背后、Agent 需要什么大模型、RL 创业机会,与前 Google 创业者、硅谷投资人聊湾区动向 137 期:Agent 是机会,造 Agent 的工具也是|从 OpenAI 开发者日聊起|Agent#6 137 期图文版:OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
155: 贾鹏创立至简后的首次访谈:从英伟达到理想,具身智能的六边形战士
2026年3月22日2:47:50Episode 155「具身智能的竞争,本质是体系的竞争。」 今天的嘉宾是一位没有亮相过的具身智能创业者,理想前自动驾驶技术研发负责人贾鹏。 2016 年,他成为英伟达中国智驾团队的第一个员工。五年后的 2020 年,他加入刚开始自研智驾系统的理想,和团队一起实现了逆袭。 去年夏天,贾鹏创立具身智能公司至简动力,他拉来了之前的上司,理想前 CTO 王凯,以及和他并肩战斗过五年的理想智驾前量产负责人王佳佳一起创业。 它符合中国投资具身智能的一种典型审美——创始团队有丰富的研发和量产经验。在被认为与具身关系密切的自动驾驶战场,打过硬仗、打过胜仗。而且核心团队之间磨合已久,分工默契。 成立的最初半年里,至简就融资 20 亿元人民币,是现在最年轻的具身智能独角兽。 作为创业后的首次访谈,贾鹏在这期节目中完整回顾了从英伟达到理想的智驾探索,再到具身智能的创业思考。 他给公司取名至简,因为他相信,大道至简,越简单的东西,越容易规模化。 本期访谈的视频版已经发布,可在抖音、微信视频号和 B 站,搜索《晚点聊》收看。 本期节目的图文版也已经发布:至简贾鹏:最快具身独角兽半年融资 20 亿,做 “六边形战士” 才能活 本期嘉宾 贾鹏,至简动力创始人 & CEO 本期主播: 程曼祺,晚点科技报道负责人 时间线: 2016~2020 英伟达:“老黄脑门的温度比别人高一度” 00:01 英伟达智驾中国团队第一个员工 09:10 从服务 L4 自动驾驶到转向量产 13:57 从工程师到架构师、多面手 15:13 老黄凌晨 5 点起床看邮件、论文,脑门温度比太太高一度 18:07 英伟达的前瞻投入心法:能抗外压、愿景共享、主业强劲 2020~2025 理想智驾:后来者怎么先交卷 22:30 李想当时怎么想智驾:数据重要性,下半场看智能化,“车和家” 29:25 一起看《全营一杆枪》的日子 34:44 自研第一仗:双 J3 交付高速 NOA,一群 “新手” 的生死战 40:06 抗住压力的转身:有图切无图 48:03 智驾 “做成” 的 3 重指标 2025 的具身创业新起点:“挑战自我成长极限” 51:16 FSD v14 “让人又惊喜、又失望”,该做新的事了 59:41 “第一个大概率会死,但做成的会上第一批”,具身创业现在仍是第一批 01:07:51 模型、产品、组织都要简单;同时得是 “六边形” 战士 01:14:01 具身的终局是 “分散” 的垄断 01:19:46 具身研发分 3 层,“合成数据有用,但绝不是主力” 01:34:30 To A(研究)到 To B 阶段的转换会如何发生? 01:42:01 具身的本质是 Physical Agent:大公司做底座,创业公司做 Agent 01:48:13 不做流水线替代,寻找 “端到端” 任务 具身公司该如何组织 & 行业观察 01:57:23 智驾与具身:相似的、不同的 02:01:34 不设组织架构,以项目驱动团队 02:18:05 少被讨论的现象:硬件还远未成熟 02:19:29 更强具身智能到来时间仍有分歧 02:25:03 具身上市潮之后,会如何? 02:37:28 擅长从 0 到 1 逆风局,创业这半年 “挺爽的” 本期剪辑:宇亮、Nick 相关链接: 152 期:访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 148 期:访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
154: 从千问变动到「AI 英雄传」,与 DINQ 高岱恒聊传奇 AI 研究员们
2026年3月11日1:46:41Episode 154「美第奇和达芬奇,大公司和 AI 研究员。」 今天的节目分两次录制。嘉宾是高岱恒,Sam,他在 AI 技术圈和开源社区非常活跃,曾是双非土木老哥,后来以因为对 AI 开源项目的贡献进入阿里达摩院,现在自己创业,做了一个找到 AI 人才的 Agent 产品 DINQ。 而本期我们聊的主要话题,却是他的副业和 “消遣”:挖掘 AI 人物故事。Sam 对此非常着迷,在达摩院时,他就很喜欢搜集 AI 大牛的人生故事,那些非典型的、充满反差的经历尤其吸引他。 本期的第一部分,我们聊了上周刚发生的阿里千问的人事变化。Sam 分享了他作为开源模型受益者和前达摩院成员的观察。这整个过程的更具体情况,大家也可以看《晚点 LatePost》从上周到本周发布的 3 篇报道,以及我们的上一期播客。 本期第二部分,我们聊了 Sam 津津乐道的 AI 人物英雄传,在 Sam 眼里,这些不问出处、不拘一格的研究者就像文艺复兴时期的大师。他们有各自的性格、癖好、执念和技术浪漫,这对大型商业组织来说是陌生的、需要适应和理解的,我们也由此聊到了未来的研发型人才市场会如何变化。 本期嘉宾: 高岱恒 Sam DINQ 创始人 本期主播: 程曼祺 晚点 LatePost 科技报道负责人 时间线: 千问变动后续 02:42 千问候选人被搜索量翻了 3 倍 09:34 Model Scope 魔搭社区价值几何? 14:30 美第奇和达芬奇,大公司和 AI 研究员 AI 英雄传(第一次聊,春节前) 22:38 DINQ 的诞生,AI 研究员需要更好地展示、更好地匹配 28:30 他们就像文艺复兴时期的大师 42:26 从土木老哥到达摩院,“当你有了作品,没人在问你学校” 49:52 Adam 发明者、被拒的 GPT-1 一作、旅居越南的 RAG 发明者………创新来自边缘地带 01:10:23 他们的追求、畏惧、不屑和弱点 01:19:38 AI 下的人才市场:从人和公司的匹配,到人和具体任务的匹配 01:43:48 连点成线 相关链接: 134 期:Meta AI 人才动荡,上亿美元为何留不住人?| 与 Pokee AI 朱哲清盘点 AI 组织 本期剪辑:Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
153: 阿里Qwen人事变动:误读、近况、伏笔和未来
2026年3月4日18:46Episode 153这期不到 20 分钟的短播客,快速讲了 3 月 3 日(周二)到 4 日(周三)发生了什么,澄清一些广为传播但缺乏事实依据的说法,也回顾了 23 年以来 Qwen 的组织流转和这次人事巨震的伏笔。 Qwen 的变化仍在继续,《晚点 LatePost》会跟踪后续。 这期主要是一线研发人员视角得到的事实和信息,阿里公司和组层面会怎么想、怎么看,接下来怎么做,未来一段时间会更为明朗。 相关链接: 《晚点独家丨林俊旸提出离职,Qwen 多位负责人离开,团队或将调整》 本期主播:程曼祺 晚点 LatePost 科技报道负责人 本期剪辑:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
152: 访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识
2026年2月26日1:41:42Episode 152「26 年不是落地生死之年。」 本期嘉宾,是新近完成近 20 亿元融资,估值突破 100 亿元的具身智能公司 千寻智能的创始人和 CEO 韩峰涛。此前,千寻的联创 高阳也两次做客《晚点聊》,分别是 112 期和 149 期。 90 后的高阳,从伯克利回国加入清华叉院, 是典型的新锐 AI 技术力量,和他搭档的 80 后韩峰涛,则代表中国具身领域的另一条路:他是一位在 2016 年第一轮 AI 热潮时开始做智能机器人的创业老兵。他见证过被抢着要份额的热潮,正如现在的具身赛道;也一度背负个人连带债务,度过行业的冬天。 这期节目,我们回顾了过去 15 年,韩峰涛亲历的中国工业机器人、智能机器人再到具身智能的变化。也聊了近期具身领域,数笔大额融资背后的行业转折和 26 年的竞争主题。 我们提到了 1 次 VLA,0 次世界模型,但提到了好多次客户,这是韩峰涛的肌肉记忆。 但他也反复说:26 年不会是具身行业的落地生死之年,而是具身模型性能快速爆发的一年,这是一个经历过上一轮起伏的创业者,转变的决心。 本期嘉宾:韩峰涛 千寻智能创始人&CEO 本期主播:程曼祺 晚点 LatePost 科技报道负责人 时间线跳转: -2015-2024:工业协作机器人的 10 年创业: 02:03 浙大、中国核电、国机:找不到工作的模式识别研究生 09:10 国产替代 → 2016 年 AI 热潮 → 大模型:技术变革终于来了 14:37 在大厂下场前成为“中厂” -2024 第二次创业:千寻智能的成立 22:40 密集见了 100 多人,找到合伙人高阳,“靠谱的太少,骗子太多” 33:02 26 年的具身领域会像 23 年的大模型:模型性能淘汰赛 -解决数据瓶颈 35:55 主要靠真实数据,24 年 5 月开始开发 UMI、外骨骼等穿戴式数采设备 -落地应用探索 46:59 宁德时代在具身行业里广发需求 53:33 场景选择门道:当前智能能力、节拍、精度、负载、价值(用量)和容错率的综合考量 59:01 未来场景拓展:先工业、商业,再家庭;先 to B 再 to C 01:04:37 26 年不是具身落地生死之年,而是模型性能爆发的一年 -从 Robotics 到具身智能 01:15:57 第一次创业起伏:资金链 3 次紧张,背负个人连带债务 01:25:24 新一批年轻创业者有相似的“天真”,“真的见过客户”后会改变 01:28:12 从 Robotics 到 AI 思维的转变:数据,数据 01:33:57 建立一个信任、追求卓越的组织 连点成线 相关链接: 独家专访千寻创始人:20 亿新融资、具身模型淘汰赛、落地非共识 晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 149 期:具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望 本期剪辑:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
151: 访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的
2026年2月12日1:46:44Episode 151「软件应用也可以 “3D 打印” 了。」 当 Agent 构造变得越来越简单,会发生什么?Agent 交易平台 MuleRun 创始人陈宇森分享了他的观察和创业实践。 陈宇森是一名少年成名的连续创业者,22 岁从浙大毕业后创办网络安全公司长亭科技,5 年后卖给阿里云,现在他带着对 AI Agent 的理解重新出发。 MuleRun 基于这样一个核心假设,当 Vibe Coding 大幅降低了应用开发门槛,Claude Code 带来 Agent 创作新方法,大量非技术背景的人也能把自己的工作知识和流程封装成一个个勤恳的 AI 骡子,实现个人工作的自动化。 这期内容包含两次聊天,分别发生在 25 年 12 月和 26 年 1 月上旬,不到 1 个月里,随着 MuleRun AgentBuilder 开始内测,陈宇森和 MuleRun 的思路已发生了一些变化。 他认为,未来的 market place 不再会是过去我们熟悉的货架形态,而是在对话中触发交易。MuleRun 的调整本身,也是当前 AI 应用瞬息万变的一个缩影。 这期节目的后半段我们也聊了一个创业 10 年,成立过 4 家公司,经历过成败起伏的创业者,如何以「用心」避免陷入平庸和对抗自我怀疑。 本期节目的图文版也已经发布:访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的 本期嘉宾: 陈宇森,MuleRun 创始人 & CEO 本期主播: 程曼祺,晚点 LatePost 科技报道负责人 时间线跳转: -12 月底的访谈:寻找方向、Agent 交易平台的机会与难点 02:20 从 Vibe Coding 到 Agent 交易平台 09:20 Agent 的供给还不够丰富,但 Claude Code 带来拐点 16:41 MuleRun 做的两件事:好的 Runtime、清晰的 Skills、Prompt 的商业化 23:08 同样的技术变化,不同的做法:N8N、Dify、Coze、蚂蚁灵光、马卡龙、Youware 28:54 上线 3 个月:用户反馈、Agent 审核与上架、大量 SOP+少量大模型的开发方式 36:50 做好 Agent 的开发工具和交易平台的难点 40:29 如果 Agent 建造门槛大幅降低,通用 Agent 还存在吗? -1月中旬的访谈:Agent Builder 内测开启、交易平台不会再是货架式 42:21 再聊 Claude Code:Skills 详解,MuleRun 的 Skill 评价体系(Eval)和安全工作 47:32 “应用的 3D 打印机”,未来的软件是日抛式的,AI 是制造业 52:12 Agent Builder:从套壳模型→套壳“Claude Code” 01:01:22 Agent 构造变简单、数量变多:未来的 Market Place 不应该是货架式的 01:08:32 Agent Builder 的内测效果,Agent 开发工具和交易的界限? -12 月底的访谈:创立 4 家公司,成功退出过也低谷过,以「用心」对抗平庸 01:15:40 从长亭到同时创业做两家公司,一度觉得自己无所不能 01:25:24 走过下坡路,关过公司,痛苦带来的韧性 01:32:13 一定不要在选择题上出错,「用心」对抗平庸 01:40:16 26 AI 应用市场年会发生什么?跳出 Chatbot、跳过 1 亿甚至 10 亿美元 ARR 01:44:02 连点成线 往期相关节目: 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need|Agent#1 137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6 150 期:年末AI回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
150: 年末AI回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线
2026年2月9日1:58:22Episode 150这期是「晚点聊」的年终特别节目,在 AI 大事必定发生的春节之前,总结 2025 年和即将过去的蛇年,我们在 AI 领域的观察和见闻。 本期节目,我会以单口的形式来讲述,我将按几个大的主题来串起这一年在 AI 领域的观察,行业的一些大事件,以及「晚点聊」的相关节目,和整个《晚点 LatePost》对 AI 的更多报道。 你将你听到以下 7 个章节的内容:1.模型;2.应用;3.巨头的 AI 之战:字节、阿里、腾讯;4.创业公司们;5.具身智能;6.AI 硬件;7.AI 中的人。 在每个章节中,我会按照若干关键词来展开要点,并穿插指路《晚点聊》的相关往期节目或《晚点》的相关文章。我会把提到的文章,列在 shownotes 里。 历史正在加速发生,AI 洪流中,五色使人迷目。但人是意义的动物,我们总试图理解和抓住什么。 希望这期年底的大型“连点成线”,可以帮听友得到一份正在拓展中的 AI 地图。 时间线跳转: 1.模型 01:10 Agentic Model:R1 | Coding | 多模态 08:58 协同优化:Google | DeepSeek 开源周 | 注意力机制改进、芯片互联 15:22 下一个学习范式:从大脑获得灵感 2.应用 19:49 Agent:Coding 就是 General Agent | 垂类 Agent | Agent 工具链 32:02 Sora App:to C 的想象力 37:19 AI for Science:AI 科学家 3.巨头的 AI 之战 40:23 人才和组织之战 49:51 To C 应用大战 4.AI 创业公司们 01:01:28 大模型第一股 01:07:13 5000 万美元 ARR 01:11:36 全球化与中美之间 5.具身智能 01:14:29 投资和上市潮 01:22:09 数据、模型、本体的进展 01:28:05 5 个落地方向 6.AI 硬件 01:34:50 AI 眼镜能成为下一个入口吗? 01:44:30 深圳的公司们 7.AI 中的人 01:49:48 天价薪酬与失业 01:52:39 使用用 AI 的人 01:54:25 意义感:大模型无法替你活过 相关联链接: 《DeepSeek-V3/R1推理系统概览》 Top Lean AI-native Companies Leadboard:https://leanaileaderboard.com/ 本期中提及的《晚点聊》往期节目,可根据期数搜索;本期中提及的《晚点 LatePost》相关报道: 「应用」 《实测豆包手机助手:比价点外卖、自动回微信,AI 操作手机的时代来了?》 《“先抖音后剪映” 不再成立,OiiOii 闹闹聊 AI 时代的创作工具和内容社区丨100 个 AI 创业者》 《他给普通人配了个 “AI 剧组”丨100 个 AI 创业者》 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 《25 岁,他想做 AI 时代的微信丨100 个 AI 创业者》(Intent) 《对话与爱为舞张怀亭:大哥创业不走弯路》 「巨头 AI 之战」 《腾讯在 AI 拐点到来前的 700 天》 《字节 AI 再创业:独立组织、全链条的饱和出击》 《重新认识阿里:大踏步迈向 AI》 《字节、阿里、腾讯的 AI 人才竞赛:2330 个研究者背后的共识与分歧》 《字节、阿里、腾讯 AI 大战全记录:一场影响命运的战争》 「具身智能」 《特斯拉人形机器人再延期,因为双手只能用六星期》 视频:《具身智能的幻想与现实》 「AI 硬件」 《这个 30 克的挂件,是 AI 的眼睛丨100 个 AI 创业者》(Looki) 《“通用产品是空中楼阁”,潘宇扬聊 AI 硬件丨100 个 AI 创业者》(Odyss AI 项链) 《对话 VITURE 姜公略:把 AR 眼镜卖到美国第一 ,从负需求到离不开》 《对话拓竹陶冶:我们一群工程师,一起造一个朴素的硬核公司》 《影石 Insta360 刘靖康:当机会稀缺,年轻的后来者如何做到第一?丨新新访谈》 《我们要培养什么样的工程师?李泽湘教授对三十年工科教育改革的回顾》 本期剪辑:甜食、Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
149: 具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望
2026年1月25日1:21:52Episode 149「用大规模测评驱散 PR 式 demo 的迷雾。」 虚拟空间的大模型有大量 benchmark,测试非常直观;而在如火如荼的具身领域,怎么衡量模型能力,本身还是需要探索的课题。 这期,我们邀请了两位具身智能从业者,原力灵机联创范浩强和千寻智能联创与首席科学家高阳,一起聊具身模型的测评。 范浩强从高三就开始在旷视工作,有丰富的计算机视觉开发和落地经验;高阳回国前在伯克利 BAIR 攻读博士,和 PI 的联创 Sergey Levine 有诸多学术合作。 去年 10 月,原力灵机和 Hugging Face 联合发起了全球首个具身智能的大规模真机评测平台 RoboChallenge。在前不久释放的最新测评结果中,千寻的 Spirit v1.5 模型登顶榜单,表现超过 π*0.5。 RoboChallenge 测评平台网站:https://robochallenge.ai/home 图注:RoboChallenge 测评现场 在 RoboChallenge 的测评中,机器人不再只活在精挑细选的 Demo 视频里,而是要在多样化的“Table 30”任务中接受真实世界的“毒打”——任务包括碎纸、插花,扫二维码。 这期我们聊了具身模型测评的难点,RoboChallenge、RoboArena 等目前的大规模测评尝试是怎样的思路?行业里心照不宣的 demo 工程,以及 2026 年,我们可能从哪些路径逼近具身智能的 GPT-3 时刻。 范浩强和高阳说,组织和参与测评的过程,组织和参与测评的过程,本身增强了他们对具身的信心,,从 π*0 在 Table 30 任务上只有 20% 的成功率到 π*0.5 的翻倍和一些国产模型的超越,具身仍很早期,但进步速度也很惊人。 本期嘉宾: 范浩强 原力灵机联合创始人 高阳 千寻智能联合创始人、清华大学叉院助理教授 本期主播: 程曼祺 晚点 LatePost 科技报道负责人 时间线跳转: -发起 RoboChallenge,行业呼唤大规模测评 03:24 范浩强和高阳的从业经验 06:53 RoboChallenge 的发起,见证成功率从 π0 的 20% 到 π0.5 的超 40% 12:40 以往方法的问题:环境不一致、测评不持续、仿真有局限 21:47 对比 RoboArena 和 RoboChallenge:前者是分布式 Zero-shot 测评;后者是集中 few-shot 测评 28:33 上线 2 个多月的观察:超预期的 1 万条测试提交,国产模型超越 33:04 Table 30 任务集的设计,插花、扫二维码等任务的“刁钻”考点 40:24 提交者自己做 fine-tune(微调),开源权重证明诚信;接下来会更新灵巧手的测评 -2026 年具身展望 45:07 学习原理已经收敛,Scaling Data 是 2026 年的行业主题 48:53 4 种数据类型,各团队的不同数据 bet 57:20 落地应用,具身的“Coding”任务是什么?“破圈”时刻何时出现? 01:07:00 大众与从业者之间的认知落差,行业心照不宣的“demo”工程 01:12:50 具身测评可以被 Hack 吗?如何反制 hack? 01:14:52 26 年想验证的问题:具身中国追平美国的 DeepSeek 时刻是否到?基模能否上一个台阶? 01:17:47 连点成线:总结观察具身进展的 3 个维度 & 具身创业团队的不同来源 附录:本期中出现的一些人物、技术名词、项目、公司 -Sergey Levine:Sergey Levine,加州大学伯克利分校教授,机器人强化学习与通用学习系统的重要推动者。曾参与 Google / Google Brain 的机器人与强化学习研究,并共同创立具身智能公司 Physical Intelligence(PI)。 -π 系列模型:PI 提出的通用机器人模型系列,最新版本 π*0.6。 -CIFAR:一个经典计算机视觉数据集,相比之后出现的 ImageNet,它规模更小、分辨率更低,常用于快速实验和教学。 -Sunday Robotics:由 Tony Zhao 与 Cheng Chi 在 2024 年联合创立的家庭场景通用机器人公司。 -Generalist AI:2024 年成立的美国通用机器人 / 具身智能的创业公司。 本期剪辑:Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
148: 访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡
2026年1月16日1:25:02Episode 148「华为前自动驾驶首席科学家投身具身创业。」 本期嘉宾是它石智航创始人陈亦伦,他曾担任大疆创新机器视觉总工程师和华为自动驾驶部门首席科学家。 2021 年,智能辅助驾驶的爆发前夕,陈亦伦在华为带团队开始采集大量真实的驾驶数据,用深度学习替代过去自动驾驶的规则方法,3 万行代码做了过去 200 万行代码的事,这是业界第一批探索端到端智能驾驶的尝试。 陈亦伦说,那一刻,他觉得自己找到了自动驾驶的钥匙,而他还想用这把钥匙去探索一个年少时种下的更大梦想:通用智能机器人,也就是具身智能。 在回到母校清华,于 AIR(智能产业研究院)担任智能机器人方向首席专家 2 年后,2025 年初,陈亦伦和百度原资深副总裁、百度智能驾驶事业群负责人李震宇一起创立它石智航,在最初 2 轮融资中,筹集了超过 2.4 亿美元。创下中国具身智能领域的首轮融资记录。 这期节目,陈亦伦讲述了他从自动驾驶到具身智能的多年技术探索和研发实践,他看到的具身智能的 3 道曙光和 3 道关卡,以及怎么先越过其中的第一道:数据。 本期嘉宾:陈亦伦,它石智航创始人兼 CEO 本期主播:程曼祺,晚点 LatePost 科技报道负责人 时间线: -从华为、清华到创立它石,看到具身的三道曙光 02:35 用神经网络做自驾规控(PnC),3 万行替代 200 万行代码 11:13 三道曙光:强化学习提升运控(locomotion)能力;LLM 处理任务规划;端到端解决极端案例 17:13 端到端、VLA、世界模型,联系与区别 20:40 三道关卡:数据、算法、后训练 24:43 具身还在第一道关卡,数据;最后能经受大量数据的算法结构会很简单;GPT 最伟大的是定义了训练任务是预测下一个 token,而非架构本身 30:16 定义具身模型的训练任务:建立空间概念、跟世界交互 -数据解法:真实数据而非仿真和视频数据,手套采集而非遥操 40:54 具身需要真实数据,不看好仿真和视频数据 49:42 真实数据只有两个源头,世界与人;真实意味着场景真实、动作真实;为可穿戴设备是唯一解 55:08 手套+第一视角摄像头采集数据的具体实现 59:11 具身充满了硬件场景、本体、数据算法间的交替组合和协同优化,中国有供应链和场景优势 01:05:08 没有选择 VLA,具身会有自己的模型,而不是简单在 LLM 上发展 具身已经到了 Scaling 的临界点 01:13:23 看数据增长趋势,具身已经到了 Scaling 的临界点 01:18:04 它石的落地场景之一是处理柔性材料的线束装配 01:21:15 能自己定义目标的具身公司就是靠谱的;成为别人,不是好的选择 01:22:38 连点成线:往期分享 往期具身智能访谈: 晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 96 期:和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望 晚点聊 86 期:We, Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 晚点聊 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展 剪辑制作:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
147: 访谈OiiOii闹闹:“先抖音后剪映” 不再成立,AI 时代的创作工具和内容社区
2026年1月6日1:41:27Episode 147「Agent 的工具可以以终为始。」 今天这期节目,是晚点的作者祝颖丽对 OiiOii 创始人闹闹的访谈。本次访谈的文字版今天也会发布在《晚点科技》公众号上。 OiiOii 是一款动画创作 Agent。刚刚在 25 年 11 月开启内测。闹闹自己是一名动画爱好者,2014年,在微信工作 3 年后,她辞职学了半年动画。但当时她发现,做动画太难了,行业环境也很糟。 时隔10年,在自己创过业,去字节做过剪映,在大模型公司阶跃星辰做过二次元社区产品“狸谱”之后,她找到了用 AI 延续动画梦想的方法。 这期,闹闹分享了她和团队是如何构思和做出 OiiOii 的,以及她过去的创业和大厂经历。 图:OiiOii 官网页面。地址:https://www.oiioii.ai/home) 本期嘉宾:闹闹,OiiOii 创始人 本期主播:祝颖丽,《晚点 LatePost》 作者 时间线跳转: 05:06 先做好工具,再去做内容的社区:因为大家不再能忍受内容的单调了 11:40 市场现状:现在动画的产能和消费非常不对等 16:46 OiiOii为什么是这个形态? 31:04 如果做AI漫剧,商业模式、审美都不一样 41:30 怎么利用和理解不同的模型 51:50 现在的团队分工 53:50 第一次创业做极限运动社区,发现其实喜欢做内容 01:06:17 第一次创业留下的最宝贵的东西:抗体 01:18:15 在字节:对剪映和抖音特效最大贡献是… 01:27:17 去了B站:看到产能被憋着了 01:28:45 OiiOii 后面大致的节奏:填充垂类内容,去海外,做内容社区 往期「AI 应用/AI Agent」创始人访谈: 晚点聊 136:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类 晚点聊 125:用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型 晚点聊 111:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》 剪辑制作:Nick ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
146: Gemini 3翻盘背后、Agent需要什么大模型、RL创业机会,与前 Google 创业者、硅谷投资人聊湾区动向
2025年12月26日1:40:58Episode 146「一线开发者看到的前排变化。」 本期是 137 期 Agentic 工具链节目的嘉宾返场,Henry 和 Naomi,他们近期刚刚和普林斯顿 AI 加速创新中心联席主任,王梦迪教授,一起成立了一家新的早期 VC,MoE capital。 这次一起的也有两位之前在 Google DeepMind 和 谷歌云 Vertex AI 平台工作 7 年,刚刚创业,成立 Agent 工具层公司 Precur 的戴涵俊和 Bethany。 我请他们分享了,岁末年初,在硅谷观察到的 AI 水温,OpenAI、Google 等一系列新模型进展背后的故事,和围绕当今 Agent 与 RL 生态的创业机会。 这是我们本年关于 Agent 的第 8 期节目。 本期嘉宾: Bethany Wang,Precur 联创 戴涵俊,Precur 联创 Henry Yin,MoE Capital 创始合伙人 Naomi Xia,MoE Capital 创始合伙人 本期主播: 程曼祺,晚点 LatePost 科技报道负责人 时间线: -基础模型竞争和幕后故事:Google 在旧金山开 Gemini 3 Party 的同一天,OpenAI 发布 GPT-5.2 06:11 AI 进入实用工作:OpenAI 的 GDPval,Databricks 也发布了 Office QA 14:25 GDPval 在主流知识工作上表现优秀,但基础模型处理长尾问题的 gap 始终存在 19:09 Gemini 3 后,OpenAI、Anthropic、Google、各自的进展 22:15 NotebookLM 和 Nano Banana 策源地——Google Labs,不仅招工程师,也有主编、作家、创作者 24:54 DeemMind 研究员 Orio:Gemini 3 的秘密?预训练还有很多空间;TPU 对 Google 训练的加持 26:34 Google 的 3 层协同优化:从 TPU 到 Infra 到模型;模型和应用;数据和硬件 surface(终端) 30:18 Google TPU 已经更多对外,这对英伟达 GPU 优势的影响 38:02 回顾组织变化:DeepMind 和 Google Brain 的合并与磨合 -大厂竞争中,新公司的成长:围绕 RL 与 Agent 的创业机会 43:31 垂类的机会:弥补基础模型到具体问题的差距;水平的机会:调度层、数据层、工具层都有新公司涌现 50:17 技术新趋势——自我演化:RL、用 RAG 加长记忆有人尝试,但远不是成熟方案 53:32「可训练的工具层」背后的技术变化:code 驱动工具,如 Anthropic 的 PTC(Programmatic Tool Calling) 59:44 RL 创业方向:RL 环境,RL as a Service,RL 应用 01:08:47 Agent 开发者挑选模型的前置条件:用什么云(比如 Azure 客户用不了 Gemini),再看云厂商折扣 01:12:20 Anthropic 的 Claude Code 已成为 Agent 核心,刚发布的 Promatic to Call 探索新开发范式 01:17:13 开源模型使用体验:Qwen 很棒;驶往 NeurIPS 的飞机上,1/3 人在看 DeepSeek-V3.2 技术报告 01:22:04 选择模型时,关注什么 benchmark & 为什么? 01:29:34 模型优化方向预测:加入大量 agent trace 的开源模型,更强的多模态,长程任务优化 01:38:58 连点成线:往期节目推荐 《晚点聊》今年关于 Agent 的更多节目: 晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 晚点聊 110 期:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》 晚点聊 111 期:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 晚点聊 130 期:手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机 晚点聊 136 期:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent| 晚点聊 137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起 晚点聊 138 期:从你用手机到它更懂你,OPPO的手机AI实践 |与小布负责人万玉龙聊端侧AI 附录: 本期中提到的一些 benchmark: -GDPVal:OpenAI 今年 10 月发布的、用于评估大模型在复杂推理与决策场景中“价值对齐与结果质量”的验证型 benchmark,强调输出是否符合人类偏好而不只是“做对题”。 -ARC-AGI-2:ARC Prize 今年 3 月发布的、用于测试模型在少样本条件下的抽象、组合推理能力,被视为接近“通用智能门槛”的挑战集。 -OfficeQA:Databricks 今年 12 月发布的、围绕办公场景(文档、表格、邮件、日程等)的 benchmark,用来评估模型在真实工作流中的信息检索、理解与执行能力。 本期中提到的一些产品/服务、公司 -PTC(Programmatic Tool Calling):Anthropic 今年 11 月底发布的一种新的工具调用方法 https://www.anthropic.com/engineering/advanced-tool-use -Tinker:Thinking Machines Lab 今年 10 月发布的首个对外产品 https://thinkingmachines.ai/blog/announcing-tinker/ -Preference Model:一家旧金山初创企业,做强化学习环境 剪辑制作:甜食、Nick 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
145: 对话极壳孙宽:首个「消费级外骨骼」的诞生
2025年12月17日2:08:29Episode 145「创业治好了我的死亡焦虑。」 极壳是第一家把外骨骼做成消费级产品的公司。21 年成立以来,他们经历过账上只有20万元人民币的危急时刻,也刚在今年融到了 7000 万美元,出货量达到数万台。 图注:极壳已发布 4 款消费级外骨骼产品。 这只是个开始,远远不意味着成功。孙宽多次告诉我们,消费级外骨骼还在非常早期的阶段;他享受定义一个新品类的乐趣,也深知跨越鸿沟,走出小众市场的挑战。 这是一家起步时没有风口的公司;这是一个父母开手机卖场,从小做各种发明,但没有名校光环的创始人。 孙宽分享了他早年的“折腾”经历,他创立极壳、开发出第一款产品的故事,以及他对未来的更多想象。 图注:孙宽是一个户外爱好者;极壳的主要目标用户是户外人群,外骨骼可以帮助他们增强运动能力。 本期嘉宾:孙宽,极壳创始人 & CEO 本期主播: 程曼祺,《晚点 LatePost》科技报道负责人 李梓楠,《晚点 LatePost》科技报道作者 时间线跳转: -水滴字幕、光固化 3D 打印机、3 年轮岗、内部创业 03:05《攻壳机动队》、90 后的科学幻想、技术是魔法 13:25 第一份工作:从轮岗 3 年到模块化 PC 的内部创业 18:27 一次误诊后回到初心:做一件做着做着挂了的事也不会后悔 -从 1 人公司,到第一款消费级外骨骼 26:51 1 人公司手搓原型,一度账上只有 20 万元人民币 40:06 做“真有用”的消费级外骨骼:拉高核心正面效果,尽量降低负面影像 49:41 推倒第一代方案,用户体验比新架构重要 01:04:27 正式交付 Hpershell X,有人日行 7 万步,有人重返户外 -效率的迭代:从 40 个月到 5 个月 01:09:11 从成立到第一款产品,40 个月;第二代产品,5 个月 01:05:08 从 1 人公司,到 4 位联创和 200+团队 01:25:47 对拓竹组织的观察:好的人,希望身边都是好的人 -跨越鸿沟 01:32:52 品类跨越鸿沟:营造向往、价格、自研、形态拓展 01:49:47 组织跑得更快 -创业之后更踏实了,“活对了的感觉” 01:56:22 创业治好了我的“死亡恐惧”。 01:59:53 广义的外骨骼,最终是让我们的身体可编程。 02:05:40 连点成线:后记 & 往期节目推荐 往期「消费科技」创始人访谈: 晚点聊 120 期:科创板后再访Insta360刘靖康:这何尝不是一种极限运动! 晚点聊 141 期:大疆激光雷达前负责人做了台“电动轮椅”?与 Strutt 洪小平聊创业两年半:不做人形也能通向具身 往期「AI 硬件」创始人访谈: 晚点聊 107 期:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业 晚点聊 118 期:天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人 晚点聊 122 期:10分钟朱啸虎投资,泡泡玛特、米哈游都在试;Fuzozo孙兆治聊AI潮玩 剪辑制作:甜食 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
144: 从「大而强」到「小而强」,密度法则、RL 的 Scaling Law 和智能的分布式未来
2025年12月11日1:41:54Episode 144本期嘉宾,是清华大学的刘知远和肖朝军,他们刚在 11 月的《自然》杂志《机器学习》子刊上发表了封面文章:Densing Law of LLMS,大模型的密度法则。所谓“密度”,就是用更少的算力和数据获得相当乃至更多的智能。 刘知远是清华计算机系副教授和面壁智能首席科学家,肖朝军现在在清华做博士后,也是面壁 MiniCPM 系列的文本模型负责人。 图注:此图描述了 2023 年 4 月之后,主要开源模型的能力密度的变化。能力密度是衡量单位参数/算力下,模型能力的指标。目前版本的密度法则总结了预训练大语言模型的密度变化,o1、R1 等后训练强化学习对能力密度的提升尚未体现在指标里。 我们讨论了密度法则研究的源起,也展开聊了业界提升模型能力密度的具体做法:如何从架构、数据治理、算法和软硬协同优化 4 个环节着手提升模型能力密度。 而再往后,更大的密度提升,可能需要一些全新方法,因为强化学习的 Scaling Law 还未清晰展现,未来可能有两种技术路线:一是继续扩大强化学习的规模,观察其中是否涌现更多泛化能力;二是寻找新的学习方式。 在刘知远的设想中,未来,更高密度的模型,会支持每个人在端侧的专属模型,智能会分布式存在:也许手机都不是最终的入口,而是一个可以随身携带的个人计算设备:“就像一个可以随身携带的 NAS”。 图注:达到 GPT-4V 水平的模型参数规模随时间增长迅速缩减,而端侧算力快速增强,当芯片电路密度(摩尔定律)和模型能力密度(密度法则)两条曲线交汇,端侧设备将能运行以往只能在云端运行的大模型。 性能一直是人们更关注的模型演进的脉络,而这期我们会讨论,在另一条主线“效率”上,我们可以做出什么努力。 本期嘉宾: 刘知远,清华大学计算机系副教授、面壁智能首席科学家 肖朝军,清华大学计算机系博士后、面壁智能 MiniCPM 系列文本模型负责人 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -大模型时代的“摩尔定律” 02:09 Gemini 3 和 Nano Banana Pro 的启发:统一的“自回归式视觉+语言生成”即将突破 04:31 大模型演进的两条主线:能力和效率 10:23 和摩尔定律一样,“密度法则”是行业现实,也是“自我实现” 18:43 每 3.5 个月,大模型的能力密度翻一番 21:01 2023 年下半年的抉择:花几千万再训一个更大的模型,然后呢? -提升密度的四个环节 27:08 架构、数据、算法、软硬协同优化 30:41 (1) 架构:MoE (混合专家系统) + 注意力机制改进 34:28 (2) 数据治理:Ultra-FinWeb 用 1/10 数据量达到更好效果 40:24 (3) 算法:RL 还没有 Scaling Law,接下来可能有两条路 49:21 (4) 软硬协同优化 52:02 InfLLM-V2 的核心更新:把稀疏注意力做到预训练阶段 55:18 注意力改进趋势:长文本不仅是长输入,更多关注“长输出” -大模型上车、上手机 58:53 5 年内,手机可跑 GPT-4~5 级别的模型 01:06:23 大模型在汽车上已开始量产落地 01:10:34 “别人得到的,不一定是你失去的”,AGI 既会发生在云端,也会发生在终端 01:15:07 未来入口也许不是手机,而是属于每个人的移动计算终端 -AGI 下一步:自主学习 + 分布式的智能 01:17:40 自主学习→AI 协作网络→真正的创新 01:21:04 2023 年初,有巨头说世界上只会拥有几个大模型,就像 1943 年,IBM 董事长曾说全球不需要超过 5 台主机 01:24:46 AI 助手帮成为更好的工作者 01:28:53 不担心生产过剩,未知领域还太多 01:31:39 机器制造机器,AI 制造 AI 01:40:01 ☆连点成线 相关链接: 晚点聊 143 期:《再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进》 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 剪辑制作:Nick 附录,本期提到的一些论文(更多具体名词解释,见本期文字版): Densing law of LLMss(《大模型的密度法则》) Efficient GPT-4V level multimodal large language model for deployment on edge devices(本期中提到的,具身行业喜欢引用的图的原始论文。) InfLLM-V2: Dense-Sparse Switchable Attention for Seamless Short-to-Long Adaptation(InfLLM 稀疏注意力改进的第二版。) 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
143: 再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进
2025年11月30日1:27:20Episode 143「不仅是提效,线性注意力在数据受限情况下的更多潜力。」 今年初的两期节目(103、104 期)里也讨论过注意力机制,这是大语言模型的核心机制。 9 月 和 10 月,阿里和 Kimi 都发布了相关进展,而且都用到了一个线性注意力成果,DeltaNet。 本期嘉宾,就是 DeltaNet 的核心贡献者之一,现在在 MIT 读博士的杨松琳,她也是线性注意力开源小组 FLA 的发起者。 这期节目在 25 分钟以前很硬核,松琳讲了线性注意力和 DeltaNet 的发展脉络,为何 21 年刚被提出时没引起太多注意,后来怎么进化的。 25 分钟以后,是关注 AI 比较多的文科生,比如我也能完全跟上的部分。我们讨论了,重新去做 full attention 的 MiniMax,以及未来要在旗舰模型上用线性注意力的 Kimi 和阿里的不同选择;线性注意力的优劣势;以及一些脑洞——如果算力无限,还需要线性注意力?松琳给了很有启发的回答。 最后半小时,松琳分享了她作为研究员,怎么习得交叉技能的,怎么开始发起FLA小组等成长经历。 本期嘉宾:杨松琳,MIT 博士生在读,DeltaNet 贡献者 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -DeltaNet 的诞生演进与近期动向 02:07 注意力机制是什么? 04:21 DeltaNet 的提出,用 Delta Rule 来增强 in-context retrieval 09:41 近年的改进主要是模型架构,而非“更新规则” 14:25 阿里 Qwen 团队 apple to apple 比较几种线性注意力混合方式;Kimi Linear 对 Gated Delta 的具体改进 17:00 更新规则和模型架构改进的区别:更新规则是在算子层面“动刀” 19:50 算法出身,自学 Infra;学习 Hazy Research Group 的风格 23:28 Qwen 和 Kimi 大概率在下一代旗舰模型用线性注意力,而 MiniMax 用回 full attention;DeepSeek 目前释放的改进都是“稀疏注意力” 37:07 稀疏注意力 vs 线性注意力潜力对比 39:40 即使算力无限,线性注意力仍有价值,因为它在有限数据中的学习效率更高,而高质量数据正是当前瓶颈 42:28 线性注意力在状态追踪上也可能有效果优势,而状态追踪对 Agentic 很重要 47:33 线性注意力的“归纳偏见”和 The Bitter Lesson:先验与 scalable 并不矛盾 49:30 回应 RWKV(原始智能)彭博:从未说发明 DeltaNet,一直在给 Schmidhuber 署名 -Householder 与 DeltaNet 的联想,像运营产品一样运营技术社区 51:51 关注注意力改进的起点,数学知识、Infra,交叉能力怎么积累? 58:48 发现 Hoseholder 累乘和 DeltaNet 关联的过程 01:02:44 AI 何时能像人这样产生联想?——Prompt 合适,大模型应该能独立发现这个算法 01:04:11 FLA 小组的产生,受 Tri Dao 做 FlashAttention 的启发,像运营产品一样运营技术社区;Kimi 从 FLA 小组招募了线性注意力研究者 -注意力改进的未来趋势 01:11:24 稀疏注意力的改进,DeepSeek 年初 NSA 到最近 DSA 的变化 01:16:44 线性注意力的改进,从线性混合全注意力,到线性混合稀疏注意力(比如混合 DeepSeek DSA 和 Kimi KDA 😀 01:21:10 更广泛来说,关注何种模型演进?——持续学习 相关链接: 图文版:《再谈注意力:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进丨晚点播客》 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 晚点聊 104 期:《我给线性注意力找“金主”,字节 say No,MiniMax say Yes》 剪辑制作:Nick 附录,本期提到的一些论文(更多具体名词解释,见本期文字版): Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention Linear Transformers Are Secretly Fast Weight Programmers Parallelizing Linear Transformers with the Delta Rule over Sequence Length Gated Linear Attention Transformers with Hardware-Efficient Training Recurrence-Complete Frame-based Action Models 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
142: 一款能主动教学的 AI 产品是如何出现的|对话斑马 CPO 修佳明
2025年11月24日1:15:00Episode 142教育或许是最难被技术改造的领域,因为它太强调互动、个性化的体验与启发性的反馈,这个过程既难标准化,又无法快速复制。 直到大模型的出现,让人第一次看到了教育被技术大规模改造的可能性。市场上旋即涌现出来的各种五花八门的 AI 教育产品,它们从各种层面试图运用大模型的能力,但也反映出在原理技术到面向市场的商业产品之间,大模型在教育场景的落地还存在着一条难以被清晰描摹的鸿沟。 今天的播客,我们与斑马首席产品官修佳明探讨了这条鸿沟本身,以及斑马逾越它的方式。 基于大模型特点,原生构建的 AI 教育产品应该是什么样的?如何摆脱工具属性,让大模型 Agent 成为一个可以主导教学过程的教育产品?如何设计教学梯度、节奏和目标,既能发挥大模型的主动性,又不让一切偏离教学目的本身?如何让大模型更好理解人类在教学领域积累的各种经验,让它更好实践已被证明有效的各种教学法和教育心理学方法? 对这些问题的回应将决定一款 AI 教学产品的本质,进而决定它的商业化前景。修佳明给出了斑马的回答。 本期节目由 斑马口语 特别支持播出。 本期嘉宾:修佳明,斑马首席产品官 本期主播:申远,晚点 latepost 记者 时间线跳转: -Part1:斑马心中的全栈式 AI 教育产品 04:36 确定性的方向 08:01 与模型“搏斗” 13:58 为什么开发 delay 了? -Part2:主动性 VS 被动型,斑马产品的核心差异 20:56 从维持能力到突破能力 24:08 让大模型学会人的教学经验与教学法 29:36 更难的是对(教学)难度的控制 34:16 这种模式适合所有人吗? 35:54 让 AI 提供一种教学情绪价值 41:38 对 AI 外教人格的理解 -Part3:将 AI 产品推向市场 47:37 试用用户的反馈与规则设定 52:06 如何衡量 AI 的教学能力? 56:28 未来的 AI 教学产品会如何发展 59:22 如何运用数据和经验:斑马的 AI 壁垒在哪里 01:04:05 AI 产品还是教育产品?斑马的付费和定价策略 相关链接: 《主导型教育 Agent 产品,是口语学习的终极答案吗?》 本期主播:申远,晚点 latepost 记者 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
141: 大疆激光雷达前负责人做了台“电动轮椅”?与 Strutt 洪小平聊创业两年半:不做人形也能通向具身
2025年11月23日1:30:22Episode 141「大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开。」 “大疆系”正成为创投圈的一股小风潮。2023 年夏天,洪小平创立 Strutt(若创科技),他曾任大疆光电部及激光雷达产品线览沃负责人。 Strutt 的首款产品 ev¹ 即将在明年初正式发售 ,它看起来是一台电动轮椅,而洪小平告诉我,ev¹ 不是一台智能轮椅,“而是一种新的移动出行设备”。这听起来有些抽象,直到我在旧金山遇到了 ev¹ 的用户:双臂残缺,只有两根手指的 Usman;脊椎脆弱的 16岁少女 Ali,和患有多发性硬化症的 Joe。 旧金山试用会现场,Scott、Micah 两位 YouTube 博主和 Usman 坐着 ev¹ 比赛,看谁先到达车道末端。(这张照片里就有两台 Insta360 X 系列全景相机,现场也有好几台大疆 Pocket 3。) 我更多感受到的他们与我们的相同。他们不仅想要基础保障,也想要更好的生命体验。科技爱好者 Usman 戴着 Apple Watch 和 Ray-ban Meta,他曾用 Vision Pro 操控 ev¹;Ali 给轮椅编织了花朵;Joe 那天分享了很多他年轻时旅行和玩帆船的旧照片。他们渴望的不是另一台轮椅,而是减少出行顾虑,能去更多地方的自由。 我自己也两次试用了 ev¹,Copilot+ 模式的驾驶体验对我来说也很有趣。洪小平设想,在大型公园、机场等区域,更多人可能都需要 ev¹ 这样的设备。 本期,这位曾经在伯克利研究纳米材料的物理学博士,分享了他在大疆,如何从研究者转型为业务负责人;以及创业两年半以来,组建团队,开发产品、做减法的历程。 本期访谈的图文版:《大疆览沃前负责人洪小平创业:我做的不是一台电动轮椅》 本期嘉宾:洪小平,Strutt 创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -投资人总问:为什么你们不做人形机器人? 02:07 伯克利物理学博士→组建大疆光电部:奔着量产做激光雷达 08:26 大疆→南方科技大学:新工科教育 & 思考创业,锁定「机器人」方向 14:03 直接做人形机器人和具身“终极形态”,是“有方法、没路径” 18:04 OpenAI 加大投入 LLM 时,已有早期信,具身没到这个状态;识别早期信号的核心是数据积累 22:43 看到“老龄化”去收,就是它了! 25:13 个人移动设备能获得宝贵的家庭、生活场景数据 -ev¹ 的诞生,它不是电动轮椅 29:28 ev¹ 是泛个人出行设备,它的完整体验 35:07 出行的自由和喜悦,不分健康或残疾、衰老或年轻 41:13 大家更关注 PMF 的 M(需求),但有时 P(产品)做得足够好,M 就能自动打开 43:26 ev¹ 的开发,从做加法到做减法 47:51 观察用户说不出来的需求; 51:19 ev¹ 也是一个 Robot Helper 和机器人平台:可加传感器、执行器、计算单元等配件 56:50 在双滚机上做 200 万圈测试 58:33 “产品真正帮到人”的感觉,很触动 01:00:54 Go to Market 策略:定价、渠道、规模 -什么是一个好团队?大疆怎么又极致,又“舒适”? 01:03:55 创业,从“定义一个好团队”开始 01:07:25 大疆的“舒适”:技术说话、以结果论英雄、可以专注自己的事 01:12:35 应对未来可能的竞争:品牌、专利布局、团队综合性,本质是团队效率 01:19:33 消费科技公司,在高效 vs 速度上的分布:追觅、Insta360、大疆 01:22:39 为什么大疆到 2019 年才定成文价值观? 01:24:43 Next Question:跨越鸿沟——ev¹ 这样的产品怎么进入大众市场? 01:28:06 连点成线:往期推荐 附(播客中提到的部分术语、人物的表达可见图文版,如 VLA、PaLM-E、RT-2、吴景深等,以下摘录文字版中没提及的部分): 王铭钰:汝原科技创始人,大疆前研发副总裁,主导多款旗舰无人机的工程体系建设。(节目中提到的邀请洪小平加入大疆的港科本科同学) 魏基栋:松灵机器人创始人兼 CEO,大疆 Robomaster 业务的一号员工和联创,2016 年创业;库犸智能割草机即由松灵推出。 拓竹:一家 3D 打印机公司,旗下也有 WorldMaker 3D 模型共享平台;由陶冶创立,他曾任大疆动力系统部门经理、Mavic pro 产品经理、大疆消费级无人机事业部负责人。 Invacare:美国医疗辅助设备公司,以轮椅、助行器等康复产品为主营(节目中提及的已退市的行业公司)。 肖文龙:Strutt 联创,大疆早期动力系统技术负责人。 大疆 Inspire 产品线:定位于“专业级航拍/影视器材”的无人机序列,是航拍行业的主力设备与标杆产品。 张富:香港大学 工程学院机械工程系副教授,研究方向为激光雷达-惯性/视觉融合 SLAM 算法。 激光雷达 SLAM 算法:基于激光雷达点云定位与建图的算法,让机器人在未知环境中自行导航。 相关链接: 晚点聊 120 期:《科创板后再访Insta360刘靖康:这何尝不是一种极限运动!》 晚点聊 118 期:《天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人》 晚点聊 87 期:《家里又多了个“怪东西”!与云鲸聊新消费电子品的诞生》 剪辑制作:甜食 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
140: AI for Science,从开始到现在 | 对话深势科技张林峰、孙伟杰
2025年11月10日2:06:32Episode 140「从物理的黄金时代到 AI 的黄金时代。」 大模型热潮正在深入一个硬核领域:AI for Science,用 AI 加速科学发现。由斯坦福大学前校长参与创立的 AI for Science 公司 Xaira Therapeutics,去年一启动就募资超 10 亿美元;OpenAI 也在今年成立“OpenAI for Science”部门,刚在上个月雇了一位黑洞理论物理学家。 早在 6 年多前,中国的 AI for Science 创业实践已经开始。最适合讲述这个故事的是张林峰和孙伟杰。 2018 年,25 岁的他们创立深势科技。 2022 年 3 月,张林峰写文:《AI for Science 2022:未来已来,即将开始流行》https://mp.weixin.qq.com/s/xhGVSY5jBqVMiXrdSKgdcQ 。8个月后,ChatGPT 才发布。 深势的起点,是用 AI 加速求解量子物理中的“第一性原理计算”,即求解“薛定谔方程”等一系列基础量子物理方程。这是量子论和 AI,跨越百年的两个黄金时代的相遇。 1993 年出生的张林峰来自山西汾阳,因参加物理竞赛保送北大。在定位于跨学科教育的元培学院,他同时修了物理、数学、计算机。与张林峰同龄的孙伟杰来自佳木斯,主修政经哲。两个北方高个儿男孩是院篮球队、羽毛球队队友,也在元培学生会体育部搭档。 大二时,元培体育部举办趣味羽毛球赛后,孙伟杰(左)和张林峰(右)从邱德拔体育馆骑车回宿舍。 6 年多来,深势科技推出了 Hermite 药物计算设计平台、Piloteye 能源电池研发平台;以及一系列预训练科学模型,如分子大模型 Uni-Mol、实验表征大模型 Uni-AIMS 、蛋白质大模型 Uni-Fold、基因大模型 Uni-RNA 等;科学文献大模型 Uni-SMART;和综合这些积累的科研平台与科研 Agent,“玻尔科研空间站” 和 SciMaster;服务了宁德时代、比亚迪、多氟多、长安汽车、京东方、东阳光药、人福医药、诺泰生物等企业客户。 本次访谈,我们与张林峰、孙伟杰一起回顾了他们亲历的 AI for Science 从开始到现在的发展脉络,深势科技在有限资源下经历的焦灼、抉择,和他们在科研平台与垂直应用间的取舍。 多年前,杨振宁曾在一次高能物理学术讨论会上说:“The party is over”,上一个物理大发现的时代已然远去。大三时,张林峰一度迷茫:“我们这一代希望从底层科学出发做点儿事的同学,都缺点儿让人兴奋的大问题。” 现在,派对又开始了。 本期访谈的图文版:__ 《对话深势科技张林峰、孙伟杰:AI for Science,从开始到现在》 **本次访谈之后也会发布视频版,可在抖音、B站、小红书、微信视频号搜索“晚点聊”或“晚点”观看。* 本期嘉宾: 张林峰,深势科技创始人兼首席科学家 孙伟杰,深势科技创始人兼 CEO 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 时间线跳转: -起点:用 AI 加速“第一性原理计算” 01:32 93 年生人学物理,the party is over 的迷茫 08:42 用 AI 加速第一性原理计算:薛定谔方程、密度泛函、分子动力学 -提出 DeePMD:从“两亿核时”到“笔记本跑半小时” 21:31 第一个 milestone:用一套统一方法表示多种“不变性” 26:27 普林 2017 年的 200 多块 P100→DeePMD-kit→DeepModeling 开源社区 29:51 AlphaFold 和 DeePMD,AI 做科研的两种方式 -起步的 5 年:是公司,也是“大学” 32:38 毕业、回国、创业:机会是 AI for Science,不是 get simulation done 然后发论文 42:06 做微尺度的“达索系统”,把量子物理软件化 56:14 人才培养:在 DP “读大学”的少年们 -从机器学习到 Agent,AI 科学家,AI for Science 的五个阶段 01:04:37 机器学习数理建模→预训练→大语言模型→科研 Agent→AI 科学家 01:16:20 Agent 正在重塑科研范式 01:22:46 “科研无国界”被挑战,在中国,更能推动开源、开放 01:29:00 垂直还是平台,一个必须做的取舍 01:32:57 诺奖表彰“第一个”,而基础平台要做“最后一个” 01:39:24 我们为 AI 科学家做好准备了吗? -热血少年、沙漠流浪、灌篮高手 01:49:13 欲望与勇气,《牧羊少年的奇幻之旅》 01:55:33 “老爹,你最光辉的时候是什么时候?”“就是现在!” 01:57:21 “理想主义的实干者才能改变世界” 01:57:59 Next Question:Innovator 什么样?第一批 AI 发现的新成果 02:04:04 连点成线:不约而同,我们在好多期节目里都聊到了 AI 加速科学发现 相关链接: 张林峰:《AI for Science 2022:未来已来,即将开始流行》 张林峰:《在PD“读大学”的少年们》 晚点聊 116 期:《当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”》 晚点聊 103 期:《用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进》 晚点聊 101 期:《与王小川聊AI✖️医疗:通向“生命科学的数学原理”》 附:本期节目中出现的术语、人物、公司 鄂维南:应用数学家,中国科学院院士,张林峰在普林斯顿的博士生导师之一;主攻多尺度建模与机器学习在物理系统中的应用。 黎曼几何:研究带曲率空间的几何结构,是广义相对论数学语言的核心,由黎曼在 1850 年代提出。 古典微分几何:研究曲线和曲面的局部几何性质,是现代几何的基础框架,成熟于 1820 年代。 弦论:把“点粒子”换成一维弦来描述宇宙的高能物理理论,试图统一量子力学与引力。 冯济:北京大学量子材料科学中心,博雅特聘教授;罗纳德·霍夫曼的学生。 罗纳德·霍夫曼(Roald Hoffmann):诺贝尔化学奖得主,以理论化学和化学键研究著称。 邓肯·霍尔丹(Duncan Haldane):诺贝尔物理学奖得主,因拓扑量子物态理论贡献而闻名。 罗伯特·卡尔(Roberto Car):计算化学家,张林峰在普林斯顿的博士生导师之一,Car–Parrinello 方法共同提出者。 Michele Parrinello(米歇尔·帕里内洛):Car–Parrinello 方法的共同提出者。 Ab intio Molecular Dynamics 从头算分子动力学方程 :Roberto Car 和 Michele Parrinello 在 1985 年发表了论文(Unified Approach for Molecular Dynamics and Density-Functional Theory(《分子动力学和密度泛函理论的统一方法》),提出了Car-Parrinello 分子动力学方法。 薛定谔方程:量子力学的根本方程,描述微观粒子的波函数随时间如何演化。 波函数:在量子力学中刻画系统全部信息的数学对象,其平方给出概率密度。 密度泛函方程:密度泛函理论中的基本方程,通过电子密度而不是波函数求体系能量。 王涵:北京应用物理与计算数学研究所科学家,Deep Potential 的合作者之一 Deep Potential Molecular Dynamics(DeePMD 深度势能分子动力学:深势团队提出的深度势能模型方法,基于神经网络学习原子间相互作用。 DeePMD-kit:DeePMD 方法的开源软件套件,用于训练势能模型并进行分子动力学模拟。 DeepModeling:围绕物质模拟的开源生态,包括 DeePMD 在内的工具集。 汤超:物理学家、生物物理与复杂系统研究者,在理论物理与系统生物学有影响力。2018 年与鄂维南在学术研讨会中一起提出 AI for Science。 薛定谔公司(Schrödinger):成立于 1990 年,从计算化学软件起步,后来扩展到药物发现平台。 Accelrys(现 Dassault BIOVIA):成立于 2001 年(由 Molecular Simulations Inc. 等合并而来),在 2014 年被达索系统收购并更名为 BIOVIA。 达索系统(Dassault Systèmes):成立于 1981 年,最早做 3D 设计与仿真软件(CATIA),后来扩展到材料、生物、制造等全栈建模平台。 玻尔科研空间站:深势团队打造的 AI for Science 计算科学平台。 SciMaster:深势科技 2025 年夏天推出的科研智能体 Uni-Mol:用于分子结构与药物发现任务的通用深度学习模型。 Uni-RNA:使用深度学习处理 RNA 结构与设计任务的模型体系。 Evo 2:2025 年 2 月,由 Arc 研究所、斯坦福、英伟达合作推出的生物分子科学基础模型。 AlphaGenome:2025 年 6 月 DeepMind 发布的一款能解读基因组功能和预测变异效应的模型。 Future House:2023 年 Google 前 CEO 埃里克·施密特支持成立的 AI for Science 公司,主攻新材料、新药研发和 AI 驱动实验。 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:




