AI for science

Alex 在向 o3 寻求研究帮助后,第一次在理论物理领域看到了 AI 的潜力。在播客中,Alex 回忆起曾向 GPT 求助一项原本可能需要好几天的计算,结果 11 分钟就拿到了结果。他立即意识到 AI 对他的工作会产生多么大的影响——尽管他的物理学家同事和更广泛的学术社区当时对 AI 持冷淡或怀疑态度。

模型公司下场做 to B 咨询

  • Anthropic 与 Blackstone、Hellman & Friedman、Goldman Sachs 的未具名合资企业——由 15 亿美元(每家主要参与者出资 3 亿美元)资助。「典型的合作始于一个小团队与客户密切合作,了解 Claude 可以在哪些方面产生最大影响。此后,该公司的工程师将与 Anthropic Applied AI 的员工一起开发以 Claude 为动力的系统,以满足每个组织的运营需求。」
  • OpenAI 的 The Deployment Company,由 19 位投资者支持,包括 TPG、Brookfield Asset Management、Advent 和 Bain Capital,迄今为止筹集了大约 40 亿美元,估值达到 100 亿美元 pre-money。「由微软支持的 OpenAI 上个月表示,其首席运营官 Brad Lightcap 将转入新职位,领导特殊项目,并向 CEO Sam Altman 直接汇报。Lightcap 将监督 OpenAI 通过与一家私募股权公司合资企业向企业销售软件的推动。」

ChatGPT 个性化

GPT-5.5 Instant 成为 ChatGPT 的默认设置:OpenAI 将 GPT-5.5 Instant 推广到 ChatGPT 和 API,定位为事实上的全面升级,包括基础智能、图像理解和语调。此次发布还捆绑了更强的个性化功能:ChatGPT 现在可以使用保存的记忆、过去的聊天记录、文件和连接的 Gmail,同时公开「记忆来源」,以便用户可以看到哪些上下文影响了回复。

ChatGPT 也改进了 Bing 的推荐。

RL 环境

RL infra 正在从「单次生成+奖励」转向长期运行的动作系统。一份新指南比较了 LLM 时代的 RL 环境框架,重点关注如何扩展到数千个环境。一份详细调查对比了传统 RLVR 与 agentic RL,指出了 Forge、ROLL、Slime 和 Seer 等系统,以及 TITO 一致性、rollout 延迟、前缀树合并和全局 KV 缓存等反复出现的问题。

主动式助手界面正在成为一种产品类别。关于 Anthropic Orbit 的泄漏将其描述为一种主动助手,能够从 Gmail、Slack、GitHub、Calendar、Drive 和 Figma 等平台合成数据,而无需明确的提示。Manus 也添加了在需要时根据上下文建议的推荐连接器。