AI 学习笔记 — 5月8日

数据行业还远未成熟

数据行业远未发展成熟。听说 Anthropic 或 OpenAI 等公司为单个 RL 环境投入超过 100 万美元，年度累计支出达数亿美元，用来推动强化学习的前沿——很值得关注的问题是中国实验室是不是从美国数据公司买相同的环境，还是有一个镜像的国内供应生态。

答案不是「没有数据行业」，而是他们的经验是数据行业整体质量相对较差，通常自己搭建环境或数据反而更好。研究人员花大量时间亲手做 RL 训练环境；少数大公司（字节跳动、阿里巴巴）有内部数据标注团队来支持。这其实和「自建不买」的整体心态一致。

Dreaming：让 Agent 在「梦里」学习

Dreaming 是 Anthropic 给一个后台进程起的名字——这个进程会回顾 Agent 过去的会话和记忆，找出模式，重写记忆，从而让 Agent 在两次运行之间得到改进。OpenClaw 在 4 月推出过类似功能，但 Anthropic 的版本更强调「Agent 团队集体学到了什么」，而不是「单个 Agent 记住了什么」。系统会从重复纠正、反复出现的错误、运行良好的工作流里学习——长期来看就是在搭建一个机构知识库。

该功能目前以 research preview 形式存在于 Claude Managed Agents 中。一个明显的开放问题是：这个能力什么时候会进 Claude Code？

GPT-Realtime-Translate：实时语音互译

支持从 70 多种输入语言 实时流式翻译到 13 种输出语言
OpenAI 联合创始人 Greg Brockman 表示，实时语音互译是 OpenAI 自公司早期就期待的应用方向，现在终于开放给所有人构建

注意「13 种输出语言」是个很关键的不对称设计：输入端覆盖广，输出端聚焦在主要语言上，这其实是把翻译延迟和质量做平衡的合理选择。