AI 学习笔记 — 4月22日

Claude Design 可能会锁死创意——这是所有 AI 工具不可避免的弊端

这种"提示-反应"循环适用于扩展或修订已有的设计系统，但不太适合从头开始创造新东西——设计是"50% 的探索"，卢卡斯说。在 Figma 中，你从空白画布开始，输出是由一连串决策塑造的——拖动一个形状、把它对齐到网格、改变投影、将三个变体并排比较。Claude Design 把开放式探索变成了对已有内容的反应。

隐私这一块的新产品有点意思

有没有在网上搜自己，结果发现一堆未经你同意的个人信息数据库？这些信息本来应该属于你，而不是属于那些未经授权转卖它们赚钱的数据经纪人。像 DeleteMe 这样的服务用隐私专家从数百个经纪人网站上清除你的数据，发送详细报告显示具体清理了什么，并且全年持续监控。有点意思的是，这正在成为一个新品类。

文章里两条实用建议：

盘点每一个员工连接到工作账户的 AI 应用。然后在任何还没开启两步验证的地方全部打开。
在你发布 AI 构建的任何东西之前——即使只是周末原型——问生成器一个问题："这个应用暴露给公共互联网的是什么？它应该暴露吗？"如果你得不到明确答案，就不要发布。

GPT-Image-2 发布

基准测试显示了一个巨大的飞跃，尤其是在实际图像任务上：Arena 报告 GPT-Image-2 在所有 Image Arena 排行榜上排名第一，包括文本到图像 1512、单图像编辑 1513、多图像编辑 1464。在文本到图像方面比下一个模型领先了显著的 +242 Elo。

独立反应也集中在同一个主题上：这不仅仅是更漂亮的艺术，而是一个在 UI、原型、文档、生产力视觉和以参考为驱动的设计循环中更可用的模型。最有趣的系统级影响是：图像生成正在成为编码代理的前端——生成一个作为图像的 UI 规范，然后让 Codex 或其他代码代理根据该视觉参考来实现。

ChatGPT Images 2.0 — 把推理直接烧进图像生成器

OpenAI 发布了 ChatGPT Images 2.0，一次把图像生成从"漂亮图"推向"真正的创意工作"的大升级。最重要的变化是内置了推理和思考能力：模型在生成图像之前，可以花时间理解提示词、规划输出、检查细节，需要时还能调用网页上下文。它更像一个创意助理，而不是标准的图像生成器。

打开推理后，ChatGPT Images 2.0 可以从单个提示词生成最多 8 张图像变体，并且在每一张之间保持角色、物体和整体视觉风格的一致性。OpenAI 说这让长篇视觉叙事和多素材的 campaign 制作变得容易得多。

其他升级：

日语、韩语、中文、印地语和孟加拉语的文字渲染大幅改进。
世界知识更新到 2025 年 12 月。
更强的风格复刻——纹理、光照、构图、氛围都更到位。
特别适合品牌相关的工作：Logo、产品图、campaign、一致的商业视觉。

Riley Brown 的那个 demo 其实是这次新推理循环能力的一个很好展示——面对一个涉及书的任务，模型会自己去搜真实书的条形码，然后把它加到生成的图像里。这才是重点——不只是像素本身，而是 agent 式地先采集上下文再去画图的行为。

Hugging Face 的 ml-intern：这一批里最强的开源 agent-in-the-loop 发布

HF 发布了 ml-intern，一个开源 agent，它自动化了后训练研究循环：阅读论文、跟踪引用图、收集并重新格式化数据集、启动训练作业、评估运行情况、在失败中迭代。

报告的示例之所以引人注目，是因为它们是端到端循环，而不只是编码演示：

GPQA 科学推理在 Qwen3-1.7B 上不到 10 小时内从 10% → 32%
一个医疗保健设置据报道在 HealthBench 上比 Codex 高出 60%
一个数学设置写了一个完整的 GRPO 脚本，并通过消融实验从奖励崩溃中恢复过来

社区测试迅速表明，它能够自主微调并把产物发布回 Hub（示例：一个 SAM 微调运行）。

SEO 和 GEO——专门做搜索分发的自主 agent

RankAI 把自己定位成一个自主 agent，同时处理 SEO 和 GEO（生成式引擎优化），从 Google 和 ChatGPT 两端把买家拉回来。新品类有点意思。技术栈大概可以这样拆：

内容生成层。几乎可以确定是调用 GPT-4 / Claude / Gemini 等大模型 API，加上自己的 prompt 工程和内容模板，批量生成符合 SEO 规范的文章。这是这类工具的标准做法。
关键词数据库。他们声称有"数十亿关键词数据库"，通常来自购买第三方数据（SEMrush、Ahrefs 的 API），或爬取 Google 搜索建议、People Also Ask 等公开数据，再做聚类和意图分类。
CMS 集成。通过 WordPress REST API、Shopify API、Webflow API 等官方接口直接推送内容，实现"自动发布"。技术难度不高，属于标准集成工程。
GEO（生成式引擎优化）。这是他们的差异化卖点。核心思路是：在内容中嵌入结构化数据（Schema.org）、FAQ 格式、清晰的实体关系，让 LLM 在检索增强生成（RAG）或训练数据中更容易引用这些页面。本质上是针对 AI 搜索的 prompt 设计。
监控与反馈循环。接入 Google Search Console API 获取点击、曝光数据，当某个页面表现不达标时触发重写流程——典型的"评估—优化"自动化 pipeline。

Google：AI 现在生成了 75% 的新代码

Google 披露的一个里程碑——AI 现在负责生成公司内部 75% 的新代码。在头部工程组织中，AI 代码占比持续攀升这条趋势上，又多了一个数据点。