Claude Design 可能会锁死创意——这是所有 AI 工具不可避免的弊端
这种"提示-反应"循环适用于扩展或修订已有的设计系统,但不太适合从头开始创造新东西——设计是"50% 的探索",卢卡斯说。在 Figma 中,你从空白画布开始,输出是由一连串决策塑造的——拖动一个形状、把它对齐到网格、改变投影、将三个变体并排比较。Claude Design 把开放式探索变成了对已有内容的反应。
隐私这一块的新产品有点意思
有没有在网上搜自己,结果发现一堆未经你同意的个人信息数据库?这些信息本来应该属于你,而不是属于那些未经授权转卖它们赚钱的数据经纪人。像 DeleteMe 这样的服务用隐私专家从数百个经纪人网站上清除你的数据,发送详细报告显示具体清理了什么,并且全年持续监控。有点意思的是,这正在成为一个新品类。
文章里两条实用建议:
- 盘点每一个员工连接到工作账户的 AI 应用。然后在任何还没开启两步验证的地方全部打开。
- 在你发布 AI 构建的任何东西之前——即使只是周末原型——问生成器一个问题:"这个应用暴露给公共互联网的是什么?它应该暴露吗?"如果你得不到明确答案,就不要发布。
GPT-Image-2 发布
基准测试显示了一个巨大的飞跃,尤其是在实际图像任务上:Arena 报告 GPT-Image-2 在所有 Image Arena 排行榜上排名第一,包括文本到图像 1512、单图像编辑 1513、多图像编辑 1464。在文本到图像方面比下一个模型领先了显著的 +242 Elo。
独立反应也集中在同一个主题上:这不仅仅是更漂亮的艺术,而是一个在 UI、原型、文档、生产力视觉和以参考为驱动的设计循环中更可用的模型。最有趣的系统级影响是:图像生成正在成为编码代理的前端——生成一个作为图像的 UI 规范,然后让 Codex 或其他代码代理根据该视觉参考来实现。
ChatGPT Images 2.0 — 把推理直接烧进图像生成器
OpenAI 发布了 ChatGPT Images 2.0,一次把图像生成从"漂亮图"推向"真正的创意工作"的大升级。最重要的变化是内置了推理和思考能力:模型在生成图像之前,可以花时间理解提示词、规划输出、检查细节,需要时还能调用网页上下文。它更像一个创意助理,而不是标准的图像生成器。
打开推理后,ChatGPT Images 2.0 可以从单个提示词生成最多 8 张图像变体,并且在每一张之间保持角色、物体和整体视觉风格的一致性。OpenAI 说这让长篇视觉叙事和多素材的 campaign 制作变得容易得多。
其他升级:
- 日语、韩语、中文、印地语和孟加拉语的文字渲染大幅改进。
- 世界知识更新到 2025 年 12 月。
- 更强的风格复刻——纹理、光照、构图、氛围都更到位。
- 特别适合品牌相关的工作:Logo、产品图、campaign、一致的商业视觉。
Riley Brown 的那个 demo 其实是这次新推理循环能力的一个很好展示——面对一个涉及书的任务,模型会自己去搜真实书的条形码,然后把它加到生成的图像里。这才是重点——不只是像素本身,而是 agent 式地先采集上下文再去画图的行为。
Hugging Face 的 ml-intern:这一批里最强的开源 agent-in-the-loop 发布
HF 发布了 ml-intern,一个开源 agent,它自动化了后训练研究循环:阅读论文、跟踪引用图、收集并重新格式化数据集、启动训练作业、评估运行情况、在失败中迭代。
报告的示例之所以引人注目,是因为它们是端到端循环,而不只是编码演示:
- GPQA 科学推理在 Qwen3-1.7B 上不到 10 小时内从 10% → 32%
- 一个医疗保健设置据报道在 HealthBench 上比 Codex 高出 60%
- 一个数学设置写了一个完整的 GRPO 脚本,并通过消融实验从奖励崩溃中恢复过来
社区测试迅速表明,它能够自主微调并把产物发布回 Hub(示例:一个 SAM 微调运行)。
SEO 和 GEO——专门做搜索分发的自主 agent
RankAI 把自己定位成一个自主 agent,同时处理 SEO 和 GEO(生成式引擎优化),从 Google 和 ChatGPT 两端把买家拉回来。新品类有点意思。技术栈大概可以这样拆:
- 内容生成层。几乎可以确定是调用 GPT-4 / Claude / Gemini 等大模型 API,加上自己的 prompt 工程和内容模板,批量生成符合 SEO 规范的文章。这是这类工具的标准做法。
- 关键词数据库。他们声称有"数十亿关键词数据库",通常来自购买第三方数据(SEMrush、Ahrefs 的 API),或爬取 Google 搜索建议、People Also Ask 等公开数据,再做聚类和意图分类。
- CMS 集成。通过 WordPress REST API、Shopify API、Webflow API 等官方接口直接推送内容,实现"自动发布"。技术难度不高,属于标准集成工程。
- GEO(生成式引擎优化)。这是他们的差异化卖点。核心思路是:在内容中嵌入结构化数据(Schema.org)、FAQ 格式、清晰的实体关系,让 LLM 在检索增强生成(RAG)或训练数据中更容易引用这些页面。本质上是针对 AI 搜索的 prompt 设计。
- 监控与反馈循环。接入 Google Search Console API 获取点击、曝光数据,当某个页面表现不达标时触发重写流程——典型的"评估—优化"自动化 pipeline。
Google:AI 现在生成了 75% 的新代码
Google 披露的一个里程碑——AI 现在负责生成公司内部 75% 的新代码。在头部工程组织中,AI 代码占比持续攀升这条趋势上,又多了一个数据点。