写作 — Tom Wang

Anthropic 与 SpaceX 达成算力合作，Claude 各档套餐用量上限翻倍。Harvey LAB 基准覆盖 1200 个长任务、24 个法律方向。Genesis AI 推出 GENE-26.5，数据采集硬件比传统方案便宜 100 倍。Figure 总部探访：约 100 万小时预训练数据、Sim-to-Real 零样本迁移、50-200 Hz 机载推理、新一代高自由度手准备从人类视频学习。Hugging Face Reachy Mini App Store 指向桌面机器人新品类。

学习日志 2026年5月6日

AI 学习笔记 — 5月6日

AI for science：o3 把原本几天的物理计算压缩到 11 分钟。Anthropic 联手 Blackstone/H&F/Goldman、OpenAI 推 The Deployment Company——模型公司下场做 to B 咨询。GPT-5.5 Instant 成 ChatGPT 默认设置并公开「记忆来源」。RL 基础设施从「单次生成+奖励」转向长期运行的动作系统；Anthropic Orbit 与 Manus 指向新的「主动助手」品类。

学习日志 2026年5月5日

AI 学习笔记 — 5月5日

从「提供工具的软件」到「交付结果的软件」。新一代数据供应商打法：结果交付、生命周期管理、产品化服务分层、与模型指标挂钩的定价。Meta 收购 ARI，把机器人当成训练策略。模型 × harness × 上下文才是胜负手——只换提示和中间件就能让 gpt-5.2-codex 在 Terminal-Bench 2.0 上提升 13.7 分。

学习日志 2026年5月4日

AI 学习笔记 — 5月4日

赛博精神病——一天 163 次提交，直接在生产环境 Vibe Coding。什么是 AI 复制不了的：高级订阅信、精品咨询、精选品牌、会员俱乐部、承担法律责任的主体。Cursor Composer 2：在 RL 之前加 continued pretraining，CursorBench 一口气提升 17.1 分。Keep Rate 作为行为级 north-star 指标。为什么 PM 会变成「回路设计者」、product taste 本质是成本判断。应对 AI cyberattack 的可执行清单。

研究报告 2026年5月5日

数据行业研究报告

AI 数据标注行业的市场全景、公司画像、定价模型、技术趋势与痛点机会的实地调研与分析。

学习日志 2026年5月3日

AI 学习笔记 — 5月3日

AI Native 组织形态：个人快 15-40%、公司却零提升的根因。三个重建样本——把开发剥离到子公司、内部 3-5 人 Pod、裁掉所有写代码的人只留 AI Architect。端到端产品负责、按 Trait 而非 Job Family 组队、Context 基础设施才是护城河。Cursor UI/UX lead 谈软件是「概念的堆叠」。为什么 fine-tune 改名 customization，新的 pre/mid/post 训练流水线。坏数据、taste 规模化、benchmark 泄露。

学习日志 2026年5月2日

AI 学习笔记 — 5月2日

Agent 调用协调本质是 while loop 内的工具调用，五步搭出来。LLM 时代的蒸馏：数据蒸馏与 CoT 蒸馏。Claude Code for PM——只写路线图，其他让 Claude 写。AI 产品的六个层次。GPT-5.5、Grok 4.3、DeepSeek V4 Pro 与开闭源差距收窄。六个合成数据搞不定、必须靠人工标注的场景。

学习日志 2026年5月1日

AI 学习笔记 — 5月1日

编程 agent 横评：Claude Code、Claude Design、Cursor、Codex 同一份落地页 brief 的对比。nanochat depth 翻倍与 FP8 训练「骚操作」。Cursor SDK 在 Terminal-Bench 2.0 拿下第一。为什么 Apache 2.0 对企业用户真的重要。2023–2025 AI 价值都被基础设施层捕获：VR NVL72 与 neocloud 利润空间的压缩。

学习日志 2026年4月30日

AI 学习笔记 — 4月30日

为什么 agent 时代的 CPU 叙事是真实的，但远没有 GPU 的故事大。CPU 玩家全景：AMD、Intel、hyperscaler 自研 ARM、Ampere。一台人形机器人需要多少 GPU/CPU——Jetson Thor 是 onboard 的事实垄断。Mayo Clinic REDMOD 比临床确诊提前最多三年识别胰腺癌。Stripe 的四层 agent 支付协议栈。

学习日志 2026年4月29日

AI 学习笔记 — 4月29日

NVIDIA Nemotron 3 Nano Omni：30B/A3B 多模态 MoE，256K 上下文，约 9 倍吞吐。Mini-SGLang 用 radix 树做前缀匹配。Unsloth LoRA 合并 vs 不合并的权衡。用 167MB 的 adapter 模仿《红楼梦》风格。TRL DPO 完整跑通。

学习日志 2026年4月28日

AI 学习笔记 — 4月28日

Sakana 7B Conductor 用 RL 编排前沿模型，LiveCodeBench 83.9%。OpenAI 的 AI 优先手机瞄准 2028。GUI Agent 标注是完全不同的范式。YC 2026 夏季 RFS：14 个方向押注「AI 已从功能变基础设施」。

学习日志 2026年4月27日

AI 学习笔记 — 4月27日

医疗 LLM 重构的 4 个发现：unattended 跑通的瓶颈、多格式任务相互干扰。Gemma 4、Qwen 3.6、GLM-5.1、Kimi K2.6、DeepSeek V4-Pro 的架构差异。Anthropic Project Deal：Opus agent 的成交价格明显优于 Haiku。

学习日志 2026年4月26日

AI 学习笔记 — 4月26日

SkillsBench vs 我们自建的 skillrank——七个错误复盘：用 LLM-as-judge 代替确定性 verifier、用 pairwise 代替 pass/fail、缺 with/without 基线、把时间都花在基础设施上。

书 2026年4月26日

禅宗、儒家、斯多葛、阿德勒

一本关于东西方四大智慧传统——禅宗、儒家、斯多葛、阿德勒心理学——在「如何过好这一生」这个问题上汇合的书。

学习日志 2026年4月25日

AI 学习笔记 — 4月25日

DeepSeek-V4 vs Flash Attention vs MHA——算法优化与架构创新的本质差异。CSA/HCA 用低秩潜在压缩把 KV cache 缩小 5-10x。GPT-Image 2 + Seedance 2.0 短片制作工作流。

学习日志 2026年4月24日

AI 学习笔记 — 4月24日

GPT-5.5 发布——更快、综合更便宜、更聪明。swyx 谈 AI-native：skills 是 agent 的最小单位、应用公司比基础设施公司更耐打、Taalas 把模型刻进硅。World ID 4.0 接入 Tinder、Zoom、DocuSign。

学习日志 2026年4月23日

AI 学习笔记 — 4月23日

Shopify 内部 AI 使用率接近 100%，关键是批评循环而非并行 agent；Tangle、Tangent、SimGym 三件套。MacAskill 论 AI 性格是最被低估的杠杆。mini-sglang RadixAttention vs nano-vllm：单 3090 跑出 7311 tok/s。

学习日志 2026年4月22日