这些是笔记、想法、进度日志和尚在形成中的想法。有些会经得起时间考验,有些不会 —— 这就是意义所在。

AI 学习笔记 — 4月29日

NVIDIA Nemotron 3 Nano Omni:30B/A3B 多模态 MoE,256K 上下文,约 9 倍吞吐。Mini-SGLang 用 radix 树做前缀匹配。Unsloth LoRA 合并 vs 不合并的权衡。用 167MB 的 adapter 模仿《红楼梦》风格。TRL DPO 完整跑通。

AI 学习笔记 — 4月28日

Sakana 7B Conductor 用 RL 编排前沿模型,LiveCodeBench 83.9%。OpenAI 的 AI 优先手机瞄准 2028。GUI Agent 标注是完全不同的范式。YC 2026 夏季 RFS:14 个方向押注「AI 已从功能变基础设施」。

AI 学习笔记 — 4月27日

医疗 LLM 重构的 4 个发现:unattended 跑通的瓶颈、多格式任务相互干扰。Gemma 4、Qwen 3.6、GLM-5.1、Kimi K2.6、DeepSeek V4-Pro 的架构差异。Anthropic Project Deal:Opus agent 的成交价格明显优于 Haiku。

AI 学习笔记 — 4月26日

SkillsBench vs 我们自建的 skillrank——七个错误复盘:用 LLM-as-judge 代替确定性 verifier、用 pairwise 代替 pass/fail、缺 with/without 基线、把时间都花在基础设施上。

禅宗、儒家、斯多葛、阿德勒

一本关于东西方四大智慧传统——禅宗、儒家、斯多葛、阿德勒心理学——在「如何过好这一生」这个问题上汇合的书。

AI 学习笔记 — 4月25日

DeepSeek-V4 vs Flash Attention vs MHA——算法优化与架构创新的本质差异。CSA/HCA 用低秩潜在压缩把 KV cache 缩小 5-10x。GPT-Image 2 + Seedance 2.0 短片制作工作流。

AI 学习笔记 — 4月24日

GPT-5.5 发布——更快、综合更便宜、更聪明。swyx 谈 AI-native:skills 是 agent 的最小单位、应用公司比基础设施公司更耐打、Taalas 把模型刻进硅。World ID 4.0 接入 Tinder、Zoom、DocuSign。

AI 学习笔记 — 4月23日

Shopify 内部 AI 使用率接近 100%,关键是批评循环而非并行 agent;Tangle、Tangent、SimGym 三件套。MacAskill 论 AI 性格是最被低估的杠杆。mini-sglang RadixAttention vs nano-vllm:单 3090 跑出 7311 tok/s。

AI 学习笔记 — 4月22日

Claude Design 锁死创意。GPT-Image-2 在 Image Arena 领先 +242 Elo。ChatGPT Images 2.0 把推理烧进图像生成。RankAI 的 SEO+GEO 技术栈拆解。Google:75% 新代码由 AI 生成。

AI 学习笔记 — 4月21日

通过 DeepSeek-R1 理解 RLVR。Hermes agent 的三个设计模式:无状态单元、结构化失败记录、目录内 AGENTS.md。Alex Imas 谈后商品经济。

AI 学习笔记 — 4月20日

Generative Agents(Smallville)、OASIS 大规模社交模拟、Love First Know Later——三篇论文为 Halo 这类 persona 产品画出理论地图。

AI 学习笔记 — 4月19日

Claude Code 终端快捷键(Shift+Tab、Esc、@)。奉天的工作流:两个 Max 套餐 + 语音输入 + Agent Team 模式 = 10 倍生产力。

AI 学习笔记 — 4月18日

Claude Design 全流程:Pinterest 找灵感 → AI 生成背景和角色 → Seedance 2.0 做动画 → motionsites.ai 模板 → Landbook 参考布局。

AI 学习笔记 — 4月17日

Oversee agents 才是未来,而不是写代码。nano-vllm 深入:attention、preempt、prefix caching。McKinsey 谈代理型组织。

AI 学习笔记 — 4月16日

能量模型(EBM):Hopfield 网络、玻尔兹曼机、扩散模型都源于此。Yann LeCun 押注 EBM 将取代自回归 LLM。

AI 学习笔记 — 4月15日

本地模型 Reddit 排名,如何用参考图片引导 AI 生成网站设计,2026 年 AI 工程师路线图,Karpathy 谈 AI 能力认知分化。

AI 学习笔记 — 4月14日

nano-vLLM 深度解析:prefill vs decode、KV cache、PagedAttention、continuous batching。Notion 的模型行为工程师角色。

AI 学习笔记 — 4月13日

GLM-5.1 架构解读(MoE、MLA、DSA)。用 Claude 报税踩到的坑。AI 写作比你想象的难。文件夹即 agent 的设计模式。

AI 学习笔记 — 4月12日

安静的一天。有时候让想法沉淀一下也是好的。

AI 学习笔记 — 4月11日

顾问式 agent 协调:廉价执行器 + 高昂顾问。Haiku + Opus 组合使 BrowseComp 得分比单独使用 Haiku 高出一倍以上。

AI 学习笔记 — 4月10日

Meta Muse Spark:十分之一算力达到顶尖水平,meta.ai 藏着 16 个工具。两个新思考:AI 工具本质是游戏,Vibe Coding 如同网络小说。

AI 学习笔记 — 4月9日

Mythos 在 SWE-bench 拿到 93.9%——核武器级代码能力。picotron 分布式训练:朴素 DP vs Bucket DP,AFAB vs 1F1B 流水线调度。

AI 学习笔记 — 4月8日

Moltbook:AI 剧场还是真正的涌现?Nebius $460 亿确认合同。Ryan Leoplo 谈零人工代码的 harness 工程。

AI 学习笔记 — 4月7日

为什么改一个字比生成赛博朋克城市图更难?扩散模型完整原理(含数学推导和代码)。

AI 学习笔记 — 4月6日

Claude 的 Cowork 功能支持跨设备 Computer Use——可以控制另一台配置好的远程电脑,无需操作本机浏览器。

让我持续前进的力量

让我持续前进的力量

一个简单的数字改变了一切。三万天。这就是一个人一生大概拥有的天数。这个认知重塑了我对生活、工作和时间的理解。

为什么我选择公开构建

为什么我选择公开构建

选择公开记录一切并不容易。这是我选择透明而非完美的原因,以及我希望从中获得什么。

Steplify 教会我的关于产品市场匹配的一切

我的创业失败了。但关于倾听用户、把握时机、以及信念与验证之间差距的教训,比任何成功都更有价值。