麦克船长的技术、产品与商业博客

借美国民间的 National AI Day，聊聊 AI 如何成为新的生产力环境

16 Jul 2026, 杭州 | 麦克船长 | 总计 2445 字

美国民间机构 National Day Calendar 将 7 月 16 日称为 National AI Day。借这个并非官方设立的纪念日，我想聊聊 AI 如何从一种工具变成新的生产力环境，以及什么应该交给 AI、什么必须由人负责。

别焦虑，软件工业远没到终局：Code-Editing Agent 只是中间态，Product-Editing Agent 才是未来

30 May 2026, 景德镇 | 麦克船长 | 总计 1053 字

今天的 Coding Agent 只是软件工程变革的中间态。代码更像工程文件，而不是人类真正想编辑的对象。未来更有价值的方向，是从 Code-Editing Agent 走向 Product-Editing Agent……

fcp：写给人和 AI Agent 用的 Final Cut Pro 命令行

28 May 2026, 杭州 | 麦克船长 | 总计 6957 字

final-cut-pro-cli 是我给 Apple Final Cut Pro 写的命令行工具。它不是要替代 FCP UI，而是把剪辑准备阶段里 Library、Event、Project、Media、Clip 这些可脚本化操作，变成给人和 AI Agent 都能稳定调用的接口……

dvr：写给人和 AI Agent 用的 DaVinci Resolve 命令行

15 May 2026, 杭州 | 麦克船长 | 总计 5579 字

dvr 是我给 DaVinci Resolve 18+ 写的一个开源 Python 命令行——既给人用，也给 AI Agent 用。本文带你 5 分钟上手，并讲讲几个 Agent-first 的设计决定……

从《文明》的回合到《星际》的实时：AI 产品形态正在经历的范式迁移

13 May 2026, 杭州 | 麦克船长 | 总计 4864 字

30 多年前，策略游戏从《文明》走到《星际》，完成了一次从回合制到实时制的范式迁移。今天 AI 行业也在走同一条路——从 TBM 到 RTM。我们做的 PACE 引擎就是视频编辑场景的 RTM……

除夕前的 48 小时极限：在「僵尸号」上用 AI 拿到了 5K+ 赞，并总结出未来四层视频创作模式

01 Mar 2026, 杭州 | 麦克船长 | 总计 3221 字

本文是麦克船长关于 AI 视频创作的实战复盘。记录了大年二十八、二十九这两天，如何利用 Gemini、Claude Code、Nano Banana 和 Seedance 等 AI 工具链进行 48 小时极限创作，并在大年初一实现账号冷启动爆发，全网累积获得超过 3000 赞的经历 ……

先进生产力与创造价值的衡量原则

11 Jan 2026, 杭州 | 麦克船长 | 总计 3283 字

创造有很高的优先级，但"创造"的价值和方向应该怎么衡量和判断呢？从 ChatGPT、黑神话悟空、电动汽车等发展来看，先进生产力的发展方向、先进文化的发展方向就应该是优先考虑的方向。追随、开拓甚至引领这样的方向，就是衡量创造价值的基本原则。

要做 Human-AI Cocreation，而不是一键/一句话 XXX

30 Aug 2025, 杭州 | 麦克船长 | 总计 567 字

在创作生产力领域，做 Human-AI Cocreation 产品的价值，远远大于一键/一句话 XXX 类产品。

从生成影像到「生成世界」—— Google DeepMind Genie 3 打开世界模型的交互时代

06 Aug 2025, 杭州 | 麦克船长 | 总计 2177 字

Google DeepMind 于北京时间 2025 年 8 月 6 日凌晨正式推出了其新一代通用世界模型 `Genie 3`，该模型能够基于文本提示实时生成交互式虚拟环境，并以每秒 24 帧、720p 分辨率的速度保持数分钟的一致性和高保真度。作为世界模型研究的最新里程碑，`Genie 3` 不仅在生成环境的一致性和逼真度上大幅提升，更首次支持了实时人机交互，为通向通用人工智能（AGI）奠定了坚实基础。

解读 Claude Opus 4.1：混合推理的前沿跃迁

06 Aug 2025, 杭州 | 麦克船长 | 总计 2612 字

北京时间 8 月 6 日凌晨，Anthropic 悄然上线新版旗舰模型 ``Claude Opus 4.1``，并同步更新 API、Bedrock、Vertex AI 三大平台与 Claude Code。虽然官方在博客中将其定位为「``Opus 4`` 的渐进式升级」，但从多维基准与系统卡细节来看，这次版本号仅「加 0.1」的更新，实则在编码、长程代理任务与安全调优上完成了多项关键突破，为 2025 年下半年大模型竞技赛再添变量。

时隔六年再开源，OpenAI 发布两款语言模型，主打端侧场景

06 Aug 2025, 杭州 | 麦克船长 | 总计 2566 字

距离 OpenAI 上一次开源语言模型已经过去了 6 年 —— 北京时间 2025 年 8 月 6 日凌晨 00:22，美国人工智能公司 OpenAI 在官网发文，声称发布两款开放权重推理模型 ``gpt-oss-120b`` 和 ``gpt-oss-20b``，也是 ``GPT-2`` 之后的第一个开放权重语言模型。

【摘录】Livemore：华尔街不会改变，人性不会改变

19 Sep 2023, 杭州 | 麦克船长 | 总计 4463 字

杰西·劳里斯顿·李佛摩（Jesse Lauriston Livermore），1877 年 7 月 26 日 — 1940 年 11 月 28 日，华尔街著名金融家，被《时代》杂志形容为「最活跃的美国股市投机客（the most fabulous living U.S. stock trader）」。以下是他的言论摘录。

趋势量化之 Event-Driven 1：上市公司发行可转债有什么影响（持续更新）

19 Sep 2023, 杭州 | 麦克船长 | 总计 1443 字

可转债（Convertible Bond，简称 CB），即可转换债券（或可换股债券），可按一定规则转换为债券发行公司的股票。其转换价格、转换时间段会在发行前确定。

【摘录】投资的道路上不存在捷径，但如果向成功的投资大师学习，可以少走很多弯路。

30 Jul 2023, 广东 | 屈红燕 | 总计 2890 字

原文链接：https://mp.weixin.qq.com/s/U8YsBlMOtj98LeTxXOPigQ?global_content=%7B%22promote_id%22%3A13766%2C%22sub_promote_id%22%3A4%7D

人工智能 LLM 革命黎明：Copilot as a Service 将打造无数超级个体，核心能力是预测与自主 by 麦克船长

25 Jun 2023, 杭州 | 麦克船长 | 总计 12371 字

最近对于本轮生成式 AI 浪潮的讨论，进入了一个新阶段，大家从模糊地认为是巨大变革，逐渐开始探讨具体的变革机会点。我想讲讲自己对于本轮技术变革，在 to B 领域的一些基本观点。这些基本观点，是有争议的、非共识的，但我想有必要输出，以换来更多朋友与我的交流碰撞。

【摘录】投资中的节奏与结构 | 42章经

21 Jun 2023, 杭州 | 张津剑 | 总计 5546 字

从第一篇经典的投资中的信号与噪声以来，绿洲资本合伙人张津剑已陆续在 42章经发表了三篇原创文章（其余两篇为投资决策中的信噪比和投资中的周期与载波）。这三篇文章从 2018 年至今，可谓是横跨了周期，也启发了很多投资行业的从业者。

麦克船长解读 LIMA 的表面对齐假设：少量多样性、高质量数据即可实现更好的对齐

26 May 2023, 合肥 | 麦克船长 | 总计 4078 字

在这篇论文中，作者使用这个测试数据集来评估他们的模型 LIMA（Less Is More for Alignment）的性能，并将其与其他的语言模型进行比较。他们发现，尽管 LIMA 只在1000个示例上进行了微调，但它的性能仍然优于其他的语言模型。

麦克船长的全栈指南：Google Flutter 开发跨平台 APP

29 Apr 2023, 杭州 | 麦克船长 | 总计 27217 字

在一个人就是一支队伍的时代里（在 AI 急速发展的推动下，未来会越来越趋于《未来简史》所描述的「半神」），产品、运营还是工程，最好都要会一些前端，这样方便自己做一点东西便于提高日常的生产力。今天介绍的是 2018 年开始的 Google Flutter 跨多平台终端的技术，支持 iOS、Android、Web、macOS、Linux、Windows ……

【摘录】我国城乡二元结构的由来

29 Apr 2023, 杭州 | 麦克船长 | 总计 6809 字

美国作为互联网乃至科技行业的全球领导者，始终还是中国互联网及科技发展的关键参照物。两者相比，中国有很多独特的宏观因素导致无法使用 Time Machine 来照搬美国，同时目前前沿领域两者的时间差也已经非常小了（这非常不同于 PC 互联网浪潮），所以即便有 Time Machine 有效性也没那么充足了（尽管仍然有一定参考价值）。这其中有一个关键特征，就是中国的城乡二元经济结构，受此影响最显著的科技有公司比如拼多多

麦克船长：理解和重塑 AI 时代的八个一切 / The Eight ALLs for Understanding and Shaping the AI Era

19 Apr 2023, 杭州 | 麦克船长 | 总计 948 字

As a product manager focusing on the AI field, I often find ourselves constrained by current product forms, making it difficult to think about truly AI-native products. While pondering on how to build AI-native products, I have summarized the following eight points.

对比解读半年两次 AI 监管条例 10 点变化：从强调自律到鼓励创新，支持发展定调！

11 Apr 2023, 杭州 | 麦克船长 | 总计 9851 字

近日一条通知引起了 AI 圈子的广泛关注《国家互联网信息办公室关于〈生成式人工智能服务管理办法（征求意见稿）〉公开征求意见的通知》，网络上有一些解读，但是我发现都忽视了一点，就是在 2022 年 11 月 25 日，就在 ChatGPT 要横空出世前不到一周，国家网信办就发布过一则《互联网信息服务深度合成管理规定》（以下简称为《202211 规定》），原文链接：`http://www.cac.gov.cn/2022-12/11/c_1672221949354811.htm`。这两次内容之间的对比，能让我们显著看到网信办在过去小半年的时间里，对哪些方面做了深入研究、推演，整体政策出发点、基调发生了什么变化，因此而释放了什么信号。

上船跑模型之 MacBook 上运行 Vicuna（ShareGPT 微调版 LLaMA-13B）

01 Apr 2023, 杭州 | 麦克船长 | 总计 7284 字

Vicuna 是一个基于 LLaMA 微调的大语言模型。Vicuna-13B 是一个使用 ShareGPT 收集的用户对话数据进行训练的开源 ChatBot。Vicuna 使用 GPT-4 进行评估，其在质量方面已经达到了超过 90% 的 OpenAI ChatGPT 和 Google Bard，同时在超过 90% 的情况下表现优于 LLaMA、Stanford Alpaca。今天跟着船长一起，在你的 MacBook 上把 Vicuna 跑起来！

ChatGPT 插件的十大关注点：OpenAI 定义大模型消费级平台

24 Mar 2023, 北京 | 麦克船长 | 总计 7280 字

北京时间 3 月 24 日凌晨，OpenAI 官方发布了重磅的「ChatGPT plugins」，这将开启大模型作为平台的模式定义、商业化模式定义、插件产品开发热潮、全新的大模型优化（LMO）等等。本文共分三个部分：第一部分先速览几个重要的关注点，尤其是本次插件发布带来的行业影响；第二部分针对本次 OpenAI 官方推出的插件做介绍；第三部分是开发者最关心的第三方插件的支持能力做简述。跟船长出发吧，坐稳了！

上船跑模型之一键运行 Alpaca.cpp：笔记本上就能跑的 LLaMA！

18 Mar 2023, 杭州 | 麦克船长 | 总计 313 字

Alpaca 是 Stanford 的一个研究团队在 LLaMA 基础上用少量语料微调得到的开源模型，GitHub 上的 antimatter15/alpaca.cpp 是其 C++ 一键运行版本

通往 AGI 的阿波罗时刻：极速浏览 GPT-4 技术梗概

15 Mar 2023, 杭州 | 麦克船长 | 总计 10449 字

北京时间 2023 年 3 月 15 日，OpenAI 正式发布 GPT-4 —— 大型多模态模型（Large Multimodal Model），输入支持文本和图像，输出支持文本。OpenAI 花了半年时间用对抗测试程序和 ChatGPT 来迭代对齐 GPT-4，结果上 GPT-4 尽管还有很多能力不及人类，但有些场景已经非常炸裂、拉齐人类水准，比如事实性（Factuality）、可控性（Steerability）、拒绝越界（Refusing to Go Outside of Guardrails）。举例来说，GPT-4 在模拟律师考试中获得了 Top 10% 的成绩（对比 GPT-3.5 是 Bottom 10%）。而船长的一个朋友在和他认识的律师围绕 GPT-3.5 和 GPT-4 的法律案例分析效果对比时，律师给出了极高的评价 ……

开源 LLM 革命之 2：Stanford 研究团队发布基于 LLaMA 微调的 Alpaca 模型，仅花费不到 500 美元

14 Mar 2023, 杭州 | 麦克船长 | 总计 8482 字

Meta 的 LLaMA 模型发布后不久，在 2023 年 3 月 13 日，一个叫 Alpaca 的模型被发布。Alpaca 是一个在 LLaMA-7B 基础上用 5.2 万条的「instruction-following」微调得到的 LLM，由 Stanford 大学的基础模型研究中心（Center for Research on Foundation Models，CRFM）团队发布，训练总花费约不到 600 美元。

上船跑模型之 MacBook 上运行 LLaMA 7B 和 13B 原始模型

12 Mar 2023, 杭州 | 麦克船长 | 总计 3092 字

Meta 推出的 LLaMA 被「开源」了 …… 基于 LLaMA 更高参数利用效率的基础上，我们可以用 ggerganov/llama.cpp 来实现 MacBook 上简单几步，就能运行 LLaMA 7B 和 13B，甚至可以运行在智能手机上 ……

人工智能 LLM 革命破晓：一文读懂当下超大语言模型发展现状

06 Mar 2023, 杭州 | 麦克船长 | 总计 97504 字

人类创造城市，又把它虚拟化；创造机器，又希望机器习得创造。人工智能似乎要来到觉醒的那一刻了。过去数十年，数据科学家研发出了一个又一个 AI 模型，似乎总在重复造轮子。能否通过更便捷有效的方式，真正让机器去统一吸收文本、语音、图片等不同类型的数据和知识并创造出不同的内容呢？多模态预训练大模型打通了模态之间的关系，模型逐步标准化。下一步，则是建立统一的、跨场景、多任务的多模态基础模型。机器从未像今天这般吸收、理解、创造，一个崭新的 AI 大时代即将开启。生成式 AI 显然是机器中的佼佼者。不久前爆火的 ChatGPT，学会了从人类的反馈中强化学习，能你来我往多轮聊天。会对话，也会作画，是基于 diffusion 模型的 AI 绘画，，从最初的拼贴已经进化到三维动画、建模贴图的 next level，甚至 AI 还会自我编码，在 codeforces 举办的编程竞赛中 AlphaCode 超过了 47% 的人类工程师。未来三年，生成式 AI 不但会有越来越多的产品，它的内容创造能力将达到人类水平。

AI 应用第一次大爆发来了：一文入门 ChatGPT 官方 API 文档解读

02 Mar 2023, 杭州 | 麦克船长 | 总计 19446 字

开发人员现在可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。

千日酒：麦克船长在阿里巴巴的第 999 天

27 Feb 2023, 杭州 | 麦克船长 | 总计 414 字

玄石饮酒，一醉千日。酒之美矣，而致醉眠千日，今合醒矣。正视自己的财富与地位，不在虚假繁荣、自圆其说中虚度光阴目标驱动，以终为始，纵情向前。