-
别焦虑,软件工业远没到终局:Code-Editing Agent 只是中间态,Product-Editing Agent 才是未来
今天的 Coding Agent 只是软件工程变革的中间态。代码更像工程文件,而不是人类真正想编辑的对象。未来更有价值的方向,是从 Code-Editing Agent 走向 Product-Editing Agent……
-
fcp:写给人和 AI Agent 用的 Final Cut Pro 命令行
final-cut-pro-cli 是我给 Apple Final Cut Pro 写的命令行工具。它不是要替代 FCP UI,而是把剪辑准备阶段里 Library、Event、Project、Media、Clip 这些可脚本化操作,变成给人和 AI Agent 都能稳定调用的接口……
-
dvr:写给人和 AI Agent 用的 DaVinci Resolve 命令行
dvr 是我给 DaVinci Resolve 18+ 写的一个开源 Python 命令行——既给人用,也给 AI Agent 用。本文带你 5 分钟上手,并讲讲几个 Agent-first 的设计决定……
-
从《文明》的回合到《星际》的实时:AI 产品形态正在经历的范式迁移
30 多年前,策略游戏从《文明》走到《星际》,完成了一次从回合制到实时制的范式迁移。今天 AI 行业也在走同一条路——从 TBM 到 RTM。我们做的 PACE 引擎就是视频编辑场景的 RTM……
-
除夕前的 48 小时极限:在「僵尸号」上用 AI 拿到了 5K+ 赞,并总结出未来四层视频创作模式
本文是麦克船长关于 AI 视频创作的实战复盘。记录了大年二十八、二十九这两天,如何利用 Gemini、Claude Code、Nano Banana 和 Seedance 等 AI 工具链进行 48 小时极限创作,并在大年初一实现账号冷启动爆发,全网累积获得超过 3000 赞的经历 ……
-
先进生产力与创造价值的衡量原则
创造有很高的优先级,但"创造"的价值和方向应该怎么衡量和判断呢?从 ChatGPT、黑神话悟空、电动汽车等发展来看,先进生产力的发展方向、先进文化的发展方向就应该是优先考虑的方向。追随、开拓甚至引领这样的方向,就是衡量创造价值的基本原则。
-
要做 Human-AI Cocreation,而不是一键/一句话 XXX
在创作生产力领域,做 Human-AI Cocreation 产品的价值,远远大于一键/一句话 XXX 类产品。
-
从生成影像到「生成世界」—— Google DeepMind Genie 3 打开世界模型的交互时代
Google DeepMind 于北京时间 2025 年 8 月 6 日凌晨正式推出了其新一代通用世界模型 `Genie 3`,该模型能够基于文本提示实时生成交互式虚拟环境,并以每秒 24 帧、720p 分辨率的速度保持数分钟的一致性和高保真度。作为世界模型研究的最新里程碑,`Genie 3` 不仅在生成环境的一致性和逼真度上大幅提升,更首次支持了实时人机交互,为通向通用人工智能(AGI)奠定了坚实基础。
-
解读 Claude Opus 4.1:混合推理的前沿跃迁
北京时间 8 月 6 日凌晨,Anthropic 悄然上线新版旗舰模型 ``Claude Opus 4.1``,并同步更新 API、Bedrock、Vertex AI 三大平台与 Claude Code。虽然官方在博客中将其定位为 「``Opus 4`` 的渐进式升级」,但从多维基准与系统卡细节来看,这次版本号仅「加 0.1」的更新,实则在编码、长程代理任务与安全调优上完成了多项关键突破,为 2025 年下半年大模型竞技赛再添变量。
-
时隔六年再开源,OpenAI 发布两款语言模型,主打端侧场景
距离 OpenAI 上一次开源语言模型已经过去了 6 年 —— 北京时间 2025 年 8 月 6 日凌晨 00:22,美国人工智能公司 OpenAI 在官网发文,声称发布两款开放权重推理模型 ``gpt-oss-120b`` 和 ``gpt-oss-20b``,也是 ``GPT-2`` 之后的第一个开放权重语言模型。
-
【摘录】Livemore:华尔街不会改变,人性不会改变
杰西·劳里斯顿·李佛摩(Jesse Lauriston Livermore),1877 年 7 月 26 日 — 1940 年 11 月 28 日,华尔街著名金融家,被《时代》杂志形容为「最活跃的美国股市投机客(the most fabulous living U.S. stock trader)」。以下是他的言论摘录。
-
趋势量化之 Event-Driven 1:上市公司发行可转债有什么影响(持续更新)
可转债(Convertible Bond,简称 CB),即可转换债券(或可换股债券),可按一定规则转换为债券发行公司的股票。其转换价格、转换时间段会在发行前确定。
-
【摘录】投资的道路上不存在捷径,但如果向成功的投资大师学习,可以少走很多弯路。
原文链接:https://mp.weixin.qq.com/s/U8YsBlMOtj98LeTxXOPigQ?global_content=%7B%22promote_id%22%3A13766%2C%22sub_promote_id%22%3A4%7D
-
人工智能 LLM 革命黎明:Copilot as a Service 将打造无数超级个体,核心能力是预测与自主 by 麦克船长
最近对于本轮生成式 AI 浪潮的讨论,进入了一个新阶段,大家从模糊地认为是巨大变革,逐渐开始探讨具体的变革机会点。我想讲讲自己对于本轮技术变革,在 to B 领域的一些基本观点。这些基本观点,是有争议的、非共识的,但我想有必要输出,以换来更多朋友与我的交流碰撞。
-
【摘录】投资中的节奏与结构 | 42章经
从第一篇经典的 投资中的信号与噪声 以来,绿洲资本合伙人张津剑已陆续在 42章经 发表了三篇原创文章(其余两篇为 投资决策中的信噪比 和 投资中的周期与载波)。这三篇文章从 2018 年至今,可谓是横跨了周期,也启发了很多投资行业的从业者。
-
麦克船长解读 LIMA 的表面对齐假设:少量多样性、高质量数据即可实现更好的对齐
在这篇论文中,作者使用这个测试数据集来评估他们的模型 LIMA(Less Is More for Alignment)的性能,并将其与其他的语言模型进行比较。他们发现,尽管 LIMA 只在1000个示例上进行了微调,但它的性能仍然优于其他的语言模型。
-
麦克船长的全栈指南:Google Flutter 开发跨平台 APP
在一个人就是一支队伍的时代里(在 AI 急速发展的推动下,未来会越来越趋于《未来简史》所描述的「半神」),产品、运营还是工程,最好都要会一些前端,这样方便自己做一点东西便于提高日常的生产力。今天介绍的是 2018 年开始的 Google Flutter 跨多平台终端的技术,支持 iOS、Android、Web、macOS、Linux、Windows ……
-
【摘录】我国城乡二元结构的由来
美国作为互联网乃至科技行业的全球领导者,始终还是中国互联网及科技发展的关键参照物。两者相比,中国有很多独特的宏观因素导致无法使用 Time Machine 来照搬美国,同时目前前沿领域两者的时间差也已经非常小了(这非常不同于 PC 互联网浪潮),所以即便有 Time Machine 有效性也没那么充足了(尽管仍然有一定参考价值)。这其中有一个关键特征,就是中国的城乡二元经济结构,受此影响最显著的科技有公司比如拼多多
-
麦克船长:理解和重塑 AI 时代的八个一切 / The Eight ALLs for Understanding and Shaping the AI Era
As a product manager focusing on the AI field, I often find ourselves constrained by current product forms, making it difficult to think about truly AI-native products. While pondering on how to build AI-native products, I have summarized the following eight points.
-
对比解读半年两次 AI 监管条例 10 点变化:从强调自律到鼓励创新,支持发展定调!
近日一条通知引起了 AI 圈子的广泛关注《国家互联网信息办公室关于〈生成式人工智能服务管理办法(征求意见稿)〉公开征求意见的通知》,网络上有一些解读,但是我发现都忽视了一点,就是在 2022 年 11 月 25 日,就在 ChatGPT 要横空出世前不到一周,国家网信办就发布过一则《互联网信息服务深度合成管理规定》(以下简称为《202211 规定》),原文链接:`http://www.cac.gov.cn/2022-12/11/c_1672221949354811.htm`。这两次内容之间的对比,能让我们显著看到网信办在过去小半年的时间里,对哪些方面做了深入研究、推演,整体政策出发点、基调发生了什么变化,因此而释放了什么信号。
-
上船跑模型之 MacBook 上运行 Vicuna(ShareGPT 微调版 LLaMA-13B)
Vicuna 是一个基于 LLaMA 微调的大语言模型。Vicuna-13B 是一个使用 ShareGPT 收集的用户对话数据进行训练的开源 ChatBot。Vicuna 使用 GPT-4 进行评估,其在质量方面已经达到了超过 90% 的 OpenAI ChatGPT 和 Google Bard,同时在超过 90% 的情况下表现优于 LLaMA、Stanford Alpaca。今天跟着船长一起,在你的 MacBook 上把 Vicuna 跑起来!
-
ChatGPT 插件的十大关注点:OpenAI 定义大模型消费级平台
北京时间 3 月 24 日凌晨,OpenAI 官方发布了重磅的「ChatGPT plugins」,这将开启大模型作为平台的模式定义、商业化模式定义、插件产品开发热潮、全新的大模型优化(LMO)等等。本文共分三个部分:第一部分先速览几个重要的关注点,尤其是本次插件发布带来的行业影响;第二部分针对本次 OpenAI 官方推出的插件做介绍;第三部分是开发者最关心的第三方插件的支持能力做简述。跟船长出发吧,坐稳了!
-
上船跑模型之一键运行 Alpaca.cpp:笔记本上就能跑的 LLaMA!
Alpaca 是 Stanford 的一个研究团队在 LLaMA 基础上用少量语料微调得到的开源模型,GitHub 上的 antimatter15/alpaca.cpp 是其 C++ 一键运行版本
-
通往 AGI 的阿波罗时刻:极速浏览 GPT-4 技术梗概
北京时间 2023 年 3 月 15 日,OpenAI 正式发布 GPT-4 —— 大型多模态模型(Large Multimodal Model),输入支持文本和图像,输出支持文本。OpenAI 花了半年时间用对抗测试程序和 ChatGPT 来迭代对齐 GPT-4,结果上 GPT-4 尽管还有很多能力不及人类,但有些场景已经非常炸裂、拉齐人类水准,比如事实性(Factuality)、可控性(Steerability)、拒绝越界(Refusing to Go Outside of Guardrails)。举例来说,GPT-4 在模拟律师考试中获得了 Top 10% 的成绩(对比 GPT-3.5 是 Bottom 10%)。而船长的一个朋友在和他认识的律师围绕 GPT-3.5 和 GPT-4 的法律案例分析效果对比时,律师给出了极高的评价 ……
-
开源 LLM 革命之 2:Stanford 研究团队发布基于 LLaMA 微调的 Alpaca 模型,仅花费不到 500 美元
Meta 的 LLaMA 模型发布后不久,在 2023 年 3 月 13 日,一个叫 Alpaca 的模型被发布。Alpaca 是一个在 LLaMA-7B 基础上用 5.2 万条的「instruction-following」微调得到的 LLM,由 Stanford 大学的基础模型研究中心(Center for Research on Foundation Models,CRFM)团队发布,训练总花费约不到 600 美元。
-
上船跑模型之 MacBook 上运行 LLaMA 7B 和 13B 原始模型
Meta 推出的 LLaMA 被「开源」了 …… 基于 LLaMA 更高参数利用效率的基础上,我们可以用 ggerganov/llama.cpp 来实现 MacBook 上简单几步,就能运行 LLaMA 7B 和 13B,甚至可以运行在智能手机上 ……
-
人工智能 LLM 革命破晓:一文读懂当下超大语言模型发展现状
人类创造城市,又把它虚拟化;创造机器,又希望机器习得创造。人工智能似乎要来到觉醒的那一刻了。过去数十年,数据科学家研发出了一个又一个 AI 模型,似乎总在重复造轮子。能否通过更便捷有效的方式,真正让机器去统一吸收文本、语音、图片等不同类型的数据和知识并创造出不同的内容呢?多模态预训练大模型打通了模态之间的关系,模型逐步标准化。下一步,则是建立统一的、跨场景、多任务的多模态基础模型。机器从未像今天这般吸收、理解、创造,一个崭新的 AI 大时代即将开启。生成式 AI 显然是机器中的佼佼者。不久前爆火的 ChatGPT,学会了从人类的反馈中强化学习,能你来我往多轮聊天。会对话,也会作画,是基于 diffusion 模型的 AI 绘画,,从最初的拼贴已经进化到三维动画、建模贴图的 next level,甚至 AI 还会自我编码,在 codeforces 举办的编程竞赛中 AlphaCode 超过了 47% 的人类工程师。未来三年,生成式 AI 不但会有越来越多的产品,它的内容创造能力将达到人类水平。
-
AI 应用第一次大爆发来了:一文入门 ChatGPT 官方 API 文档解读
开发人员现在可以通过 API 将 ChatGPT 和 Whisper 模型集成到他们的应用程序和产品中。
-
千日酒:麦克船长在阿里巴巴的第 999 天
玄石饮酒,一醉千日。酒之美矣,而致醉眠千日,今合醒矣。正视自己的财富与地位,不在虚假繁荣、自圆其说中虚度光阴目标驱动,以终为始,纵情向前。
-
开源 LLM 革命之 1:Meta 推出开源 LLaMA,用 1/10 参数规模打败 GPT-3,群"模"乱舞的 2023 拉开序幕
北京时间 2023 年 2 月 25 日 Meta AI 在其官网公开发布了 LLaMA(Large Language Model Meta AI)大型语言模型,包括 70 亿、130 亿、330 亿、650 亿 4 种参数规模,旨在推动 LLM 领域的小型化、平民化研究。Guillaume Lample 在其 Twitter 上声称:LLaMA 130 亿参数版本的表现,在大多数测试上优于 OPT 和 GPT-3 1750 亿参数版,650 亿的版本表现基本可以比肩 Chinchilla 700 亿参数、PaLM 5400 亿参数这些大模型。