• 人工智能 LLM 革命黎明:Copilot as a Service 将打造无数超级个体,核心能力是预测与自主 by 麦克船长

    最近对于本轮生成式 AI 浪潮的讨论,进入了一个新阶段,大家从模糊地认为是巨大变革,逐渐开始探讨具体的变革机会点。我想讲讲自己对于本轮技术变革,在 to B 领域的一些基本观点。这些基本观点,是有争议的、非共识的,但我想有必要输出,以换来更多朋友与我的交流碰撞。

  • 人工智能 LLM 革命破晓:一文读懂当下超大语言模型发展现状

    人类创造城市,又把它虚拟化;创造机器,又希望机器习得创造。人工智能似乎要来到觉醒的那一刻了。过去数十年,数据科学家研发出了一个又一个 AI 模型,似乎总在重复造轮子。能否通过更便捷有效的方式,真正让机器去统一吸收文本、语音、图片等不同类型的数据和知识并创造出不同的内容呢?多模态预训练大模型打通了模态之间的关系,模型逐步标准化。下一步,则是建立统一的、跨场景、多任务的多模态基础模型。机器从未像今天这般吸收、理解、创造,一个崭新的 AI 大时代即将开启。生成式 AI 显然是机器中的佼佼者。不久前爆火的 ChatGPT,学会了从人类的反馈中强化学习,能你来我往多轮聊天。会对话,也会作画,是基于 diffusion 模型的 AI 绘画,,从最初的拼贴已经进化到三维动画、建模贴图的 next level,甚至 AI 还会自我编码,在 codeforces 举办的编程竞赛中 AlphaCode 超过了 47% 的人类工程师。未来三年,生成式 AI 不但会有越来越多的产品,它的内容创造能力将达到人类水平。

  • 人工智能 LLM 革命前夜:一文读懂横扫自然语言处理的 Transformer 模型

    基于 RNN 的 Encoder-Decoder 模型存在无法处理过长文本、并行性差的两大痛点。2015 年 Bahdanau 等人在其论文中提出 Attention 机制,再到 2017 年 Transformer 模型的论文《Attention is All You Need》横空出世,其并行速度极快,而且每两个词之间的词间距都是 1。此后 NLP 领域 Transformer 彻底成为主流。如果你已经了解 Encoder-Decoder 模型,本文将基于此带你深入浅出的搞清楚 Attention、Transformer。

  • 你可能已经听说 GPT-3,但是你也不能不知道 BERT —— 跟我一起用 BERT 跑个小用例

    2018 年 Google 发布了 BERT 模型后迅速席卷 NLP 领域,这家伙可是比 ChatGPT 背后的 GPT 还要早的。本文简单介绍了 BERT 后主要是希望大家都手试一下,所以文中提到了一个小的中文模型供大家练手,以及一个小用例。

  • 动动手,让你和你的朋友们,在微信上跟 ChatGPT 聊聊天

    最近 OpenAI 的 ChatGPT 非常地出圈,ChatGPT 是一个由 OpenAI 训练的大型语言模型,被设计用来回答用户的问题并提供信息。官方的 Slogan 是「Optimizing Language Models for Dialogue」,所以非常适合做到 IM 里聊天。那么我在想如果用一个微信号,背后是 ChatGPT,是不是很有趣?正当我准备利用 WeChaty 开发一个服务端程序来连接 ChatGPT 时,发现目前 Github 上已经有人做了,刚好可以省去很多工程的工作 ……

  • 确实惊艳!用 MidJourney 三分钟生成了两张 CG 级高清机甲特写

    因为 Diffusion 模型在计算机视觉领域的发展,可以说今年人工智能在计算机视觉领域大放异彩,各种 Text2Image 项目层出不穷,花了三分钟时间做了一组机甲图,确实非常惊艳 ……

  • 麦克船长的读书笔记:《纳瓦尔宝典》纳瓦尔著

    《纳瓦尔宝典》 埃里克·乔根森 81个笔记

  • 不要船开远了,就忘了为什么启航

    2020 年的 6 月 4 日我入职阿里巴巴集团,7 天后的 6 月 11 日我写下了这篇文章。偶然翻到了当时这篇文章,遂转录于此,提醒自己勿忘初心。在不涉及到公司数据安全及商业机密问题的前提下,稍做了一些删改,发布在这里作为一个回顾。本次穿插了一些图片,当时写的时候还没有这些照片。本文内容包括:很多人是带着梦想来阿里的,那么我的梦想是什么呢?最喜欢新六脉的哪句话?为什么?关于阿里企业价值观:为什么要接受这套价值观?价值观的本质意义(极度务实视角)是什么?Landing 的 SOP;问问自己,来到阿里,如果初期我可能需要做一点改变,那会是什么?

  • 又是一年 Birthday!

  • 【编译】Pathways 语言模型 (PaLM):扩展到 5400 亿个参数以获得突破性性能

    近年来,为语言理解和生成而训练的大型神经网络在广泛的任务中取得了令人瞩目的成果。 GPT-3 首先展示了大型语言模型 (LLM) 可用于少样本学习,无需大规模任务特定数据收集或模型参数更新即可取得令人印象深刻的结果。 最近的 LLM,例如 GLaM、LaMDA、Gopher 和 Megatron-Turing NLG,通过缩放模型大小、使用稀疏激活模块以及在来自更多数据集的更大数据集上进行训练,在许多任务上取得了最先进的小样本结果。 来源多样。 然而,在我们推动模型规模的极限时,要理解小样本学习所出现的能力,还有很多工作要做 ……

  • 如何使用 Jekyll 基于 Github Pages 搭建个人博客

    GitHub Pages 是 GitHub 提供的免费托管静态网站的服务。使用 GitHub Pages 搭建博客,然后使用 Jekyll 生成的静态网站文件上传到该仓库。花 10 分钟时间,通过本文让你快速地实现了一个免费、简单、快速、安全、支持版本控制、支持自定义域名的独立域名博客 ……

  • 欢迎成为「淘宝-天天特卖」团队的创业合伙人!

    阿里内部创业项目「天天特卖」招合伙人啦!以「特卖合伙人」为基石的、以「使众人行」的战友感为人才基本要求、以「用人做事,而非做事用人」为人才建设核心,是天天特卖团队的组织管理理念。天天特卖期待你的加入!

  • 麦克船长的阿里一年香(入职阿里一周年)

    本文记录了麦克船长来到阿里巴巴集团整整一年时,麦克船长的主管给的寄语。考虑到公司商业敏感问题,做了一定的删节。现记录于此,用于以后的回顾。

  • 担任淘宝产品总负责人的双十一,是怎样的体验?

    本文记录了一些影像,是关于麦克船长来到阿里巴巴集团的第一个双十一,负责担任淘宝的总PD(产品总负责人)。一年一度的双十一成了淘宝,乃至整个阿里集团的传统,就像阿里这家公司的春节过年一样,气氛热烈,而且消费者和商家朋友们也都会跟我们一同迎来一次购物与销售的狂欢。

  • 麦克船长的读书笔记:《原则》瑞·达利欧著

    《原则》 瑞·达利欧 281个笔记

  • 疫后怎么做餐饮品牌?三叉戟模式或成标配

    2020 新型冠状病毒疫情,给所有商业领域都带来了巨大影响,而餐饮业可以说是首当其冲,但这同时也带来了很多多元化经营的启示。我们回归原点,餐饮业解决了我们什么需求?吃饭。但是当我们不选择去饭店就餐时,我们如何解决吃饭问题 ……

  • 延迟满足,才有自由

    今天我们来聊聊延迟满足(Delayed Gratification)和即时满足(Instant Gratification)。面对不同的「对手」,我们要做到不同深度的延迟满足。而延迟满足的驻留时间,则量化了我们在相应深度上的延迟满足能力。有意培养,刻意练习,用延迟满足来帮助自我成长,是一个长期课题,我也在路上 ……

  • design | 礼狮™ LISMIS™ 巧可宝 Chocobble [12P]

    产品:礼狮™ LISMIS™ 巧可宝 Chocobble 产地:希腊 麦克船长负责产品研发、总体设计(品牌/VI/包装/视觉)

  • 【编译】Google 发布大型语言模型 BERT

    本文是 Google 发布 BERT 时的官方 blog,让我们站在 2018 年的时间背景下看 BERT 诞生为 NLP 带来的影响。

  • design | 礼狮™ LISMIS™ 盐焗腰果黑巧克力 Dark Chocolate Covered Cashew [3P]

    产品:礼狮™ LISMIS™ 盐焗腰果黑巧克力 Dark Chocolate Covered Cashew 产地:美国 麦克船长负责产品研发、总体设计(品牌/VI/包装/视觉)

  • design | 礼狮™ LISMIS™ 品牌 VI [9P]

    礼狮™ LISMIS™ 品牌 麦克船长负责产品研发、总体设计(品牌/VI/包装/视觉)

  • Andrej Karpathy 提出 Software 2.0

    原文链接:https://karpathy.medium.com/software-2-0-a64152b37c35 中文翻译:AI & 麦克船长校对

  • 人工智能这一大波,什么样的公司值得投资?(首发雪球 2016)

    看到有些朋友,没太高清人工智能对于二级市场哪些公司的股票有什么影响,我作为科技行业的从业者,稍作一下解释。本文主要讨论的是美股,以及什么样的公司值得关注。适宜阅读人群是对人工智能了解较少的朋友。

  • 未来人工智能就是要:让普通人过上现在富豪们的生活

    有很多领域,需要专业人士面对具体的问题,给出个性化的解决方案。想获取这些个性化的解决方案,就要用金钱作为交换代价。而人工智能(Artificial Intelligence)真正能够发挥巨大作用的,恰恰就是这些领域 ……

  • 我们是应该「断舍离」还是「念念不忘,必有回响」

    如果对某事、某人、某物的执念,会对我们的人生产生负反馈,我们就应该对此事、此人、此物「断舍离」;相反,如果是正反馈,则应该「念念不忘」 ……

  • 美股短线做多的九点心得 by 麦克船长(首发雪球 2016)

    进入美股两年,目前只做短线,有了一点点心得。在此记录几个我个人的交易习惯。目前只有股票做多的经验,对做空、期权这些还不敢说总结出什么经验。

  • 我是平民

    今天刚刚打通关《This War of Mine》这款游戏,当我还沉浸在这款游戏给我留下的伤感时,打开「爱奇艺」看到了一个叫做《被破坏的城市》电影特辑,而里面就收录了一部叫做《科洛夫档案》的电影。

  • design | 游戏美术 Interstaller Colonial Agency [4P]

    游戏名称:Interstaller Colonial Agency 游戏类型:Turn-based Stategy Game 发行平台:iOS 策划&美术:麦克船长

  • design | Club APP [12P]

  • 人得自个儿成全自个儿

    因为爱,我们要好好活着。我不清楚他为什么离开这个世界,我想他可能看到了一些只属于他自己世界里的东西。终归,这个世界不会成全你,人得自个儿成全自个儿。

  • 麦克船长的 OpenRTMFP/Cumulus 原理、源码及实践 9:关键线程逻辑分析

    本文是麦克船长《OpenRTMFP/Cumulus 原理、源码及实践》系列文章的其中一篇,相关内容最初首发于 CSDN 的 Poechant 技术博客,后整理于本博客。本文对 RTMFPServer 线程、RTMFPManager 对 RTMFPServer 的影响进行源码解读。

  • 麦克船长的 OpenRTMFP/Cumulus 原理、源码及实践 8:经由服务器的 Pub/Sub 流程的关键点

    Flash 客户端通过 NetConnection 与 Cumulus 建立连接,然后通过 NetStream 使用 RTMFP 发布 Audio/Video/Data(下面简称为 A/V/D) 给服务器,这个 Flash Player 就作为一个发布者(Publisher)。RTMFP 服务器接收到后给所有的订阅者(Subscribers)发送 Audio/Video/Data。本文将介绍如何经由服务器实现 Pub/Sub 流程。

  • 麦克船长的 OpenRTMFP/Cumulus 原理、源码及实践 7:Cumulus 源码的一个线程启动 Bug 及修复方法

    本文是麦克船长《OpenRTMFP/Cumulus 原理、源码及实践》系列文章的其中一篇,相关内容最初首发于 CSDN 的 Poechant 技术博客,后整理于本博客。Cumulus 启动后,我们可以看到有多个线程被创建,但是有时其中的个别线程没有被成功启动,本文将告诉你如何修复并解决。