【编译】当下生成式 AI(AIGC)领域的应用图景
本文译自 Antler Blog,原作者 Ollie Forsyth,中文译文由 AI 及麦克船长完成翻译。
随着 ChatGPT 和 DALL-E 的发布,2022 年社交媒体平台上最热门的话题之一在最近几周爆发,引发了关于其对全球人员、职业和行业影响的激烈辩论。 争议的核心是什么? 生成式 AI (Gen-AI)——可以快速创建新内容的系统,例如大学论文、歌曲和数字艺术作品。 这些能力令人印象深刻,但它们也引发了关于工作的未来以及人类在 AI 主导的世界中的作用的重要问题。 随着生成式人工智能的不断发展,考虑伦理意义和对社会的潜在影响将变得至关重要。 如果创造性工作在很大程度上被人工智能机器取代,会发生什么?
本文目录
- 什么是 Gen-AI?
- 人工智能与生成人工智能
- 广阔的机遇正在展开
- Gen-AI的影响
- 培训模型在实践中如何运作?
- 语言模型是如何创建的?
- 为什么 Gen-AI 存在?
- 展望未来——Gen-AI收入模式
- 为什么现在?
- Gen-AI筹款格局
- Gen-AI独角兽格局
- 趋势:
- 这个空间的未来是什么,它可能面临什么挑战?
- Gen-AI 将影响元宇宙——具体如何影响还有待观察。
- 让我们一起塑造未来
- 参考链接
这份报告深入探讨了 Gen-AI 的世界,并且是第一份面向所有人的综合市场地图。 我们概述了该领域的 160 多个平台及其投资者,以及领先思想领袖对这项技术潜力的见解。 这为读者提供了一个独特的机会,可以全面了解生成人工智能市场以及新玩家挑战谷歌等老牌玩家的潜力。
“生成式 AI 是一项基础技术,并且与这些新平台一样,它带来的机会很多——我们已经过了‘如果’的阶段,我们正处于‘何时’和‘如何’的阶段。” 随着 LLM 开源,我们看到基础设施层日趋成熟和民主化,这加速了应用层。”——Irina Elena Haivas,Atomico 的投资者和合伙人
请注意:本文提供的信息基于 Antler 的零投资日方法和我们为全球创始人提供的支持。 我们行业地图中的特色平台来自 Crunchbase。 值得注意的是,其中一些平台可能与 AI 和 Gen-AI 相交。 如果您认为您的平台应该包含在我们未来的映射中,请通过 Ollie.Forsyth@antler.co 与我们联系。
什么是 Gen-AI?
想象这样一个世界,您可以使用生成式辅助工具在几分钟内完成您的项目,而不是花几天时间写一篇博客文章、一周时间创建演示文稿或几个月时间写一篇学术论文。 这些工具不仅帮助我们完成项目,还支持我们做出更好的决策。
以下是 Gen-AI 平台可能变得多么强大的一个例子:对于那些熟悉我们关于创作者经济的报告的人来说,想象一个世界,在这个世界里,创作者可以将他们的内容上传到任何语言,并用他们自己的声音作为画外音,而不是依赖 在机器人或本地翻译器上。 这是一个美丽的新世界,在这里我们可以获得强大的工具,可以节省我们无数的时间并提高我们的工作效率。
“我们正处于生成人工智能的转折点,原因有二:计算机可以比以往任何时候都更好地创造,而且人们与它们的互动从未如此简单。”——Molly Welch,Radical Ventures 的投资者。
“在 Media Monks,我们相信生成式 AI 将对我们的行业产生重大影响,尽管很难想象这项惊人技术的真正范围。 我们研究生成式人工智能已有大约五年时间,创新速度呈指数级增长。 技术的进步发生在我们的生产时间表内,范围从 1 到 6 个月不等。 这意味着我们在项目开始时使用的工具在我们上线时已经过时了。” — Media Monks 的创意 AI 设计师兼工程师 Samuel Snider Held。
人工智能与生成人工智能
人工智能 (AI) 是一个广义术语,指的是任何能够实现智能行为的技术。 这可能包括范围广泛的技术,从可以对数据进行排序的简单算法,到可以模仿类人思维过程的更先进的系统。
另一方面,生成式人工智能 (Gen-AI) 是一种特定类型的人工智能,专注于生成新内容,例如文本、图像或音乐。 这些系统在大型数据集上进行训练,并使用机器学习算法生成与训练数据相似的新内容。 这在各种应用程序中都很有用,例如创作艺术、音乐,甚至为聊天机器人生成文本。
从本质上讲,人工智能是一个广义的术语,涵盖了许多不同的技术,而生成人工智能是一种专注于创造新内容的特定类型的人工智能。
广阔的机遇正在展开
未来,Gen-AI 很可能会对创意产业产生重大影响。 虽然一些创意可能会被 Gen-AI 系统取代,但其他创意可能会找到新的机会来使用这些系统或创建由 Gen-AI 支持的内容。 在许多情况下,它实际上可以增强创意人员的工作,使他们能够创建更加个性化或独特的内容,或者产生新的想法和概念,如果不使用 AI,这些想法和概念可能是不可能的。
Gen-AI 对创意人员的一个潜在好处是,它可以使他们能够更快、更高效地创建内容。 例如,作家可以使用 Gen-AI 系统生成文章或故事的草稿,然后他们可以对其进行编辑和完善。 这可以节省时间并让创意人员专注于工作中最重要的方面。
“生成式 AI 是一股巨大的浪潮,它将在几乎所有行业中产生不可避免的涟漪,对于其中的绝大多数,我们认为这将带来难以置信的增值。我们看到了最大的机会,因为平台是建立在基础之上的 模型,其中用户体验、可访问性和嵌入性将成为这场比赛的关键差异化因素。所有这些都需要由杀手级的上市战略提供动力,最重要的是,速度!下半年将是关键。” ——Stephanie Chan,Samaipata Ventures 投资人。
Gen-AI的影响
根据使用方式的不同,这项技术可能会产生许多不同的影响。 例如,Gen-AI 可用于创建新的内容,如音乐或图像,这些内容可用于多种用途,例如为创意者提供更多的灵活性和想象力。 它还可用于通过生成新的训练数据来改进机器学习算法。 总的来说,Gen-AI 的影响肯定是巨大的,因为它有潜力创造新的有用内容并提高机器学习系统的性能。
“我们正在走向人工智能广泛应用的时代。 但广泛可用和实际可用于实现业务成果是两件截然不同的事情。” —Dave Rogenmoser,Jasper 的首席执行官兼联合创始人。
培训模型在实践中如何运作?
Gen-AI 训练模型通过从大量示例数据集中学习并使用该知识生成与训练数据集中示例相似的新数据来工作。 这通常是使用一种称为生成模型的机器学习算法来完成的。有许多不同类型的生成模型,每种模型都使用不同的方法来生成新数据。 一些常见类型的生成模型包括生成对抗网络 (GAN)、变分自动编码器 (VAE) 和自回归模型。
例如,在人脸图像数据集上训练的生成模型可能会学习人脸的一般结构和外观,然后使用这些知识生成新的、以前未见过的看起来真实可信的人脸。
生成模型用于各种应用程序,包括图像生成、自然语言处理和音乐生成。 它们对于手动生成新数据困难或昂贵的任务特别有用,例如在为产品创建新设计或生成逼真的语音的情况下。
“这些新的基础模型以及建立在其上的应用程序加快了许多行业的步伐:为游戏和社交媒体公司生成创意内容,自动化企业内部的手动流程,帮助扩大以前无法想象的业务,如电影、音乐和漫画制作—— 可能性是无限的。”——Manjot Pahwa,Lightspeed Venture Partners 的投资者
语言模型是如何创建的?
创建语言模型的方法有多种,但最常见的方法是使用机器学习算法在现有文本的大型数据集上训练模型。 此过程通常包括以下步骤:
- 收集现有文本的大型数据集。 此数据集应代表您希望模型能够生成的语言或文本样式。
- 预处理文本数据以清理并准备训练。 这通常涉及将文本标记为单个单词或短语,并将所有单词转换为小写。
- 在预处理的文本数据上训练机器学习算法。 这可以使用多种算法来完成,包括递归神经网络 (RNN) 和长短期记忆 (LSTM) 网络。
- 通过调整模型的参数和超参数以及在必要时使用额外的训练数据来微调训练模型。
- 通过使用经过训练的模型生成示例文本并评估结果来测试模型。 这可以通过将生成的文本与原始训练数据进行比较,或使用其他指标(例如困惑度或 BLEU 分数)来完成。
- 通过重复步骤 4 和 5 来优化模型,直到生成的文本具有高质量并匹配所需的语言或样式。
“重要的是要注意,创建语言模型需要大量的计算资源和机器学习方面的专业知识——尽管这个空间还很早,但平台正在花费数百万美元来微调他们的产品和服务。
生成式 AI 类别的创始人当前面临的挑战不仅是要构建产品,还要构建具有持久能力的可防御商业模型。 任何有能力的开发人员都可以围绕这些底层生成引擎包装应用程序皮肤。 解决方案是通过嵌入网络效应、提高转换成本、根深蒂固的产品合作伙伴关系等策略,整合可持续的竞争差异化。”——David Beisel,NextView Ventures 合伙人。
为什么 Gen-AI 存在?
Gen-AI 的存在是因为它有可能解决许多重要问题,并为广泛领域的无数新机遇打开大门。 Gen-AI 成为一个不断发展的研发领域的一些关键原因包括:
- Gen-AI 可以创造新的内容。 Gen-AI 的主要优势之一是它能够生成新内容,例如文本、图像或音乐。 这可用于创造新的艺术、音乐和其他形式的创造性表达,并生成用于训练机器学习模型的数据。
- Gen-AI 可以提高效率和生产力。 通过自动生成内容,Gen-AI 可以帮助节省时间并减少人工劳动。 这可以提高各个领域的效率和生产力,从新闻和内容创建到数据注释和分析。
- Gen-AI 可以提高生成内容的质量。 随着机器学习和自然语言处理的进步,Gen-AI 变得越来越复杂,能够生成人类难以与真实内容区分开来的高质量内容。
- Gen-AI 可以启用新的应用程序和用途。 Gen-AI 创造新内容的能力为新的应用和用途开辟了许多可能性。 例如,它可用于创建个性化体验,例如个性化新闻文章或个性化音乐推荐。
“这并不广为人知。 我的观点是,生成式 AI 模型现在很神奇,因为它们已经能够通过语言接收人们的输入。因为它们能够代表如此多的不同概念——并将它们结合起来——它们可以产生美丽、狂野和创造性的结果。 这令人兴奋、激动,也许还有点可怕。 对于创意人员来说,这意味着通过灵感来寻找灵感,更快地创建原型,并结合模型 (Photoshop++) 的技能来完善作品。’’——Sharon Zhou。
展望未来——Gen-AI收入模式
使用 Gen-AI 技术的公司有几种潜在的收入模式。 一些可能的收入来源包括:
- 将技术许可给可以使用它来改进其产品或服务的其他公司或组织。
- 将 AI 系统的输出(例如生成的图像、视频或文本)出售给可以将它们用于各种目的的客户。
- 提供对人工智能系统的访问作为订阅服务,客户可以使用它来生成自己的输出
- 使用 AI 系统提高公司现有产品或服务的效率或有效性,然后向客户收取这些增强产品的费用。
- 创建利用 AI 系统功能的新产品或服务,并将其直接销售给客户。
为什么现在?
现在是 Gen-AI 时代的几个原因。 首先,机器学习和自然语言处理的进步使人工智能系统能够生成高质量的、类似人类的内容。 其次,艺术、营销和娱乐等领域对个性化和独特内容的需求不断增长,增加了对 Gen-AI 平台的需求。 第三,大量数据和强大计算资源的可用性使得大规模训练和部署这些类型的模型成为可能。
“人们曾承诺人工智能将改变世界,自 2012 年以来我们一直在等待。在过去的两三年里,终于发生了一些变化。 虽然最近围绕生成 AI 的兴奋一直是文本到图像,但我相信 AI 驱动的文本生成将被证明更具变革性。 现在,随着越来越多地使用尖端语言模型,我们看到这项技术扩散到日常产品中——彻底改变了公司开展业务的方式,并重新构想了人类体验技术的方式。”——Aidan Gomez,Cohere 联合创始人兼首席执行官。
阅读我们的 Gen-AI 初创公司完整列表(定期更新)
Gen-AI 类别说明:
- 文本:总结或自动化内容。
- 图像:生成图像。
- 音频:总结、生成或转换音频中的文本。
- 视频:生成或编辑视频。
- 代码:生成代码。
- 聊天机器人:自动化客户服务等。
- 机器学习平台:应用程序/机器学习平台。
- 搜索:人工智能驱动的洞察力。
- 游戏:Gen-AI 游戏工作室或应用程序。
- 数据:设计、收集或总结数据。
Gen-AI筹款格局
由于许多投资者专注于 Gen-AI 领域,我们列出了最活跃的投资者:
少数投资于 Gen-AI 领域的投资者。 这些投资者也可能投资于后期或早期阶段的公司。
Gen-AI独角兽格局
尽管该行业仍在兴起,但一些独角兽已经出现。 到目前为止,2019 年生产了两只独角兽,2020 年生产了一只,2022 年生产了四只。
趋势:
Gen-AI 如何用于艺术和音乐?
Gen-AI 正以几种不同的方式用于艺术和音乐。 一个常见的应用是使用生成模型来创造新的艺术和音乐,方法是从头开始生成全新的作品,或者以现有作品为起点并向其中添加新元素。 例如,生成模型可能会在大型绘画数据集上进行训练,然后用于生成与数据集中的作品相似但又独特且原创的新绘画。
Gen-AI 如何用于游戏?
Gen-AI 正以多种方式用于游戏,包括创建新的关卡或地图、生成新的对话或故事情节,以及创建新的虚拟环境。 例如,游戏可能会使用 Gen-AI 模型来创建一个新的、独特的关卡,供玩家在每次玩游戏时探索,或者根据玩家的动作为非玩家角色生成新的对话选项。 此外,Gen-AI 可用于创建新的、逼真的虚拟环境供玩家探索,例如城市、森林或行星。 总的来说,它可以用来为游戏体验增加一定程度的活力和多样性,使它们对玩家来说更具吸引力和身临其境。
‘“一般而言,短期的创新领域会非常积极。 众所周知,游戏和在线 3D 体验难以构建——生成式 AI 将彻底颠覆这一现状,让游戏资产的创建变得更加容易。 在游戏中应用生成式 AI 的潜在缺点,或者更确切地说是后果,更为现实。 虽然像 AI 生成的文案或图像创建这样的单维应用程序只是我们执行的现有任务的放大器,但仍然允许我们控制输出的应用程序(即,我们可以决定接受/拒绝一份副本并决定在哪里 使用副本),我们在游戏中与 AI 的交互将更加多维。 随着时间的推移,AI(无论是环境、行为还是 NPC 角色)将进化并适应人类的注意,同样,人类将习惯于在这些 AI 生成的领域中进行社交和定期互动。”——Roblox 的 Annie Zhang。
生成式 AI 将会如何影响创作者经济?
创作者经济已经是一个价值 1000 亿美元的行业,正准备持续颠覆,Gen-AI 可能会对创意产生重大影响,尤其是那些创作音乐、艺术或写作的人。 然而,它确实为创作者提供了从第一天起就走向全球的机会,允许他们的内容使用创作者的声音转化为任何语言,或者将他们的创造力转化为更具吸引力的内容。
“生成式 AI 会将创作者变成超级英雄,并扩大他们不那么强大的领域。更多地将其视为创作者的副驾驶,而不是创作者的替代者。” ——Jim Louderback,Inside The Creator Economy 的作者。
为了让创作者经济取得成功,平台需要适应创作者的个性,以便在内容可能主要由 AI 平台支持时,创作者与他们的粉丝建立某种形式的联系。
“我认为人的因素对于艺术具有价值是必不可少的。 当 AI 生成的艺术是由算法和机器创造的,而不是由具有自己的经验、情感和观点的个人创造时,它可以被视为缺乏通常被视为伟大艺术必不可少的真实性和人性。 这可能会使一些观众难以在情感层面上与 AI 生成的艺术产生联系,从而降低其影响力和重要性。”——创作者 Ivona Tau。
然而,当我们问创作者 Gen-AI 将对他们产生什么影响时,一位创作者说:
“不多。 也就是说,我正怀着极大的兴趣关注正在发生的事情。 其他人在生成模型的帮助下获得的结果让我深受启发。 你经常听到艺术家将 AI 图像模型称为“工具”,但 AI 不仅仅是一种工具。 它是创意伙伴、合成精灵或鼓舞人心的盟友。”——艺术家詹姆斯·格尼 (James Gurney)。
这个空间的未来是什么,它可能面临什么挑战?
Gen-AI 面临许多挑战,包括提高这些模型产生的输出的质量和多样性,提高它们生成输出的速度,并使它们更加健壮和可靠。 另一个主要挑战是开发生成式 Gen-AI 模型,这些模型能够更好地理解和整合他们正在处理的数据的底层结构和上下文,以便产生更准确和连贯的输出。 此外,对于生成式人工智能的伦理和社会影响,以及如何确保以负责任和有益的方式使用这些技术,也存在持续的担忧。
让我们仔细看看其中的一些问题:
版权。 截至今天,要了解这些平台如何识别真实的原始来源或艺术作品的来源是一项挑战——这些模型是由数亿个数据点训练的。 创作者担心这些平台将如何减轻对创作者作品的版权侵权。 正如我们在 Lauryn Ipsum 发布的最近一个案例中看到的那样,Lensa 应用程序中使用的图像具有原始艺术家签名的背景。
“目前生成人工智能中最紧迫的问题之一是系统可信度。 像 OpenAI 的 ChatGPT 这样的大型语言模型很容易分享不正确或错误的响应。 在图像生成中,系统已经接受了大量图像的训练,系统输出存在版权和知识产权问题,使企业用户不确定将它们集成到产品或工作流程中。”——Molly Welch,Radical Ventures 的投资者。
学生写论文。 随着这些平台变得更加智能,精明的年轻学生将在日常生活中采用它们。 这将如何影响他们的学术工作,他们的教授将如何确定这是否真的是他们的工作? Gen-AI 将对教育领域产生巨大影响,这还有待观察。
“假设 ChatGPT 模型不断改进,学生使用 chatGPT 来补充学习的机会是无穷无尽的。 学生可以使用它来生成测验和抽认卡的内容,以帮助他们学习、优化现有代码,甚至为学习指南编写摘要。 这里的关键词是补充。 除了他们自己已经投入的原创作品之外,学生还应该使用 ChatGPT。当学生使用 ChatGPT 内容代替他们的作品,甚至提交 ChatGPT 内容作为他们自己的原创想法时,ChatGPT 可能会出现问题。 大学行政部门和学生需要共同努力制定政策,明确说明这个新世界可以接受的内容。 上周我参加了一次开卷考试,明确禁止使用 ChatGPT 或任何其他人工智能支持。” —Cherie Lou,斯坦福大学的创作者和学生。
虚假信息与错误信息。尽管这些系统非常聪明,但有时它们不可避免地会提供错误信息。 例如,最近在英国第 4 频道的一次采访中,主持人向 Open AI 询问他的职业道路,聊天机器人助手给出了不准确的信息。 随着训练模型变得更具适应性并更多地了解我们,最终算法中的错误将会减少。
Gen-AI 的缺点包括:
- 如果训练数据不够多样化或不够具有代表性,则生成的数据存在偏差风险。
- 对生成人工智能在某些行业取代人类劳动的潜力的担忧,导致失业。
- Gen-AI 被用于恶意目的的可能性,例如制造假新闻或冒充个人。
Gen-AI 有可能取代从设计师到制作人再到艺术家的数百万个工作岗位; 但是,创意总是会在某些方面存在。
Gen-AI 将影响元宇宙——具体如何影响还有待观察。
很难准确预测生成式 AI 将如何影响元宇宙,因为后者在很大程度上仍是一个理论概念,并且对于它的外观或功能尚无共识。 然而,Gen-AI 将在其创造和发展中发挥重要作用,因为它将允许在虚拟世界中自动生成内容和体验。 这可能会导致更加身临其境和动态的元宇宙,几乎可以无限地提供新的和独特的体验供用户享受。 Gen-AI 也有可能用于在元宇宙中自动执行各种任务,例如管理虚拟经济并确保虚拟世界保持稳定和正常运行。 总体而言,Gen-AI 对元宇宙的影响可能是重大而广泛的。
“人工智能堆栈的不同层级将存在商机,我们已经看到一些商业模式正在出现。 显然,生产像 GPT-3 这样的基础模型非常昂贵和复杂,少数能够做到这一点的公司将获得丰厚的报酬。 但是,有无数机会开发更专业的模型并将通用功能捆绑到特定目标市场需要的东西中。 这相当于垂直SaaS,应用于AI。 我们可能会看到许多支持 AI 的 SaaS 游戏,它们为特定市场提供具有出色 UX 的整体解决方案。在堆栈的更下方,提供正确类型的训练数据,使 ML 工程师能够快速构建专业模型并 确保模型的稳健性都是非常可行的业务。”—Andreas Goeldi,BTOV Ventures 的合伙人。
让我们一起塑造未来
准备好迎接将彻底改变未来工作方式的技术转变! 我们正处在一个新时代的边缘,成千上万的工作岗位将被改变,新的工作岗位将被创造出来。 这些尖端的 Gen-AI 平台无疑将支持和改善我们的日常生活,但我们需要时间才能完全适应它们。
“这种前所未有的人机协作水平正在如火如荼地进行,无论你身处哪个行业,无论你身处哪个行业,无论谁率先全面整合生成式 AI 方法,游戏现在都向他们开放。”——Gabrielle Chou,副教授 上海纽约大学。
参考链接
- https://www.antler.co/blog/generative-ai