GPT-3 基于大型语言模型构建创新NLP产品 第四章 GPT-3作为新一代创业公司的基座

发布于 2023年08月27日

在GPT-3发布之前,大多数人与人工智能的交互仅限于执行某些特定任务,如让Alexa播放您喜欢的歌曲或使用谷歌翻译与不同语言进行对话。研究人员已经成功开发了能够执行单调任务的AI,但到目前为止,AI尚未匹配人类在没有明确、定义清晰的指示的情况下执行抽象任务的创造性潜力。

随着大型语言模型(LLM)时代的到来,我们正在目睹一个重大的范式转变。LLM已经向我们展示,通过增加模型的大小,它们可以执行类似人类的创造性和复杂的任务。现在最大的问题是:AI是否能够执行创造性活动?

AI的创造潜力一直是一个令人兴奋的研究领域,尽管它大多隐藏在谷歌和Facebook等公司的紧密研发墙后面。GPT-3改变了我们与AI的互动方式,并赋予人们建立在GPT-3发布之前似乎是幻想的应用程序的能力。YouTube明星Bakz Awan指出:“我们将有全新的电影和剧集类型:我们将拥有互动的、融合的体验。”

模型即服务

在本章中,我们将向您展示GPT-3如何通过为富有创造力的企业家提供正确的技术来推动下一波创业公司的发展浪潮。我们还将研究AI研究在几个领域如何向商业化发展。我们还将与支持这些举措的风险投资家之一进行交谈,以了解支撑GPT-3经济的财务方面的问题。

OpenAI API的创建故事与本章中的许多创业公司和公司的故事类似。我们采访了OpenAI产品和合作关系副总裁Peter Welinder。他告诉我们一个关于大胆实验、快速迭代和利用智能设计实现规模经济(以尽可能低的成本大规模提供强大的模型)的故事。

Welinder总结了OpenAI的使命有三个关键点:“开发AGI(人工通用智能),确保它是安全的,然后最后将其部署到世界上,以最大限度地使全人类受益。”因此,该公司正专注于开发可应用于越来越普遍的需求的AI。

希望尽快且安全地实现AGI,OpenAI决定在大型语言模型(特别是GPT-3)上赌一把。Welinder谈到尝试GPT-3时说:“这是我们第一次感觉到实际上,这似乎相当有用,它在许多任务的学术基准测试中获得了最先进的结果等等。”

令人兴奋的是,研究人员决定通过API而不是自己构建翻译引擎、写作助手或客户服务应用程序等来使用该算法。Welinder说,这时他们意识到,“为什么不将此技术作为一个API提供,并让任何开发人员在其上面构建自己的业务呢?” API方法与OpenAI的目标和使命保持一致,通过最大限度地推广该技术的采用和影响力,赋予社区成员发明OpenAI团队无法预测的应用程序的能力。这也将产品开发的工作留给了全世界熟练的开发人员,从而使OpenAI团队可以专注于他们最擅长的事情:开发强大的模型。

迄今为止,研究人员一直专注于设计可扩展、高效的训练系统,以从GPU中挤出最大效率。但是,几乎没有人关注实际数据运行这些模型并从中获得实际应用价值。因此,OpenAI团队决定加倍关注核心API体验,关注诸如快速推理和低延迟等方面。

Welinder说,在计划启动API的测试版本前6个月,研究人员已经将延迟降低了约10倍,吞吐量增加了几百倍:“我们花了大量的工程精力,真正使这些模型非常高效,确保它们的GPU尽可能高效,使调用它们的延迟非常低,并使其具备可扩展性。” 使用API的模型而不需要自己的GPU使其对普通开发人员来说具有成本效益并且易于使用。非常低的延迟也同样重要,以便轻松迭代。“你不希望输入一些内容然后等待几分钟才得到响应,这在API的早期阶段就是这种情况。现在,你可以实时看到模型输出内容,”Welinder说。

OpenAI认为,随着模型的增长,开发人员将很难部署它们;该团队希望消除这一障碍。 “这对你来说的成本将太高,因为你需要如此多的GPU和CPU来实验一个用例。对你自己部署这个模型来说在经济上是不合理的,”Welinder说。相反,该公司决定通过API与开发人员共享模型。 “成千上万的开发人员正在使用相同的模型,这就是实现规模经济的方式,”Welinder补充说。 “这为每个人访问这些模型降低了价格,并进一步拓宽了分配范围,因此更多人可以尝试这些模型。”

尽管发布了GPT-3 API的私人测试版本,但它带来了不少惊喜。之前的旗舰模型GPT-2几乎没有带来多少实际用例,所以团队希望GPT-3会更有用。的确,它非常快就证明非常有用。

另一个意外之处,Welinder说,是“我们平台上的许多人并不是程序员。他们是作家、创意人士等,他们是设计师、产品经理等。” 在某种程度上,GPT-3改变了开发人员的意义:突然间,为了建立一个AI应用程序,你不需要会编程。你只需要善于使用提示来描述你希望AI做什么(正如第2章中讨论的)。

Welinder和他的团队发现,“通常,在使用它方面表现最好的人都没有机器学习背景” —— 而那些有背景的人不得不忘记他们以前对许多问题的看法,以便使用GPT-3。 没有真正打算的情况下,许多用户在没有代码的情况下就构建了基于GPT-3的应用程序。 OpenAI团队降低了创建应用程序的门槛:这是走向民主化AI的第一步。 “核心策略是使API尽可能地可用于尽可能多的人,”Welinder说:“使我们的技术门槛降低是我们任务的核心。这就是我们构建此API的原因。” GPT-3的另一个意外用例就是编程。GPT-3在编程方面的早期潜力促使OpenAI加倍关注为编程用例设计。他们的努力导致了2021年中期发布的Codex。

随着各种各样的用例出现,API也催生了一个全新的生态系统:“在我们发布API的几个月内,就有几家公司完全建立在OpenAI API之上。其中许多公司现在已经以相当高的估值获得了风险投资。”

深入研究OpenAI的核心原则之一是与客户密切合作。Welinder说,“每当我们有新的产品功能时,我们都会尝试找到知道这些功能对他们有用的客户,并建立直接的沟通渠道,为他们提供功能的提前访问。” 例如,在正式发布搜索功能之前,OpenAI与几家客户合作了一些搜索功能。

OpenAI主要关注确保AI和AGI的安全和负责任地使用。除了许多积极的结果之外,随着AI变得越来越普及,该公司也看到滥用的潜力越来越大。将API以私人测试版的形式发布的一个主要原因是要了解人们将如何使用这些模型并检查其滥用的潜力。他们尽可能多地检查不需要行为的实例,并利用获得的知识来指导他们的研究和模型训练。

Welinder从API驱动的项目中汲取灵感是其广度和创造力。 “未来10年将非常激动人心,因为人们将在这项技术的基础上建立许多东西。我认为通过共同努力,我们可以创建一些真正好的约束,以确保这些将要建立的技术和应用程序对我们的社会将是非常正面的。”

新创生态系统:案例研究

OpenAI发布API后不久,创业景观就充满了使用它来解决问题的公司。这些企业家是NLP产品的先驱,他们的经历极具教育意义,尤其是针对任何计划基于OpenAI API开发未来业务应用的人。本章的其余部分将通过采访一些使用GPT-3作为产品架构核心的顶级创业公司的领导者,描绘这一充满活力的景观。他们与我们分享了迄今为止在创意艺术、数据分析、聊天机器人、写作、开发人员工具等领域的学习经验。

GPT-3的创意应用:Fable Studio

GPT-3最令人兴奋的能力之一是讲故事。您可以给模型一个主题,并要求它在零样本设置中编写一个故事。

这种可能性已经扩展了作家的想象力,并激发了非凡的作品。例如,Jennifer Tang导演的舞台剧AI,是与Chinonyerem Odimba和Nina Segal在GPT-3的帮助下开发的,描绘了人类和计算机思维之间独特的协作。作家K Allado-McDowell在写作《制药AI》(Ignota书籍)一书时将GPT-3视为共同作者,Allado-McDowell说它“重新想象了控制论,面对多个危机,对21世纪我们如何看待自己、自然和技术具有深远的意义。”

我们与Fable Studio的联合创始人兼CEO Edward Saatchi和首席技术官Frank Carey坐下来,了解他们使用GPT-3的旅程,创建一种新的交互式故事流派。 Fable根据Neil Gaiman和Dave McKean的儿童图画书《墙里的狼》改编成了一部艾美奖获奖虚拟现实电影体验。该片的女主角露西(Lucy)能够借助GPT-3生成的对话与人自然交流。露西甚至在2021年的圣丹斯电影节上担任嘉宾。

Saatchi和Carey注意到观众与露西建立了情感联系。这促使他们专注于使用AI创建虚拟存在和全新的故事讲述和娱乐类别,将AI和讲故事紧密结合。 YouTuber Bakz Awan表示:“我们将有全新的电影和剧集类型:我们将拥有互动的、融合的体验。”

Carey解释说,观众通常认为AI扮演角色,就像演员一样:一个AI对应一个角色。相反,Fable的AI是一个讲故事家,拥有各种各样的角色组合。 Carey认为,开发一个与最优秀的人类作家一样熟练和富有创造力的AI讲故事家是可能的。

虽然露西的对话大多通过文本和视频聊天进行,但Fable也在使用GPT-3进行3D模拟世界的实验,以获得身临其境的VR体验。该团队使用AI生成音频和手势,并将嘴唇运动同步。 他们使用GPT-3生成相当大一部分角色与观众的互动内容。其中一些内容可以预先创作,但大部分内容必须即时创建。 在圣丹斯电影节亮相和创作这部电影的过程中,露西的合作者广泛使用了GPT-3。 露西还出现在Twitch上(一种互动直播平台,她似乎在该平台上直播游戏或讲故事)。 在这两种情况下,Carey说,“超过80%的内容是使用GPT-3生成的。”

这与该团队早期的仅限文本实验形成了明显对比,后者在很大程度上是预先创作的,并遵循更线性的叙事结构。 Carey说,Fable Studio团队通常不会使用GPT-3现场处理观众成员的不可预测回应;他们处理这方面的技术预日期GPT-3。但是,他们有时会将GPT-3用作写作伙伴或代表观众考虑潜在回应。

Carey解释说,GPT-3也是人类作者的有用工具:“对于即兴内容,我们正在使用GPT-3进行测试,所以你可以将GPT视为人,而你正在扮演角色。 与GPT-3反复交流可以帮助你想到诸如在这种情况下有人会问什么之类的内容。这可以帮助作家尽可能多地考虑对话的结果。” 有时它一直是一个写作伙伴,有时它一直是可以填补故事周围发生的事情的空白,”Saatchi说。 “所以我们可能会想:这周角色会发生什么。 下周角色会发生什么?而GPT-3正填补其中的一些空白。”

Fable Studio团队在2021年圣丹斯电影节上充分利用了GPT-3,当时露西与电影节参与者实时协作,创作了自己的短片《德古拉:血西红柳汁》,而Fable Studio和参与者正在策划她生成的想法,将观众的想法反馈给GPT-3。

Saatchi说,使用GPT-3驱动一个一致的角色是一个特殊的挑战。“生成大量随机场景使用GPT-3相当简单,但要确保它符合该角色的语音就是另一回事了,”他补充说。 该团队付出了额外的努力,以确保GPT-3了解角色的语音并保持在角色可能的回应范围内。 他们还不得不避免允许参与者影响角色,因为GPT-3可以捕捉到微妙的信号。 Carey解释说,如果露西与成人互动,“它会跟随参与者的氛围,但如果露西是一个八岁的孩子,它可能会从参与者那里捕捉到更多成人的氛围,然后将其反馈给他们。 但我们实际上希望它以八岁孩子特有的童声说话。”

说服OpenAI允许Fable使用GPT-3创建虚拟存在需要一些小心。 Carey说:“我们非常有兴趣让我们的角色以角色的身份与人交谈,你可以想象这可能成为其中一个有问题的领域,对吧?这绝对有可能被恶意使用,有人假装是人类。” Fable Studio和OpenAI团队花了一些时间研究创造逼真的角色和模拟人类之间的区别,然后OpenAI才批准了Fable的用例。

OpenAI还有另一个要求:在任何一个虚拟存在在观众面前假装“真实”的叙事实验中,Fable团队都必须保持一个人类在循环中。 根据Carey的说法,在可能参与的大量观众面前使GPT-3发挥作用具有挑战性。尽管如此,他仍然认为大型语言模型在为预创作内容或在更宽容的领域中不受限制的“现场”使用方面将是一个福音。

Carey认为,GPT-3创作最适合作为创意作家希望获得更好结果的协作工具,而不是期望GPT-3完成所有工作。

当谈到成本时,他看到的故事讲述用例的挑战是,对于每个API请求,为了保持GPT-3与发展的故事一致,人们必须“提供所有的细节并生成补充它的东西。 所以要生成几行内容,你就要支付所有令牌的费用。这可能是一个挑战。”

Fable Studio是如何处理定价问题的呢? 该工作室在很大程度上避免了这个问题,主要依靠预生成,在预生成中,“你预先生成许多选项,然后可以使用搜索来找到正确的选项进行响应,”Carey说。

他们还找到了降低API用户数量的方法:与其让大量观众通过AI与露西互动,“我们已经转向了一种模式,其中露西实际上正在进行一对一的对话,但通过Twitch直播。” 观众通过Twitch观看而不是提出API调用,这减轻了带宽问题,限制了露西在任何时候与之互动的人数,并扩大了观众群。

Saatchi提到有传言说GPT-4正在探索虚拟空间的空间理解,他认为这比仅使用语言的聊天机器人有更大的潜力。 他建议探索此用例的人将重点放在为虚拟世界创建角色上。 Saatchi指出,Replika公司已经创建了一个虚拟AI朋友角色,现在正在探索扩展到元界,在那里虚拟存在将拥有自己的公寓,并且最终可以相互交往以及与人类用户交往。 “重点是创造一个感觉栩栩如生的角色,GPT-3只是众多工具之一。 赋予虚拟存在真正理解它们正在浏览的空间的能力可能会为这些角色解锁学习。”

前路怎么走? Carey看到GPT-3的未来版本在建立元界中的作用,这是一个平行的数字现实,人类可以像在现实世界中一样自由地互动和活动。 他设想它生成想法,而人类在循环中进行策划。

Saatchi认为,减弱语言作为唯一交互模式的重要性有可能创造与AI更有趣、更复杂的互动。 “我确实认为3D空间为我们提供了机会,可以赋予AI空间理解,”他继续说道。 Saatchi设想的元界使AI能够行走和探索,并为人类提供加入循环并帮助训练虚拟存在的机会。 他总结说,我们需要激进的新思维,元界为在3D空间中让AI角色生活并允许它们与人类“帮助角色成长”提供了重大机会。

GPT-3的数据分析应用:Viable

创业公司Viable的故事是一个从您开始考虑一个业务idea到实际找到一个产品与市场契合度和客户群的例子。Viable帮助公司更好地了解其客户,方法是使用GPT-3总结客户反馈。

Viable汇总诸如调查、帮助台票据、实时聊天日志和客户评价等反馈。然后,它确定主题、情感和看法,从这些结果中提取见解,并在几秒钟内提供总结。例如,如果被问到“我们的结账流程对客户有什么让人沮丧的地方?”,Viable可能会回答:“客户沮丧的是结账流程加载时间太长。他们还希望有一种在结账时编辑其地址并保存多个付款方式的方法。”

Viable的原商业模式涉及通过调查和产品路线图帮助初创公司找到产品与市场的契合度。来自更大公司的请求开始涌入,要求支持分析大量文本,如“支持票据、社交媒体、应用商店评价和调查响应”这一切都改变了一切,Daniel Erickson说。 Erickson是Viable的创始人兼首席执行官 - 也是OpenAI API的早期采用者之一。他解释说:“我实际上花了大约一个月的时间只是实验,事实上只是拿我们的数据,把它放入游乐场,弄清楚不同的提示和类似的东西。 最终,我得出结论,它可以提供一个非常强大的问答系统。”

Erickson和他的同事开始使用OpenAI API与他们处理的大数据集进行交互并从中生成见解。 一开始,他们使用了另一个NLP模型,取得了平庸的结果,但当他们开始使用GPT-3时,该团队看到“整体提高至少10%。 当我们说从80%提高到90%时,这对我们来说是一个了不起的提高。”

在这次成功的基础上,他们结合使用GPT-3和其他模型和系统来创建一个问答功能,允许用户用简单的英语提出问题并获得答案。 Viable将问题转换为可以从数据库中提取所有相关反馈的复杂查询。 然后,它通过一系列汇总和分析模型运行数据,以生成精炼的答案。

此外,Viable的系统每周为客户提供“12段摘要...概述顾客最常见的抱怨、赞赏、请求和疑问等。” 正如您可能期望的那样,客户反馈专家,Viable为软件生成的每份答案都提供了大拇指向上和向下的按钮。 他们使用此反馈对模型进行再训练。

人类也参与了这个过程:Viable有一个注释团队,其成员负责构建训练数据集,用于内部模型和GPT-3微调。 他们使用当前微调模型迭代生成的输出,然后人类对其质量进行评估。 如果输出没有意义或不准确,他们会重新编写它。 一旦他们满意输出列表,他们就会将该列表反馈到下一次迭代的培训数据集中。

Erickson指出,API是一个巨大的优势,因为它将托管、调试、扩展和优化留给了OpenAI:“我宁愿购买而不是构建几乎任何不属于我们的核心技术的东西。 即使它是我们的核心技术,使用GPT-3也仍然有意义。” 因此,他们的理想解决方案将是对其流程的各个元素使用GPT-3。 但由于成本问题,他们不得不优化其用法:“我们有的公司为我们提供了数十万的数据点,每个数据点从5到1000个字不等。” 如果将一切都用于GPT-3,成本可能会很高。

相反,Viable主要使用内部模型来结构化数据,这些模型是在GPT-3输出的基础上构建的BERT和ALBERT。 这些模型现在达到或超过了GPT-3在主题提炼、情感和情绪分析等许多其他任务方面的能力。 Viable还根据OpenAI的API定价转换为基于用量的定价模式。

Erickson认为,GPT-3以两种方式使Viable具有竞争优势:准确性和可用性。 我们已经谈到了Viable令人印象深刻的10%准确度提升。 但可用性呢? Viable认为,大多数竞争对手构建的工具专门针对专业数据分析师。 Viable觉得这种观众太窄了:“我们不想构建只有分析师才能使用的软件,因为我们觉得这限制了价值。 我们想做的是帮助团队使用定性数据做出更好的决定。”

相反,Viable的软件本身就是“分析师”。 并且用户可以更快地迭代,这要归功于反馈循环,该循环允许他们用自然语言提出有关数据的问题并快速准确地获得响应。

Erickson与我们分享了Viable的下一步计划:它很快将引入定量数据和产品分析运算。 最终,Erickson希望给用户提供执行全面客户洞察分析并提出诸如“有多少客户在使用功能X?”和“使用功能X的客户认为应该如何改进它?”等问题的能力。

最终,Erickson总结道:“我们销售的洞察力。 所以我们产生的洞察力越深入、越强大,以及我们交付这些洞察力的速度越快,我们就创造越多的价值。”

GPT-3的聊天机器人应用:Quickchat

GPT-3在语言交互方面非常擅长,显然是增强现有聊天体验的绝佳选择。 尽管许多应用程序以AI聊天机器人角色娱乐用户,例如Philosopher AI和Talk Kanye,但两个公司特别利用此功能用于其业务应用程序:Quickchat和Replika。 Quickchat以其AI聊天机器人角色Emerson AI而闻名,可以通过Telegram Messenger和Quickchat移动应用程序访问。 Emerson AI具有广泛的一般世界知识,包括比训练GPT-3的信息更新的信息;支持多种语言;可以处理连贯的对话;而且很有趣。

Piotr Grudzień和Dominik Posmyk是Quickchat的联合创始人,他们从一开始就对GPT-3感到兴奋,并充满了利用它在新产品中发挥作用的想法。 在与OpenAI API的早期实验中,他们不断回到“改善机器与人之间的接口”的概念。 Grudzień解释说,由于人与计算机之间的交互不断发展,自然语言将是逻辑上的下一步:毕竟,人类更喜欢通过对话进行交流。 总而言之,GPT-3似乎有潜力实现与计算机的人类化聊天体验。

Grudzień说,两位创始人都没有构建过常规的聊天机器人应用程序。 以初学者心态接近这项任务帮助他们保持清新开放,以解决问题。 与其他聊天机器人公司不同,他们并没有抱着成为最佳客户支持或营销工具的雄心壮志开始。 他们开始的目标是:“我如何让一个人与一台机器进行交流,以一种令人惊叹和他们所体验过的最好的方式进行交流?”他们想制作一个聊天机器人,不仅可以完成简单的功能,如收集客户数据和提供答案,还可以准备好回答客户的即兴问题或进行愉快的闲聊。 Grudzień补充说,“与其说‘我不知道’,不如回到会话式API,并保持对话的连续性。”

Posmyk补充说:“我们的使命是用人工智能赋能人们,而不是取代他们。 我们相信,在未来十年里,AI将加速教育、法律、健康等关键行业的数字化,并增加我们工作和日常生活的生产力。” 为了预见这个遥不可及的使命,他们创建了Emerson AI,这是一个由GPT-3提供支持的智能通用聊天机器人应用程序。

虽然Emerson AI拥有不断增长的用户社区,但其真正目的是展示GPT-3驱动聊天机器人的功能,并鼓励用户与Quickchat合作实施此类角色。 Quickchat的产品提供是一个通用对话AI,可以谈论任何主题。 客户(大多数是成熟的公司)可以通过添加特定于其产品的额外信息(或他们希望的任何主题)来自定义聊天机器人。 Quickchat已经看到了各种各样的应用,例如自动执行典型的FAQ客户支持问题解决,以及实施一个AI角色来帮助用户搜索内部公司知识库。

与典型的聊天机器人服务提供商不同,Grudzień解释说,客户遵循一个简单的流程:“您复制粘贴包含您希望AI使用的所有信息的文本,然后单击重新训练按钮; 它需要几秒钟来吸收知识,就这样。” 现在,在您的数据上进行了培训,聊天机器人已准备好进行测试对话。

当被问及开源模型与OpenAI API之间的权衡时,Grudzień分享说:“OpenAI API很好很容易使用,因为您不需要担心基础设施、延迟或模型训练。它只是调用API并获得答案。它非常可靠。”然而,他认为您为质量支付了相当高的价格。相比之下,开源模型似乎是一个伟大的免费替代品。实际上,“您确实需要支付云计算的成本。它需要GPU并设置GPU以使这些模型快速工作,然后对自己的模型进行微调,”Grudzień承认这绝非琐事。

像Viable的Erickson一样,Grudzień和Posmyk也努力让每次API调用都带来价值。但他们也希望随着更多更具竞争力的模型的发布,OpenAI的API定价将“下降或达到某种水平,只是因为竞争的压力”。

那么,Quickchat学到了什么?首先,仅仅依靠炒作是无法建立可盈利业务的。像GPT-3这样的媒体轰动可以吸引一批狂热的爱好者,“但随后人们会厌倦并等待下一个大事,”Grudzień说。“唯一能存活下来的产品是那些真正解决人们关心的问题的产品,”Grudzień说。“没有人会仅仅因为它是GPT-3而使用您的产品。它需要提供某种价值,无论是有用的还是有趣的,或者解决某些问题。GPT-3不会为您做到这一点。所以,您需要将它视为另一种工具。”

另一个关键教训是开发坚实的绩效指标。 “每当您构建一个机器学习产品时,评估它总是很棘手的,”Grudzień说。 在他看来,由于GPT-3健壮且操作自然语言这个难以量化的领域,评估其输出质量是复杂和麻烦的。 尽管突破可能非常激动人心,但他说,“用户可能会根据您表现最差的情况对您进行判断,而在最佳情况下则根据您的平均表现进行判断。” 因此,对于一个成功的业务,您需要设计一个指标来捕获与满意用户和高保留率相关的变量。 这些直接转化为更高的收入。

另一个挑战,或许出人意料的是,GPT-3的创作天赋。 “即使您将温度设置得非常低,无论您给它什么提示,它仍然会使用这个提示,然后根据它拥有的广泛知识生成东西,”Grudzień解释道。 这使得生成创意文本(如诗歌、营销文章或幻想故事)变得很容易。 但大多数聊天机器人都是为了解决客户问题。 “它需要具有可预测的、重复的性能,同时仍要会话且在某种程度上具有创造性,但不要将其推太远。”

大型语言模型有时会输出“奇怪”、“空洞”或“不太好”的文本,因此人们确实需要干预。 “如果您开始衡量它是否设法满足某些条件或完成任务,那么结果会非常有创意,但十次尝试中只成功六次 —— 就业务和付费客户而言,这与零次成功相同。” 因此,为了实现成功的业务应用,您需要大量的内部系统和模型来约束这种创造力并提高可靠性。 “为我们的客户创造99%的时间工作的工具,我们开发了许多防御机制,”Grudzień说。

如今,Quickchat专注于与客户深入合作,以确保API性能使他们能够成功实现其用例。 Grudzień最感兴趣的事情是看到客户构建的内容:“我们真的、真的希望看到我们的聊天引擎以数千种不同的方式在不同的产品中使用。”

GPT-3的营销应用程序:Copy-smith

GPT-3能消除作家的写作障碍吗?YouTuber Yannic Kilcher认为可以:“如果您遇到写作障碍,只需询问模型,它会提出数百个想法,充当代言人。” 让我们看一下此类工具之一:Copysmith。

GPT-3最受欢迎的用途之一是根据需要即时生成创意内容。 Copysmith是市场上领先的内容创作工具之一。 联合创始人兼首席技术官Anna Wang表示:“Copysmith通过强大的AI使用户能够在网络上的任何地方创造和部署内容,速度快100倍。” 它使用GPT-3进行电子商务和营销的写作,以实现闪电般快速生成、协作和启动高质量内容。 Wang和首席执行官Shegun Otulana分享了两姐妹如何将她们规模小且苦苦挣扎的电子商务店转型为一家成功的科技公司,以及GPT-3在使这成为可能方面的关键作用。

Anna Wang和她的姐姐Jasmine Wang于2019年6月共同创立了一个基于Shopify的精品店。 但由于缺乏营销经验,“业务彻底崩溃了,”Anna Wang说。 当姐妹二人在2020年了解到OpenAI API时,Wang说:“我们开始探索它的创造性追求,如写诗,试图模仿来自书籍和电影的角色。 有一天,我们意识到,如果我们在试图建立电子商务店时拥有这个工具,我们就能写出更好的行动号召、产品描述,并提高我们的营销水平让它起飞。”

受到鼓舞,他们在2020年10月推出了Copysmith,获得了热烈的欢迎。 用Anna Wang的话说:“这就是一切的开始。 我们开始与用户交谈并根据反馈迭代产品。” GPT-3允许您在没有任何先验知识的情况下非常快速地迭代,而其他开源模型(如BERT和RoBERTa)需要对每个下游任务进行大量微调。 “它的灵活性非常强大,可以执行各种任务,”她补充说,“它是目前最强大的模型。” 此外,它“对开发人员和用户来说超级友好,它简单的‘文本输入,文本输出’接口允许您使用简单的API执行各种任务。” 与托管专有模型所需的努力相比,其另一个优点是API调用的简单性。

至于构建基于GPT-3的产品的挑战,Otulana说:“您通常受限于OpenAI。 所以,为了克服这一点,您必须给予自己的企业家精神触及API,创造出与众不同的东西。 另一个局限性是对控制权的轻微损失,其进步本质上受限于OpenAI的进步。”

Anna Wang对希望使用GPT-3的潜在产品设计者有两点建议。 首先,她说:“确保您正在解决一个真实问题......想想您的用户,因为GPT-3一个简单的事情是陷入仅仅考虑限制在安全准则内不允许自己创造的思维定势。”

第二,Wang建议:“密切关注您提供给模型的内容。 小心标点、语法和提示的措辞。 我保证,如果您这样做,您将获得更好的模型输出体验。”

GPT-3的编码应用程序:速记

随着GPT-3及其后代模型Codex继续展示与编程和自然语言更多的交互能力,新的潜在用例正在增加。

OpenAI社区大使Bram Adams因其使用GPT-3和Codex算法进行创造性实验而闻名,他在2021年底推出了一个实验:速记,该实验利用GPT-3和Codex自动执行编写代码文档这一烦人的任务。 速记在流行的产品发布门户网站Product Hunt上一经推出就取得了瞬间成功,作为当日最佳产品推出。

在缩小想法范围至他的新企业之前,Adams尝试了与API的几个潜在用例。 “我认为我的许多实验都是关于我下意识地测试语言模型如GPT-3可以处理什么的边缘。” Adams的搜索始于这个想法:“如果我可以要求计算机做任何事情,我会做什么?” 他开始探索,“戳GPT-3 API的边角,看看它能发挥多大作用。” 他想出了一个机器人,可以生成Instagram诗歌;尝试了一个自制播客日记项目,用户可以与数字版本的自己对话; 在Spotify上根据用户偏好构建音乐播放列表项目; 以及许多其他项目,以满足他的好奇心。 感谢这种好奇心,“我很快就学会了解GPT-3的不同引擎。”

那么,为什么是速记呢? “我从外界得到了一个相当好的信号,表明这对很多人来说可能非常有用。” 虽然Adams喜欢编写代码的优雅,但GitHub的大多数用户只是下载已发布的代码并使用它:“没有人真的会欣赏你放入代码库的美。” 他还注意到,GitHub上伟大的程序如果缺乏很好的文档,通常不会得到应有的关注:“自述文件是每个人首先看到的。 他们会立即向下滚动到它。” 速记是试图思考如何使文档的演变不再令开发人员感到烦恼:“你必须证明你做了什么。 所以你会说,‘我使用这个库做这件事。 然后我决定使用这个东西,然后我添加了这个函数来做这件事。’”

Adams认为,GPT-3是否能创建可理解的注释。 他尝试了GPT-3和Codex,对两种模型的解释水平都留下了深刻印象。 然后,他问自己的下一个问题是:“我如何使它对开发人员真的很简单并且令人愉快?”

那么,速记是如何工作的,以及其组件如何利用OpenAI API呢? 在高层次上,Adams说,主要有两个进程 - 解析和解释 - 每个都需要不同的策略。 “对于解析过程,我花了大量时间来理解代码的复杂性,因为您的代码中的并非所有行都值得记录。” 某些代码可能具有明显的目的,没有操作价值,或不再有用。

此外,规模达到800行以上的“大”代码块对模型一次性理解来说过于复杂。 “为了能够准确地说这个东西的作用,您不得不将逻辑分解成许多不同种类的步骤。 一旦我理解了这一点,我就开始思考‘我如何利用解析来找到足够复杂但不太复杂的块?’” 由于每个人编写代码的方式各不相同,问题在于尽可能与抽象语法树保持联系并且利用最好的条件。 这成为解析层的主要架构挑战。

至于解释层,“这更多地是让GPT-3和Codex说您想让他们说的话,”Adams解释道。 办法是找到创造性的方法来理解代码的受众并让GPT-3与之交流。 此层“可以尝试解决任何问题,但它可能不会以像计算器那样100%的准确率解决问题。 如果您键入2加2等于4,它偶尔会得到5,但您不需要编写减法和除法的所有功能。 这些都是免费赠送的。” 这是概率系统的权衡:有时它们会工作,有时它们不会,但它们总是返回一个答案。 Adams建议保持足够的灵活性,以便在必要时调整策略。

Adams强调在使用OpenAI API之前真正了解问题的重要性。 “在我的办公时间,人们会来,他们会有这些巨大的问题。 他们会说,‘我如何使用提示从零开始建造火箭?’ 我会说,‘嗯,火箭有很多组件。 GPT-3不是灵丹妙药。 它是一个非常强大的机器,但只有当您知道要使用它做什么时才有用。’” 他将GPT-3比喻为JavaScript、Python和C等编程语言:“它们令人兴奋,但只有当您了解递归、循环和while循环以及帮助您解决特定问题的工具时才有用。” 对Adams来说,这意味着问了很多“技术元问题”,例如“什么是AI文档可以提供帮助的事情?” 和“文档到底是什么?” 处理这些问题对他来说是最大的挑战。

“我认为很多人直接依靠Davinci来解决他们的问题。 但如果您可以在较小的引擎(如Ada、Babbage或Curie)上解决一些问题,您实际上会更深入地了解问题,而不仅仅是试图用Davinci将整个AI扔给它,”他声称。

当谈到使用OpenAI API构建和扩展产品时,他建议“使用小型引擎或低温度,因为您无法预测最终提示会是什么样子(或者它是否会随着时间的推移而继续发展)您正在尝试做什么以及您的最终用户是谁,但使用较小的引擎和更低的温度,您会更快地找到真正艰难问题的答案。”

从他自己的独立实验转向面向所有不同条件和工作方式的用户的应用程序也是一个挑战。 现在,他正在“找到所有不同的边缘案例”,以便更好地理解设计层的API必须多快才能响应特定请求以及它如何与不同语言进行交互。

接下来会发生什么? Adams已经构建了一个他非常满意的产品,在2022年,他计划专注于销售和与用户群交谈。 “速记不会像建设那么多,而是真正完善产品并将其展示给人们看。”

投资者对GPT-3创业生态系统的观点

为了了解支持基于GPT-3公司的投资者的观点,我们与著名全球风险投资公司Wing Venture Capital的Jake Flomenberg进行了交谈,Wing Venture Capital是几家基于GPT-3创业公司(包括CopyAI和Simplified)的主要投资者。

任何关注市场的观察者都可以想象,风险投资商都在密切关注GPT-3等新兴AI技术。 Flomenberg总结了其吸引力:GPT-3不同于我们以前见过的任何其他NLP模型。 它是建立更普遍AI的重要步骤。 巨大的未开发潛力是巨大的,他认为商业世界仍然“低估并因此低利用大型语言模型的功能”。

但是潜在投资者如何评估新颖不同的东西呢? “我们重视对问题、领域和技术有深刻理解的创始人团队,”Flomenberg说,以及那些展示产品与市场匹配良好的团队。 “评估建立在GPT-3上的东西的细微差别在于询问,秘密配方是什么? 公司在技术上建立了什么深厚的知识? 公司是否在使用GPT-3解决真实问题,或者只是利用炒作将产品推向市场? 为什么是现在? 为什么这个团队是最好的执行人选? 如果一家初创公司无法为其存在辩护,那就是一个巨大的危险信号。”

投资者还密切关注OpenAI及其API,因为基于GPT-3的业务完全依赖于其功能。 Flomenberg引用OpenAI的尽职调查审查流程作为这种基于信任的关系的一个主要因素:“那些通过生产审查并引起OpenAI兴趣的创业公司自动成为投资的热点。”

投资者在做出投资决定时通常会深入研究创始人的背景和专业知识。 然而,GPT-3不同寻常之处在于,它允许任何背景的人而不仅仅是程序员使用先进的NLP产品构建。 Flomenberg强调这里市场的重要性:“通常与一个深度技术初创公司打交道时,我们会寻找在技术和AI领域有非常好理解的创始人。 但是对于基于GPT-3的创业公司,我们更关注市场是否与创始人的愿景产生共鸣,以及他们是否能识别和解决最终用户的需求。” 他引用CopyAI作为“基于GPT-3构建的典型产品引导增长模型的例子。 他们与用户找到了非凡的共鸣,并对技术建立了深刻的理解,从而为桌面带来了深度和价值。” 他说,成功的创业公司“将AI隐藏在内部”,更多地关注解决用户的问题并满足他们的需求,而不是正确使用完成工作的工具。

结束语

GPT-3赋予这些用例以及许多其他用例如此快速且成功的能力,令人难以置信。 在写这章时,2021年末,OpenAI社区中的几家创业公司已经筹集了大量资金,并制定了快速扩张计划。 这个市场潮流似乎已经唤醒了更大公司的胃口。 越来越多的企业开始考虑在组织内实施实验性GPT-3项目。 在第5章中,我们将检查这个由GitHub Copilot和特别是由Microsoft设计的新的Azure OpenAI服务组成的大规模产品市场,旨在满足大型组织的需求。



评论