短短 45 分钟,OpenAI的GPT Builder一夜之间颠覆全球科技界

在短短45分钟的时间里,OpenAI再次成为全球AI界关注的焦点,可能让全球的AI从业者度过了一个激动人心的不眠之夜。OpenAI的技术进步令人兴奋,其团队所采用的商业策略已远超一般初创企业的成熟度。我们正见证着一个行业的脉搏跳动,也许还会见证一个巨头的诞生。

OpenAI GPT Builder

在短短45分钟的时间里,OpenAI再次成为全球AI界关注的焦点,可能让全球的AI从业者度过了一个激动人心的不眠之夜。北京时间11月7日凌晨,OpenAI开发者大会拉开序幕,创始人Sam Altman携团队成员登台亮相。在短短的演讲中,他们揭幕了团队的最新成就——GPT-4 Turbo。这一新版本不仅响应速度更快,上下文处理能力更强,还拥有更加强大的控制功能。

与此同时,OpenAI宣布API价格近乎减少了三倍,降至每千次输入仅需1美分,这一决定赢得了在场开发者的阵阵喝彩。但或许更引人注目的是"GPTs"的推出——一项新服务,允许人们使用自然语言来构建定制的GPT。没错,这些定制版GPT可以被上传到即将推出的"GPT Store"中!

如果说GPT-4 Turbo是AI界的“升级版iPhone”,那么GPT Store无疑是OpenAI在行业中树立“类苹果巨头”地位的关键一步。当竞争对手们还在忙于“AI炼金术”时,OpenAI已经开始构筑起一个宏伟的生态系统。

01:GPT-4 Turbo 震撼发布:AI 领域的速度与成本效率革新

GPT 4 Turbo

大会伊始,Sam Altman 宣布了对 GPT-4 的重大升级——引入了同时适用于 ChatGPT 和 API 版本的 GPT-4 Turbo。Altman 分享说,团队一直在密切收集开发者反馈,这带来了六大重要升级,解决了开发者的关切点:上下文长度加长、控制能力加强、知识模型更新、多模态支持、模型微调定制以及更高的吞吐量限制。

前四项升级主要增强了新模型的性能,而最后两项则是针对企业开发者痛点的解决方案。除了性能提升外,OpenAI 还宣布了 API 价格的大幅度降低,这等同于以更低的价格提供更多服务。

在这六项升级中,首当其冲的是上下文长度。

OpenAI 此前提供的最大上下文长度为 32k,而 GPT-4 Turbo 现已将其扩大至 128k,超过了竞争对手 Anthropic 的 100k 上下文长度。为了让你有个直观的理解,128k 的上下文长度大致相当于 300 页标准大小书籍的文字量。Altman 还特别指出,新模型在这些扩展的叙述中保持了更高的连贯性和精准度。

其次,新的更新为开发者提供了更强大的控制机制,以更好地进行 API 和函数调用。

新模型引入了 JSON 模式,确保模型响应可以以特定的 JSON 格式进行,便于 API 交互。同时,新模型允许同时调用多个函数,并引入了Seed参数,以确保在需要时提供一致的模型输出。未来几周,模型还将引入包括对日志概率可视化在内的新功能。

第三项是模型内部和外部知识库的更新。

在 ChatGPT 发布大约一年后,GPT 的知识库终于更新到了 2023 年 4 月。Altman 承诺将持续更新知识库,以防止其过时。“我们和您一样,对 GPT 的知识停留在 2021 年感到沮丧,” Altman 说。

除了内部知识库的升级,GPT-4 Turbo 还改善了外部知识库的更新方式。它现在支持上传外部数据库或文件来增强 GPT-4 Turbo 的外部知识。

第四项升级,或许是最不令人惊讶的,是多模态能力。

新模型支持了 OpenAI 的视觉模型 DALL·E 3,并引入了一个新的文本到语音模型——开发者现在可以从六种预设的声音中选择最适合自己需求的。

GPT-4 Turbo 现在能够从文本创造图像。关于图像查询,OpenAI 引入了一个安全系统来预防滥用。OpenAI 还宣布,它将为所有客户承担与版权问题相关的法律费用。

在语音系统方面,OpenAI 声称其语音模型远超市场上的同类产品,并宣布了开源语音识别模型 Whisper V3 的发布。

第五项升级是模型微调和定制。

去年八月,OpenAI 发布了 GPT-3.5 Turbo 的微调服务。早期测试显示,经过微调的 GPT-3.5 Turbo 版本在某些任务上甚至能超越 GPT-4,尽管价格相对较高。

这次,Sam 宣布 GPT-3.5 Turbo 16k 版本也将提供微调定制,定价将低于前一代。GPT-4 的微调定制服务目前也在申请中。

此外,OpenAI 开始接受针对个别企业的模型定制。“包括修改模型训练过程的每一步,进行特定领域的额外预训练,后续训练等,”Altman 表明。他还提到,OpenAI 无法承担许多此类定制,且价格不会低廉。

六项升级中的最后一项是更高的吞吐量限制。

GPT-4 用户在大会后可以立即享受到每分钟处理速率翻倍的体验。此外,如果用户仍不满意,还可以通过 API 账户申请进一步提升处理速率。

除了六项升级,API 系统的价格也进行了全面降低。新发布的 GPT-4 Turbo 在输入价格上实现了大幅度削减,降至 GPT-4 成本的三分之一,输出价格也减半,OpenAI 表示,整体使用成本已经降低了大约2.75倍。

新模型的定价为每千个输入token 1美分,每千个输出token 3美分。这一价格降低在现场开发者中引起了欢呼。

Sam 还提到,解决定价问题后,下一个关注点将是提速问题,开发者们很快就会发现 GPT-4 Turbo 的速度将大大提高。

02:GPT Store:开启 AI 定制化和易用性的新时代

GPT Store

早在五月份,OpenAI就推出了插件系统,首次亮相了70个与其大规模模型相关的应用程序,涵盖了词语猜测、翻译和股票数据检索等多个领域。GPT Store的风格与“App Store”高度相似——这是 OpenAI 展示其雄心壮志的设计选择。

当时,这一新功能备受期望,许多媒体将其比作苹果App Store的推出,认为它将改变大规模模型应用的生态系统。但尽管插件数量有所增加,该系统并未能达到苹果App Store那样的影响力。

在此次大会上,OpenAI重新定义了其应用商店框架,将其扩展为一个全新的领域,在这里,任何人都可以使用自然语言基于自己的知识库创建AI代理。然后,这些AI代理可以集成到OpenAI应用商店中,并获得收入分成。OpenAI发布的应用不再被称作插件,而是采用了一个有些不同寻常的名称:“GPT”。整个应用商店,名为GPT Store,计划在本月晚些时候正式启动。

据Sam Altman介绍,每一个GPT都是为特定目的设计的ChatGPT的定制版本。为了突出新推出的GPT应用,ChatGPT页面将进行细微调整。在左上角ChatGPT下面,将展示此次发布的应用。

在演示过程中,一些复杂的插件,例如Zapier——在OpenAI推出其插件系统时的首批产品之一,仍然存在于应用商店中,并可能继续成为未来生态系统的重要组成部分。OpenAI的Jessica Shay就利用Zapier将她的日历和短信联系起来,通过与Zapier应用的交谈,直接安排了自己的日程并通知了同事。

然而,尽管Zapier的功能十分强大,这样的应用并非此次发布的重点。根据Glassdoor的数据,Zapier拥有500-1000名员工,并且据《财富》杂志报道,Zapier的估值已达到50亿美元。依赖这类应用来丰富OpenAI尚在发展中的应用商店,创建一个活跃的生态系统显然是不现实的。

AI Customization GPT Builder

因此,在这次发布中,OpenAI宣布了一个重大消息:允许没有编码知识的个人也能轻松定义一个GPT。Sam Altman为此进行了现场演示。

“在YC工作了很多年,我经常遇到开发者寻求商业建议,”Sam Altman说,“我一直想,如果有一天有个机器人能帮我回答这些问题就好了。”随后,他打开了GPT Builder,为这个旨在帮助创业公司创始人思考商业想法并获取建议的GPT输入了定义。在对话中,GPT Builder为这个GPT生成了名字和图标,并通过与Sam的对话询问他是否想对生成的名字和图标进行调整。

GPT Builder

接下来,GPT Builder主动询问应用应如何与用户互动。Sam建议从他过去的演讲中选择适当且建设性的回答,并上传了他某次演讲的片段。包括解释在内,整个应用仅在三分钟内就完成了。访问这个GPT的用户将会看到一个自动生成的对话开场,并可以讨论与创业相关的问题,获得的回答将类似于Sam Altman自己可能提供的。

Sam还指出,创作者也可以为他们的GPT增加action(动作)。从本质上讲,用户可以为GPT定义的定制功能并不多:预设的提示、外部知识库和动作。但是,这些元素的无缝集成使那些没有编码技能的人也能够创造应用程序,这确实是Open AI的一项创新。

GPT发布后,应用程序可以设置为私有的、专属于企业的或公开可访问的。Open AI表示,它将与受欢迎的应用程序分享利润。

显然,OpenAI的这次发布并不是为了让普通用户仅通过自然语言就能创建复杂的应用程序。真正的价值在于,个人和企业可以将他们的知识库上传到OpenAI,并通过一键点击构建定制应用程序的潜力。

例如,一个拥有货运价格表的代理可以将该文件上传到OpenAI,并立即部署他们的询价助手——这是一种以前不存在的流畅且高效的应用部署方式。如果此类发布获得了用户的认可,它们将能够充实OpenAI的应用商店,将其变成包含丰富信息的宝库。

03:Assistants API:开启无代码AI Agent创建的新篇章

OpenAI Assistants API

如果你已对无代码GPT技术印象深刻,现在OpenAI带来了一个更简便的解决方案——Assistants API,让开发者更易于利用OpenAI API。Sam Altman 着重展示了市场上基于API的Agent所创造的非凡体验。例如,Shopify的Sidekick让用户在平台上直接执行操作,Discord的Clyde帮助管理员创建自定义角色,Snap的My AI则作为一个可定制的聊天机器人,能够加入群聊提供建议。

然而,构建这些Agent可能相当复杂,往往需要工程团队数月的工作来处理包括状态管理、提示和上下文管理、功能扩展和检索等任务。

在OpenAI开发者大会上,这些任务已经被API化——随着Assistants API的推出,开发者现在可以在他们的应用内构建“助手”。利用Assistants API,OpenAI的客户可以创建执行具体命令的Agent,这些Agent可以利用外部知识,调用OpenAI的生成式AI模型和工具来执行任务。这些助手的应用场景从基于自然语言的数据分析应用到编码辅助工具,甚至包括AI驱动的假日规划器。

Assistants API的能力包括:

  • 持久化线程(persistent threads),免去用户管理冗长对话历史的需求。
  • 内置检索功能(Retrieval),利用外部知识如公司员工提供的产品信息或文档来增强开发者创建的Agent,并提供全新的Stateful API以进行上下文管理。
  • 代码解释器(Code Interpreter),能在沙盒环境中编写和运行Python代码。这一功能在三月份为ChatGPT推出,它允许创建图形和图表,处理文件,从而使得通过助手API创建的助手能够迭代运行代码,解决编码和数学问题。
  • 改进的函数调用,使助手能够调用开发者定义的编程功能,并将响应集成到他们的信息中。

Assistants API目前处于测试阶段,从今天起向所有开发者开放。开发者可以访问Assistants API的测试场地,尝试助手API的测试版本,无需编写任何代码。

OpenAI视Assistants API为帮助开发者在其应用中构建“类Agent体验”的第一步。借助Assistants API,构建Agent应用程序变得更加容易。OpenAI表示,他们会随着时间的推移继续增强这些能力。此外,还计划允许客户提供自己的辅助工具,以补充平台的Code Interpreter、检索组件和函数调用。

在OpenAI开发者大会上宣布的产品升级再次将我们带进一个未来,每个人都可以拥有一个或甚至多个个人Agent,在自然语言的帮助下开发软件,并且可以浏览、购买或免费使用流行的私人Agent服务。

总结:OpenAI的颠覆式创新

短短半年多的时间里,OpenAI从GPT-4到GPT-4 Turbo,再到GPT Store,取得了迅猛的进展。在这六个月内,全球科技和人工智能行业经历了翻天覆地的变化。

OpenAI持续以多模态、更长文本输入、更经济和个性化等创新,这些都是为了在与其它大语言AI模型的竞争中脱颖而出——全球的AI竞争对手对此感受如何尚不得知。但是,OpenAI的技术进步令人兴奋,其团队所采用的商业策略已远超一般初创企业的成熟度。我们正见证着一个行业的脉搏跳动,也许还会见证一个巨头的诞生。

(0)
上一篇 2023年10月21日 17:32:37
下一篇 2023年11月14日 22:33:24

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注