作者 | 程心
OpenAI 自横空出世那天起,就一直是创业者们头上的一把达摩克利斯之剑,如今这把剑终于落下了。
美东时间 11 月 6 日,OpenAI 在镁光灯下举行了首次开发者大会,OpenAI 接连放了几个大招,多模态、降价、GPTs、all tools,几乎把上半年的创业项目全都自己做了一遍,这一套连招也彻底把创业者们打懵了。
“不给第三方留后路”、“一夜回到解放前”、“搞了半年的东西在 OpenAI 的更新面前像个笑话”...
▲图源:即刻和朋友圈截图
与现场如春晚般的掌声和欢呼声不同的是,场外无数创业项目破碎和投资人心碎的声音。X 上有网友自发组织了一场实时讨论,近百人实时讨论,当 OpenAI 献出 “GPTs” 和 “all tools” 时,惊现国粹 “woc,这半年都白干了”。
▲图源:X 截图
而随着演讲进程的推进,Altman 说出的每一个英文单词,都一片一片地击碎众多创业项目,“这是一场 1 挑 N 的碾压式比赛。” 有人愁云惨淡地说道。
事实上,这并不是创业者们完全猝不及防地被 OpenAI “偷袭”。
就在前一天,11 月 5 日,在奇绩创坛举办一场关于探索 Agent 新范式的线上活动中,不少人都对这项技术忧心忡忡,“明天就是 OpenAI 的开发者大会,不知道会不会一夜之间变天。”
如今,这句话一语成谶。投资人睡醒后的第一件事,就是询问相关创业者:“你们和 OpenAI 所做的差异性在哪?”。创业者回复:“差异性就是比他差。”
众所周知,大模型创业有一条铁律:做 OpenAI 不做的事。但是现在看来,OpenAI 似乎没有边界,而这对整个大模型行业来说,是福还是祸?
OpenAI 更新,降维打击了谁?
《三体》中,歌者文明向太阳系发射了一片二向箔,太阳系瞬间被二维化,所有的生命都变成了一幅画,地球也因此而毁灭。
降维打击由此而来,创业公司们的焦虑,也来源于一夜之间,被 “二维展开”。
昨天的开发者大会,OpenAI 的核心主要围绕两件事,一是工具箱 all tools;二是 GPT,这其中既包括对过去 GPT-4 的升级,也包括由 GPT 更迭演化而来的 GPTs、Agents 以及 GPT Store。
▲图源:X 作者 FinanceYF5
工具这条线贯穿于大会始终,覆盖了从大模型训练推理到 AI Agents 构建的全链条,一言以蔽之:用 OpenAI 就够了。
在大模型基础能力方面,TurboGPT-4 Turbo 上下文窗口达到 128k,是 GPT-4 的四倍;知识库更新到 2023 年 4 月;多模态能力上,GPT-4 Turbo 的 API 将集成了 DALL-E3,以及文生语音模型 TTS(text-to-speech),开发者通过 API 可直接调用。
在打造个人专属 GPT 和构建 AI agents 方面,OpenAI 向开发者推出了 GPT Builder 助手,构建过程就是和 GPT Builder 聊天,告诉它你想要做什么即可;即将上线 Assistant API,允许 AI 助手执行具体任务,包含代码解释器、知识库、函数调用等一些工具,并支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。
首当其冲的是国外以 LangChain 为代表的一批做工具链、中间层的公司,在国内这类公司又被称为 “中间件”。
以 LongChain 为例,它是一个基于大语言模型建立起的框架,其本身并不开发大模型,而是通过把大模型相关开发组件封装打包、链接在一起,从而来降低开发大模型应用的难度。“便捷”、“易用” 成为其最大的特点,也正是踩准了大模型应用开发的风口,才让 LangChain 摇身一变成为了硅谷 VC 的 “座上宾”,甚至在没有任何收入和收入计划的情况下,连续拿下了 1000 万美元和 2000 多万美元的两轮融资。
正如硬币有两面性,LangChain 等中间层公司所谓的 “开箱即用”,也为 OpenAI 原子弹式的降维打击埋下了伏笔。
此前,已经有一些开发者告诉【自象限】,在实际开发过程中他们对 LangChain 的使用率并没有想象中那么高,“易用也意味着不够灵活,而对很多初创公司来说,他们更愿意根据自身的业务需求,从零开始构建工具链和框架。比起 LangChain,Hugging Face 上还有大把的开源工具可以随意调取”。
如今来看,LangChain 等公司的热度已经趋于冷却,或许击碎他们不过是早晚的事情,不是 OpenAI 也会有其他人。反观国内,并没有形成像 LangChain 一样的完整工具链,国内也有创业公司们瞄准了一个个 “散装” 环节,有人只做数据清洗或者 embedding 的过程。“通用的交给 OpenAI,创业公司做垂类”,如今这样的幻想也破灭了。
更令一众尚在襁褓的初创公司胆战心惊的是,OpenAI 这头永远无法餍足的狮子,也垂涎上了 “AI Agents” 这块肥肉。
AI Agents 可能是现在大模型赛道最热的方向,早在今年三、四月份,就有过一轮 AI 智能体的大爆发,短短半个月内,Camel 、BabyAGI、AutoGPT 、斯坦福西部世界小镇如雨后春笋般冒出。
据【自象限】了解,在国内,AI Agents 同样是许多初创公司埋头苦干的项目,比如近期面壁智能联合清华大学 NLP 实验室推出了大模型‘超级英雄’——XAgent,声称在真实复杂任务的处理能力已全面超越 AutoGPT。
但现阶段真正能跑出来的 AI Agents 还寥寥无几,核心原因有两个,一是从数据清洗、Prompt 指令设置、训练、输出等各个环节都困难重重;二是,价格成本过于高昂,动辄测试跑一次 5 美元、3 美元,根本找不到能够落地的商业场景。
“你们中的很多人已经有了建立 Agents 的经验,但是这过程往往很难,可能需要花费数月、几十名工程师,而且很难控制定制化过程,所以我们今天试图将其变得更简单”,Altman 在发布会现场说道。
显然,早已经在各个分任务跑 AI Agents 的 OpenAI 摸准了创业者的脉。
今年加入 OpenAI 的前特斯拉 AI 总监 Karpathy,曾在一次开发者活动上表示:“AI 智能体,代表了 AI 的一种未来!”
在近期的奇绩创坛分享会上,有专家更加明确化了这种 “未来”。AI agents 下一步大模型与真实世界产生互动、影响的关键,“现在的格局是人作为中介,连接起大模型和真实世界,大模型尚且无法与真实环境产生互动、反馈。而未来则是人 - AI agents - 真实世界这样的排布,真正迈向全自动化、智能化”。
▲图源:奇绩创坛 AI agents 分享会
由此可见,OpenAI 的野心远不止于一场发布会,不仅想抓住现在,更想抓住未来。
OpenAI 更普惠还是更垄断?
有人说 OpenAI 通过开放能力来完善生态,是更普惠的体现,更多人认为 OpenAI 并不给生态的其他玩家 “留活路”,是垄断的象征。
想要搞明白 OpenAI 背后的大棋,还要从更宏观的视角来看这场发布会。
当我们把自己从 OpenAI 更新的震慑中抽离出来,冷静地去看待这场发布会,会发现 OpenAI 悄然间已经集齐了大模型(底层)+ 工具链(中间层)+Agents(应用层)的三件套,而当用户和开发者全方位依赖于 OpenAI,OpenAI 就做到了真正的 “通吃”。
除了最引人注目的工具箱 all tools 和 Agent,OpenAI 还升级了 GPT4 的六大能力,包括 128k 长文本、全新的 Assistants API 以及视觉 CV 在内的多模态功能。这些围绕着模型层的能力让 OpenAI 在市场是具有了更强的竞争力,也让创业者们一直垂涎多模态能力走到台前。
▲图源:YouTube 截图
更重要的是,从 ChatGPT 到 GPT-4,OpenAI 一直掌握着 “卖方优势”,只因价格太贵,导致无法大规模普及。套用马斯克用在特斯拉身上的一句话 “没有人不想拥有 GPT-4,只要他足够便宜。”Altman 也体察到了民意,升级后的 GPT-4 Turbo,不仅将性能提升了一大截,还把价格 “打了下来。
▲图源:OpenAI 官网
降价后的 GPT-4 Turbo 输入侧为 GPT-4 的 1/3 价格,输出侧为 GPT-4 的 1/2 价格。据开发者对比过后,这个价格相比于开源生态的大模型和工具链,仍然贵了十倍级以上。
在绝对的能力差和溢价之间,企业和开发者往往会选择前者。社交平台上有人透露到:“泄露的 all tools 账号已经开始高价售卖了,这万众期待的阵仗就跟当年的 Apple 一样。”
▲图源:即刻截图
像苹果的可不止这万众期待的阵仗。在 ChatGPT 插件上线时,就有很多人将其比喻为安卓或者是 APP Store,如今,OpenAI 真的推出了 GPT Store。
简单的说,就是开发者们通过 OpenAI 提供的工具,可以直接基于 GPT-4 的能力,构建一个智能化应用:GPTs。
从定制开发、收入变现到生态构建,OpenAI 给出了一揽子的解决方案:在开发环节,提供 GPT Builder、Assistants API 生成工具,旨在让不懂编程语言的普通人也能开发出定制化 GPT 对话助手和 AI agents 分身,以此来降低开发的难度;在收入变现环节,OpenAI 承诺将向建造最有用和最多使用 GPTs 的人支付收入,与创作者分享收入;在生态构建环节,OpenAI 提出要打造类苹果的 GPT 商店,一旦开发者的 GPT 入驻,就能被更多人搜索到,并有机会跻身排行榜前列获得更多流量推荐。
▲图源:YouTube 截图
也就是说,一个属于 OpenAI 的开发者生态真的来了。如同 App Store 一样,商店将收录验证用户创建的 GPT 作品,可以被用户搜索到。商店也会推荐生产力、教育和好玩等类别的优秀作品,而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。
从基础大模型,到工具到底层系统,OpenAI 几乎一场发布会完成了乔布斯时代的几件惊天动地的大事。
OpenAI 在整个 AI 时代,站在了食物链最顶端。让我们简单地回顾一下苹果的发展脉络:重新定义硬件(iPhone4)、重新定义软件(App)、重新定义系统(iOS、OS),从而建立起一个 “无坚不摧” 的生态。
苹果定义了 App 的设计规则、开发者的开发规则、分成规则,当年微信和苹果的几次拉锯才在 iOS 系统中上线赞赏功能,甚至当智能手机日益衰退之际,苹果依然凭借着强大的生态能力 “豢养” 着用户,利于不败之地。
参考苹果的结果,就很容易回答,是更普惠还是更垄断的问题。
当然,在这个新时代,一切瞬息万变。
“很期待接下来 Meta 等开源生态的反击,OpenAI 再次打响了一场战争,接下来,可能更好玩了。”
如若转载,请注明出处:https://www.zhangzs.com/481141.html