@阑夕:Google 在宣布推出对话式 AI 服务 Bard—— 很显然是为了对标 ChatGPT—— 的演示视频里出现了一个显而易见的错误回答,然后导致 Google 的市值暴跌了 1000 亿美元,如果这都不算地狱笑话,那什么才算?
「我知道你很急,但你先别急」—— 微软的内心活动,大抵如是。
作为 OpenAI 的最大投资者,微软已经摆出了要把 ChatGPT 薅得一干二净的姿态,从 Bing 到 Office,从后端支持到前端展现,所有的产品资源都在向「整合 ChatGPT」让步。
最新的消息是,微软正在通过邮箱发放新版 Bing 的测试资格,可以直接输入自然语言向 ChatGPT 提出搜索询问,一时间洛阳纸贵,人们纷纷拿出积满灰尘的 Outlook 邮箱排队求码。
给微软的产品排队,这是什么概念呢,上一次可能还是它发售 Windows 95 的时候,各家经销商人满为患⋯⋯
微软的 CEO 萨堤亚・纳德拉放出狠话,说「从此刻开始,搜索的毛利率将永远、不可逆的进入下降轨道。」
这话是说给他的印度老乡、Google 的 CEO 桑达尔・皮查伊听的,老乡见老乡,未必总是两眼泪汪汪。
在 Web 时代,搜索引擎曾被视为完美的商业模式,它既是用户上网冲浪的入口,通过搜索框可以抵达一切地方,输入关键词的行为本身又会主动暴露用户所需,无限利好广告匹配的准确度。
过去几十年里,搜索引擎成功打造出了一套共生系统,网站生产内容,搜索分配流量,大家再一起吃广告预算,就像牙签鸟和鳄鱼的关系,绝对的公平谈不上,但共同利益是稳固的。
App 时代的互联网画地为牢,对搜索引擎有着釜底抽薪的影响,信息被圈在一座座孤岛里,不再对搜索爬虫予取予求,做站的 ROI 也远远比不上做号。
最直接的表现是,在即时性越来越高的世界,搜索体验的滞后性越来越明显了,对于静态的、结构化的需求 —— 比如月球和地球的距离有多远 —— 搜索引擎依然是管用的,但是如果用户想要了解环球影城今天有多少人入园,它就难以告知答案了。
搜索的解决方案通常是做一个 API,然后需要环球影城接进来提供数据,它再去搜索结果端予以呈现,但是当代互联网用户更加熟练的做法是,去社交媒体里搜索,然后就会看到专门更新数据的运营账号。
新鲜的内容不再入库了,这是最早产生的裂缝。
Google 的续命手段相当关键,总结下来最为奏效的有三个:
1、依靠 Android 垄断了智能手机的底层系统,这不止是移动互联网的门票,而且是 VIP 包厢级的;
2、提前收购了较为主流的内容平台,比如 BlogSpot 和 YouTube,尤其是后者,这让 Google 不至于断水绝粮;
3、Web 在英文世界的衰落速度比中文世界慢太多,而 Facebook 等产品的封闭化程度也相当有限。
所以 Google 在资本市场依然可以继续讲述搜索的故事,尽管它不再性感,作为拉动公司发展的现金牛,不断地向创新业务输血,这是 Google 在过去十年里向股东们对话的主流口径。
直到 ChatGPT 的横空出世无情地打破了这套叙事,在能力最擅长、资源最丰富、供养最充足的 AI 领域,Google 被一家区区几百亿美金的公司抢了风头。
这不是业务层的失误,而是战略层的空靶。
去年夏天,Google 的一名工程师因为在和自家机器人聊天程序 LaMDA 沟通时认为对方已经具备人格而被公司施以强制休假的惩罚,一度成为科技行业的热门话题。
尽管当时外界普遍认为这是 AI 领域的又一次成功炒作,但 Google 事实上表现出来的,却是唯恐避之不及的态度,因为它非常害怕脱离技术范畴的讨论。
Google 内部曾有一个饱经挫折的部门「AI 道德委员会」,最新的动态停留在 2019 年,内容为宣布解散。
顾名思义,这本是被 Google 抱有崇高目所组建的,希望汇集一批「独立董事」式的人物,来为公司的 AI 产品划定有所为、有所不为的边界。
然而这个部门从雏形到散伙的过程里就从未消停过纷扰矛盾,不是有人质疑 Google 和军方共享 AI 技术有违伦理,就是抨击委员会里有谁反对气候变化德不配位,总而言之,一地鸡毛。
就像历史上的大多数多边组织一样,共识从来少得可怜,分歧却总是有如泉涌。
自从解散「AI 道德委员会」后,Google 对于 AI 的态度就变得脆断犹疑,具体表现之一,就是极为抵触将 AI 产品开放出来,让用户体验 Beta。
比如 AI 绘画产品 Imagen,Google 不知道发表了多少篇论文,证明它的「跑分」结果吊打包括 OpenAI 旗下在内的所有竞争对手,但是 Imagen 迄今为止都还在 Google 的口袋里,不给用户使用。
Google 提供了充分的理由解释为何要如此藏着掖着 —— 担心遭到恶意滥用⋯⋯避免社会刻板印象⋯⋯以及压迫性观点⋯⋯语言理解有局限性 —— 简而言之,怕出事儿。
无法承受风险,这是 Google 踏入万亿美金俱乐部之后最大的转变,就像 Google Photo 自动给用户照片加标签的功能曾经误给一张照片里的黑人打上了「猩猩」的标签,引起轩然大波之后,Google 最后的处理方案你们根本猜不到。
它选择把所有和灵长类动物有关的词语,从词库里整个删掉了⋯⋯
就在 Google 反复进行内心斗争的时候,OpenAI 把它该揽的活儿全给包了,GPT 和 LaMDA 从卧龙凤雏的关系分道扬镳,一个匣里龙吟惊天下,一个落破凤凰不如鸡。
更重要的是,ChatGPT 这种服务能力,是足以重新定义搜索引擎的。
从微软正在测试的新版 Bing 来看,ChatGPT 带来的最大改变,是搜索引擎史无前例的开始支持自然语言指令。
目前,所有的搜索产品,无论是 Google 还是百度,都只支持程序格式指令,比如你只想让它搜索某个固定网站的结果,就需要在输入框里打出「site: 网址 + 关键词」的组合,你想让它不要显示分词结果,就要在关键词前后加上双引号,等等。
你无法用自然语言告诉一个搜索引擎,让它按照你的需求去行动,因为它不懂,开发它的工程师,只能预留一些程序格式,以及对应的搜索服务,用户必须遵照这些格式提出请求。
这是工程师的造物逻辑,用一段代码去触发另一段代码,当下很多人工智能总是沦为人工智障也是因为这个原因,用户没有按照它的格式对话,然后把机器搞懵了。
ChatGPT 对于自然语言的理解,几乎可以把搜索引擎的传统定义给颠覆了,它不再只限于检索信息,而且还能计算信息。
有人用新版 Bing 搜索了这么一个问题:宜家的 Klippan 型号双人沙发能不能放到我的 2019 款本田奥德赛里,如果折叠座椅的话?
这就是基于自然语言的请求,千百年来人类相互交谈,就是这么进行的,在 ChatGPT 问世以前,没有任何搜索引擎可以消化如此一大段话。
然而,在 Bing 的对话专区里,ChatGPT 已经算出了沙发的体积和奥德赛后排需要放倒几排座椅了。
要我说,Google 的股价跌得还不够多。
我们都知道图形界面的发明史,为了获得低价购入苹果公司股票的机会,打印机巨头施乐邀请乔布斯拜访帕洛尔托研发中心,并在那里向他演示了施乐的计算机研发成果:
一台不需要输入命令行、而是拥有可视化图形界面的电脑。
震惊之余,乔布斯完整吸收了这套工业方案,并将图形界面的设计用在了日后大获成功 Macintosh 上,而比尔・盖茨因为要给 Macintosh 开发软件,也被这套图形界面彻底征服,不再关注 Dos 系统,转而开始研发 Windows。
自此,个人电脑终于有了走进千家万户的推力。
图形界面之于命令行的革命性意义在于,它让电脑不再只是懂程序语言的人才会使用的昂贵机器,任何一个普通人,都能快速熟悉它的基本操作,用鼠标点击一个图标,就能打开一个程序窗口。
据说在 Google 内部,对于 ChatGPT 的评定等级为「红色警报」,这是这家公司成立二十多年以来,第一次出现的警报级别。
如果 ChatGPT 能把自然语言带给搜索引擎,那么搜索的本质都会变得不同,用户将拥有「提需求」的能力,一切复杂的、个性化、精细化的念头,都可以交给 AI 去跑,坐享其成。
与之相比,输入关键词然后在列表里寻找想要的结果这种体验,就和在 Dos 系统下一行行的写命令没什么区别了。
还是举例来说,我想看「马斯克在 2019 年 6 月到 2021 年 3 月之间发过的所有关于月亮且转发量高于 5000 的推文」,这就是一个需求,把它发给 Google,Google 是看不懂的。
但是能够处理自然语言的搜索引擎知道我要什么,它会按照我的要求 —— 如果我自己来,也会这么操作,只不过要花好几个小时 —— 把马斯克在那段时间发布的推文全部看一遍,然后筛选出我需要的推文,全过程用时不到一秒钟。
这还是搜索产品吗?好像也是,只不过更进一步的,它是把搜索的算力资源,私有化了。
ChatGPT 现在已经出现了这样的迹象,每个用户都在部署一个专属于自己的智能助手,而调校得比较好的,和调校得比较差的之间,存在天壤之别。
从 OpenAI 的创始人在那篇「万物摩尔定律」的构想里看,他对 ChatGPT 乃至 AI 行业的设想,绝不仅仅是做几个更加聪明的聊天机器人。
近乎无限的算力,自我学习的网络,前仆后继的资本,最后会重写一套人类史上绝无仅有的经济系统。
所以我在多场 ChatGPT 主题的会议里反复说过一个观点:对于 ChatGPT 现在能做的事情,怎么低估都不过分,它还很笨拙,绝大多数溢美之词都是因为评论者们见识太少,但在 ChatGPT 未来能做的事情上,怎么高估都不为过。
十多年前,我在深圳见过一家做山寨机的公司,手机配置很普通,却卖得特别贵,竟然能够做到每年好几亿的营业额。
这家公司的手机专门卖给做生意的小老板,说服他们买单的原因,是销售会在现场演示的一项功能,智能语音助手。
在那个时候,Siri 大概还是新建文件夹,整个行业语音识别应用率和准确度都相当有限,但是这款山寨机的助手软件却能识别一些非常复杂的命令,比如几号几点给王总发一条生日祝福的短信,连短信文案都不需要准备,它直接就能自动生成准时发送。
更神奇的是,它连环境音都能识别,如果老板在鸣笛声此起彼伏的路况里录入语音,它会在反馈无法听清的同时还贴心地补上一句「请小心驾驶」。
后来山寨机做不下去了,这家公司改做外贸,也分享了这个让自己制霸过一个细分市场的秘密,非常朴实无华:
在东莞组建了一支百余人的话务团队,三班倒工作制,接听机主语音后远程在客户的手机上执行指令,所有那些精确得超出时代的语音识别,都是这些廉价劳动力一条一条听出来的。
所谓的进步大概是我们不必善待 ChatGPT,那些古怪刁钻的提问并不会为难 OpenAI 在印度或是越南的外包团队,恰恰相反,来自用户的输入都是在供养 AI,让它变得强大和深厚。
任何技术的发展路径都是如此,量变引起质变,从念念不忘,到必有回响。
硅谷的风险资本和华尔街的投行们倒是一直在赌下一代计算平台到底会出现在哪里,VR、元宇宙、Web3,每个都上台遛过一圈,但是现在看来,下一代计算平台的形态,未必一定会是某种平台。
这话我们在互联网行业已经听到过太多次,取代一款产品的,往往不是另一款这样的产品。
ChatGPT 以及整个 AIGC 产业很难称得上是一种计算平台,只不过它们的计算资源已经在指数级的爆炸,可以预见的是,由 AI 生成的内容,将在某一天超过人类生产的内容,而这一天的到来,也会比很多人想象的要快。
阿瑟・克拉克在短篇小说「神的九十亿个名字」里,讲了一个关于人类终极任务的故事,僧侣和科学家们造出了一台计算机,通过穷举字母组合的方式,找到了那个不可言说的神的真名,并唤醒了神的降临。
于是最后,「苍穹之上,一片寂寥,群星慢慢地闭上了眼睛。」
如若转载,请注明出处:https://www.zhangzs.com/446435.html