百度的对手,从来都不是OpenAI

字母榜

作者|赵晋杰 来源|字母榜(ID:wujicaijing)

文心一言千呼万唤始出来,两天内,百度股价先抑后扬,实现了一个大号V字反转。

新闻发布会当天百度港股股价下跌后,随着部分媒体和企业用户陆续拿到内测邀请码,文心一言真实的能力表现很快提振了资本市场对百度的信心。当晚美股开盘后,百度股价由跌转涨,并在北京时间3月17日凌晨收盘后,实现了3.8%的涨幅。

反映到第二天港股市场上,截至17日午间,百度香港股价早间高开高走,大幅拉升,盘中涨幅最高近15%。

据了解申请文心一言API调用服务测试的企业已达7.6万。

根据字母榜(ID:wujicaijing)实测,文心一言已经足以比肩ChatGPT(GPT-3.5),在中文理解上,甚至比后者略胜一筹。

在2022年四季度财报电话会上,李彦宏就曾提到,相比海外开发的大语言模型,文心一言的比较优势在于更理解中国文化,更适合中文和中国市场。

而且,在多模态生成方面,GPT-4只是做到了能够实现图片输入,输出形式上仍只有文本一种形态。与之相比,文心一言已经能够实现文本、图片、音频和视频的全形态输出,不过,据李彦宏介绍,由于生成视频成本较高,暂时还无法做到对所有用户开放。

在字母榜实际测试中,文心一言在完成对话的流畅度上也要好于ChatGPT。当然,造成这种体验差异的原因之一,或许也在于文心一言才刚刚上线,还不像ChatGPT已经历了上线半年的反馈调教。

根据官方公告,文心一言目前采用分批开放方案:3月16日起,获得邀请测试码的首批用户,即可在文心一言官网体验产品,其他C端用户排队预约,即可陆续体验;企业客户则可以访问百度智能云官网进行申请,排队体验文心一言API调用服务。

值得注意的是,相比微软新必应对每日对话次数,以及每次对话轮次的限制,文心一言告诉字母榜,作为一个人工智能语言模型,它没有每天的对话限制。

如同GPT-4“考虑到大模型的竞争格局和安全隐患”而不再对外公布用了什么数据、怎样训练模型等核心机密问题之外,字母榜还在测试中发现,文心一言同样有所保留,在问到“你每次回答最多可以输出多少文字?”时,文心一言表示,“该问题涉及百度公司商业秘密,我不能回答每次回答最多可以输出多少文字。”

与之对比,ChatGPT的回答被限制在约3000个单词,GPT-4可以做出超过2.5万个单词的回答。

但无论是ChatGPT、GPT-4还是文心一言,目前都仍处在不断完善的过程中,正如李彦宏所言,它们都仍有“胡说八道”的一面。

如文心一言,目前对英文语种、代码场景的训练还不够多,表现还不够好。“它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。”李彦宏说道。

这或许也是百度希望尽快将文心一言推向市场的原因之一,只有借助更大范围内的真实人类反馈,文心一言才能获得更高频的进步迭代速度。

尤其在国内用户尚无法注册 ChatGPT的现实背景下,百度面对的竞争对手,除了OpenAI外,更大的压力还在于同样盯着AI大模型产品的一众国内科技大厂。

ChatGPT的横空出世,标志着互联网产业的竞争重点将从应用层面进入模型层面。百度抢先发布文心一言,意味着百度在必定日趋激烈的大模型竞争中占据了先发优势。

在李彦宏现场演示的五个视频中,文心一言通过“总结《三体》的核心内容”“续写《三体》”“判断于和伟和张鲁一谁更高”等系列问题,展现出了总结、分析、内容创作生成和推理能力。

此外,文心一言还可以帮助公司起名字、想公司Slogan,撰写公司新闻稿等,对于鸡兔同笼这类考验逻辑思维的数学题,也不在话下,按李彦宏的说法,“(文心一言)很像小学生的水平了。”

更让人惊艳的则是文心一言在中文理解上的表现,如对“洛阳纸贵”的解释,用“洛阳纸贵”写一首“藏头诗”,这都是ChatGPT无法做到的能力。

为了验证文心一言是否真的有李彦宏演示的那般强大,字母榜特意找来了曾令ChatGPT头疼不已的部分问题,打算上手考考它。

第一题:小明的妈妈有四个孩子,其中三个分别是大熊、二熊和三熊,那么第四个孩子叫什么?

文心一言的回答是:小明的妈妈有四个孩子,其中三个分别是大熊、二熊和三熊。因此,第四个孩子叫做小明。

看来文心一言是懂脑筋急转弯的。

再来第二题:小明骑自行车,一把把把把住了。这句话怎么理解?

文心一言的回答是:这句话的意思是小明在骑自行车时,一只手握住了车把手。这可能是因为他需要控制自行车的速度或方向,或者是为了保持平衡。也有可能是因为他想要保护自己不受伤害。总之,这句话描述了小明采取的一种行动或姿势来控制自行车的运动状态。

理解多音多义字上,文心一言也过关了。

对于演示中没有展现的编写代码、生成表格等能力,字母榜经测试发现,文心一言也具备对应实力。

不过,就像进入内测界面后给出的友情提示所说,其擅长中文,也会英文,其他语言正在学习的文心一言,尽管能够生成方言,但目前还仅限于四川话、东北话、广东话和台湾话。

同时,如OpenAI CEO山姆·阿尔特曼评价GPT-4仍有缺陷、存在限制,并在熟悉之后可能不会像初见时那样惊艳一样,文心一言稍不留神也会产生幻觉、生成错误答案,并出现推理错误。

作为一款对标ChatGPT的产品,据百度CTO王海峰介绍,新一代知识增强大语言模型——文心一言,是在ERNIE及PLATO系列模型的基础上研发而来,背后包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强等六大关键技术。

“前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。”

如通过知识增强,大语言模型可以在调用更少参数的基础上,达到效率更高、效果更好的目标;检索增强,则保证了文心一言可以回答时下新近发生的事情。与之对比,GPT-4通常缺乏对其绝大部分数据截止后(2021年9月)发生的事件的了解,也暂不具备从其经验中学习的能力。

面对与GPT-4之间存在的差距,留给百度的挑战在于,如何通过更高频的产品迭代和应用创新,实现后来居上式的反超。

这种经历对百度并不陌生。在搜索时代,百度就曾靠着上述策略实现了对谷歌的赶超,并一举夺下国内搜索市场最大份额。

2018年8月,当外界传出谷歌将重返中国市场,并计划在未来6个月到9个月内在中国推出一个审查版的搜索引擎蜻蜓(Dragonfly)时,李彦宏显得颇有些激动,曾发朋友圈表示:“这些年来,百度一直被认为是占了谷歌退出中国的便宜。我们无法证明一件没有发生的事情……百度是后来者居上,通过技术和产品创新反超谷歌。到2010年,谷歌在市场份额持续下降的情况下退出中国时,百度的市场份额已经超过70%。如果现在谷歌回来,我们正好可以真刀真枪地再PK一次,再赢一次。”

现在,同样跌落到跟随者象限的谷歌和百度,都需要直面来自ChatGPT的挑战。

稍有不同的是,这次百度抢先谷歌,成为全球科技大厂中第一个做出并对外发布类ChatGPT产品的公司。

正如谷歌云CEO托马斯·库里安所说:“我会告诉你这是一个新游戏的第一分钟,而游戏从来没有人能在一分钟内完成。”

在方兴未艾的生成式AI时代,百度尚有机会借助后续的产品更迭实现对领跑者OpenAI追赶。

据钛媒体报道,文心一言很快将在四五月份迎来下一个版本或者新功能的发布,后续将以月或双月的频率展示文心一言新功能或新版本。

过去近三十年互联网发展历史中,中国科技公司正是靠着“小步快跑、快速迭代”的方法论,在应用创新上实现了对美国同类公司从模仿再到超越的过程。

面对眼下这场新的AGI竞赛,环顾国内科技公司,百度最有可能在AI领域追赶乃至超越国外同行。在等来这个战略机遇之前,百度已经在AI领域坚守十年。

正如李彦宏所说:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”

在2013年成立中国第一个深度学习研究院后,百度此后十年间向AI累计投入超1000亿元资金,成为中国大型科技互联网企业中研发投入比例最高的公司之一,并相继研发出首个国产深度学习框架飞桨,成为国内至今唯一能与国际两大主流框架 TensorFlow和PyTorch正面交锋的深度学习框架,和百亿参数中英双语大模型PLATO-X、千亿参数大模型“百度·文心”,以及知识增强大模型Ernie等等。

灼识咨询曾在一份报告中将百度列入中国AI领导地位,除了深度学习框架飞桨居中国深度学习框架榜首外,还因为百度不仅拥有中国最多的AI专利数量以及AI专利申请数量,还凝聚了中国最多的开发者,成为中国最大的开放式AI平台。

国盛证券在ChatGPT产品报告中指出,这是一项属于具备云服务能力的大厂游戏。

借助百度智能云国内TOP4的头部阵营地位,百度恰恰成为登上牌桌的为数不多参与者之一。更重要的是,百度借助芯片层的昆仑AI芯片,框架层的飞桨深度学习框架,模型层的文心大模型,以及应用层的搜索、自动驾驶、智能家居等产品,成为全球范围内寥寥无几拥有全栈自研能力的AI公司之一。

消费互联网用户增长趋缓,且各家核心App基本触达月活天花板后,中国科技大厂都在高喊着向产业互联网转型,开始在数字化、智能化浪潮中掘金。

一场围绕大模型的新竞赛在过去两年间悄然打响。IDC发布的《2022中国大模型发展白皮书》显示,自2020年起,中国的大模型数量骤增,仅2020年到2021年,中国大模型数量就从2个增至21个,和美国量级同等,大幅领先于其他国家。

除了百度文心大模型在市场格局中处于第一梯队外,2021年4月,一众科技大厂继百度之后集中公开了各自的大模型产品,华为公布了千亿级参数规模的盘古大模型,阿里巴巴达摩院发布了被称为中文版“GPT-3”的语言大模型PLUG,并在此基础上于2022年9月推出通义大模型系列。晚到一步的腾讯,于2022年4月,对外披露了混元大模型。

与文心大模型相比,上述大模型在功能上基本类似,如都具备文生图、文本转视频、自动生成文案等。

基于百度文心大模型的AI 艺术创作展示,用户输入文字,AI就能根据语意进行绘画创作。

而且,这些科技大厂同样在内部筹划类ChatGPT产品。在百度爆出即将发布文心一言消息后,进入2月份,华为对外表示在类似ChatGPT方向上从2020年开始就在布局;阿里巴巴则透露阿里版聊天机器人ChatGPT正在研发中,已处于内测阶段;腾讯则被爆出针对类ChatGPT产品已成立混元助手项目组,联合腾讯内部多方团队构建大参数语言模型,希望“成为国内的业界标杆”。

暂时尚未亮相大模型的字节跳动,也在近期被媒体报道称在大模型上已有所布局,分别在语言和图像两种模态上发力,其中语言大模型团队在今年正式组建,探索与搜索、广告等下游业务的结合,有望赶在今年年中推出大模型方案。

正在追赶OpenAI,乃至计划超越前者的不止百度一家。这将是一场围绕技术和速度的双重赛跑。谁先上线产品,谁就有可能借助来自用户的真实反馈掌握先机,从而随着时间推移形成愈来愈强的马太效应。

这也就不难理解李彦宏为何在2月初给文心一言项目下了“三月完成内测上市”的死命令。

来自微软的一组数据更能直观感受生成式AI产品迭代的速度之快:从GPT到GPT-3,背后参数量从1.17亿飙升到了1750亿,增长近1500倍。

“大语言模型是个马太效应非常明显的行业,可以说如果落后18个月,就基本没机会了,因为先一步发布的产品已经迭代得非常先进了。”李彦宏如此感叹。

这场GPT争夺战中,时间就是生命,效率就是金钱。

编者按:本文转载自微信公众号:字母榜(ID:wujicaijing),作者:赵晋杰 

可行性研究报告
字母榜

本文作者信息

字母榜(科技自媒体)

关注(480962)赞(12)

邀请演讲

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐