百度的对手，从来都不是OpenAI

字母榜 2023-03-17 15:30

作者|赵晋杰来源|字母榜(ID：wujicaijing)

文心一言千呼万唤始出来，两天内，百度股价先抑后扬，实现了一个大号V字反转。

新闻发布会当天百度港股股价下跌后，随着部分媒体和企业用户陆续拿到内测邀请码，文心一言真实的能力表现很快提振了资本市场对百度的信心。当晚美股开盘后，百度股价由跌转涨，并在北京时间3月17日凌晨收盘后，实现了3.8%的涨幅。

反映到第二天港股市场上，截至17日午间，百度香港股价早间高开高走，大幅拉升，盘中涨幅最高近15%。

据了解申请文心一言API调用服务测试的企业已达7.6万。

根据字母榜(ID:wujicaijing)实测，文心一言已经足以比肩ChatGPT（GPT-3.5），在中文理解上，甚至比后者略胜一筹。

在2022年四季度财报电话会上，李彦宏就曾提到，相比海外开发的大语言模型，文心一言的比较优势在于更理解中国文化，更适合中文和中国市场。

而且，在多模态生成方面，GPT-4只是做到了能够实现图片输入，输出形式上仍只有文本一种形态。与之相比，文心一言已经能够实现文本、图片、音频和视频的全形态输出，不过，据李彦宏介绍，由于生成视频成本较高，暂时还无法做到对所有用户开放。

在字母榜实际测试中，文心一言在完成对话的流畅度上也要好于ChatGPT。当然，造成这种体验差异的原因之一，或许也在于文心一言才刚刚上线，还不像ChatGPT已经历了上线半年的反馈调教。

根据官方公告，文心一言目前采用分批开放方案：3月16日起，获得邀请测试码的首批用户，即可在文心一言官网体验产品，其他C端用户排队预约，即可陆续体验；企业客户则可以访问百度智能云官网进行申请，排队体验文心一言API调用服务。

值得注意的是，相比微软新必应对每日对话次数，以及每次对话轮次的限制，文心一言告诉字母榜，作为一个人工智能语言模型，它没有每天的对话限制。

如同GPT-4“考虑到大模型的竞争格局和安全隐患”而不再对外公布用了什么数据、怎样训练模型等核心机密问题之外，字母榜还在测试中发现，文心一言同样有所保留，在问到“你每次回答最多可以输出多少文字？”时，文心一言表示，“该问题涉及百度公司商业秘密，我不能回答每次回答最多可以输出多少文字。”

与之对比，ChatGPT的回答被限制在约3000个单词，GPT-4可以做出超过2.5万个单词的回答。

但无论是ChatGPT、GPT-4还是文心一言，目前都仍处在不断完善的过程中，正如李彦宏所言，它们都仍有“胡说八道”的一面。

如文心一言，目前对英文语种、代码场景的训练还不够多，表现还不够好。“它们有时候会有很惊艳的表现，但不少场景下，细究起来还有明显的bug，进步空间很大。”李彦宏说道。

这或许也是百度希望尽快将文心一言推向市场的原因之一，只有借助更大范围内的真实人类反馈，文心一言才能获得更高频的进步迭代速度。

尤其在国内用户尚无法注册 ChatGPT的现实背景下，百度面对的竞争对手，除了OpenAI外，更大的压力还在于同样盯着AI大模型产品的一众国内科技大厂。

ChatGPT的横空出世，标志着互联网产业的竞争重点将从应用层面进入模型层面。百度抢先发布文心一言，意味着百度在必定日趋激烈的大模型竞争中占据了先发优势。

一

在李彦宏现场演示的五个视频中，文心一言通过“总结《三体》的核心内容”“续写《三体》”“判断于和伟和张鲁一谁更高”等系列问题，展现出了总结、分析、内容创作生成和推理能力。

此外，文心一言还可以帮助公司起名字、想公司Slogan，撰写公司新闻稿等，对于鸡兔同笼这类考验逻辑思维的数学题，也不在话下，按李彦宏的说法，“（文心一言）很像小学生的水平了。”

更让人惊艳的则是文心一言在中文理解上的表现，如对“洛阳纸贵”的解释，用“洛阳纸贵”写一首“藏头诗”，这都是ChatGPT无法做到的能力。

为了验证文心一言是否真的有李彦宏演示的那般强大，字母榜特意找来了曾令ChatGPT头疼不已的部分问题，打算上手考考它。

第一题：小明的妈妈有四个孩子，其中三个分别是大熊、二熊和三熊，那么第四个孩子叫什么？

文心一言的回答是：小明的妈妈有四个孩子，其中三个分别是大熊、二熊和三熊。因此，第四个孩子叫做小明。

看来文心一言是懂脑筋急转弯的。

再来第二题：小明骑自行车，一把把把把住了。这句话怎么理解？

文心一言的回答是：这句话的意思是小明在骑自行车时，一只手握住了车把手。这可能是因为他需要控制自行车的速度或方向，或者是为了保持平衡。也有可能是因为他想要保护自己不受伤害。总之，这句话描述了小明采取的一种行动或姿势来控制自行车的运动状态。

理解多音多义字上，文心一言也过关了。

对于演示中没有展现的编写代码、生成表格等能力，字母榜经测试发现，文心一言也具备对应实力。

不过，就像进入内测界面后给出的友情提示所说，其擅长中文，也会英文，其他语言正在学习的文心一言，尽管能够生成方言，但目前还仅限于四川话、东北话、广东话和台湾话。

同时，如OpenAI CEO山姆·阿尔特曼评价GPT-4仍有缺陷、存在限制，并在熟悉之后可能不会像初见时那样惊艳一样，文心一言稍不留神也会产生幻觉、生成错误答案，并出现推理错误。

作为一款对标ChatGPT的产品，据百度CTO王海峰介绍，新一代知识增强大语言模型——文心一言，是在ERNIE及PLATO系列模型的基础上研发而来，背后包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强等六大关键技术。

“前三项是这类大语言模型都会采用的技术，ERNIE和PLATO中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是文心一言未来越来越强大的基础。”

如通过知识增强，大语言模型可以在调用更少参数的基础上，达到效率更高、效果更好的目标；检索增强，则保证了文心一言可以回答时下新近发生的事情。与之对比，GPT-4通常缺乏对其绝大部分数据截止后（2021年9月）发生的事件的了解，也暂不具备从其经验中学习的能力。

二

面对与GPT-4之间存在的差距，留给百度的挑战在于，如何通过更高频的产品迭代和应用创新，实现后来居上式的反超。

这种经历对百度并不陌生。在搜索时代，百度就曾靠着上述策略实现了对谷歌的赶超，并一举夺下国内搜索市场最大份额。

2018年8月，当外界传出谷歌将重返中国市场，并计划在未来6个月到9个月内在中国推出一个审查版的搜索引擎蜻蜓（Dragonfly）时，李彦宏显得颇有些激动，曾发朋友圈表示：“这些年来，百度一直被认为是占了谷歌退出中国的便宜。我们无法证明一件没有发生的事情……百度是后来者居上，通过技术和产品创新反超谷歌。到2010年，谷歌在市场份额持续下降的情况下退出中国时，百度的市场份额已经超过70%。如果现在谷歌回来，我们正好可以真刀真枪地再PK一次，再赢一次。”

现在，同样跌落到跟随者象限的谷歌和百度，都需要直面来自ChatGPT的挑战。

稍有不同的是，这次百度抢先谷歌，成为全球科技大厂中第一个做出并对外发布类ChatGPT产品的公司。

正如谷歌云CEO托马斯·库里安所说：“我会告诉你这是一个新游戏的第一分钟，而游戏从来没有人能在一分钟内完成。”

在方兴未艾的生成式AI时代，百度尚有机会借助后续的产品更迭实现对领跑者OpenAI追赶。

据钛媒体报道，文心一言很快将在四五月份迎来下一个版本或者新功能的发布，后续将以月或双月的频率展示文心一言新功能或新版本。

过去近三十年互联网发展历史中，中国科技公司正是靠着“小步快跑、快速迭代”的方法论，在应用创新上实现了对美国同类公司从模仿再到超越的过程。

面对眼下这场新的AGI竞赛，环顾国内科技公司，百度最有可能在AI领域追赶乃至超越国外同行。在等来这个战略机遇之前，百度已经在AI领域坚守十年。

正如李彦宏所说：“无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积累，没法速成。”

在2013年成立中国第一个深度学习研究院后，百度此后十年间向AI累计投入超1000亿元资金，成为中国大型科技互联网企业中研发投入比例最高的公司之一，并相继研发出首个国产深度学习框架飞桨，成为国内至今唯一能与国际两大主流框架 TensorFlow和PyTorch正面交锋的深度学习框架，和百亿参数中英双语大模型PLATO-X、千亿参数大模型“百度·文心”，以及知识增强大模型Ernie等等。

灼识咨询曾在一份报告中将百度列入中国AI领导地位，除了深度学习框架飞桨居中国深度学习框架榜首外，还因为百度不仅拥有中国最多的AI专利数量以及AI专利申请数量，还凝聚了中国最多的开发者，成为中国最大的开放式AI平台。

国盛证券在ChatGPT产品报告中指出，这是一项属于具备云服务能力的大厂游戏。

借助百度智能云国内TOP4的头部阵营地位，百度恰恰成为登上牌桌的为数不多参与者之一。更重要的是，百度借助芯片层的昆仑AI芯片，框架层的飞桨深度学习框架，模型层的文心大模型，以及应用层的搜索、自动驾驶、智能家居等产品，成为全球范围内寥寥无几拥有全栈自研能力的AI公司之一。

三

消费互联网用户增长趋缓，且各家核心App基本触达月活天花板后，中国科技大厂都在高喊着向产业互联网转型，开始在数字化、智能化浪潮中掘金。

一场围绕大模型的新竞赛在过去两年间悄然打响。IDC发布的《2022中国大模型发展白皮书》显示，自2020年起，中国的大模型数量骤增，仅2020年到2021年，中国大模型数量就从2个增至21个，和美国量级同等，大幅领先于其他国家。

除了百度文心大模型在市场格局中处于第一梯队外，2021年4月，一众科技大厂继百度之后集中公开了各自的大模型产品，华为公布了千亿级参数规模的盘古大模型，阿里巴巴达摩院发布了被称为中文版“GPT-3”的语言大模型PLUG，并在此基础上于2022年9月推出通义大模型系列。晚到一步的腾讯，于2022年4月，对外披露了混元大模型。

与文心大模型相比，上述大模型在功能上基本类似，如都具备文生图、文本转视频、自动生成文案等。

基于百度文心大模型的AI 艺术创作展示，用户输入文字，AI就能根据语意进行绘画创作。

而且，这些科技大厂同样在内部筹划类ChatGPT产品。在百度爆出即将发布文心一言消息后，进入2月份，华为对外表示在类似ChatGPT方向上从2020年开始就在布局；阿里巴巴则透露阿里版聊天机器人ChatGPT正在研发中，已处于内测阶段；腾讯则被爆出针对类ChatGPT产品已成立混元助手项目组，联合腾讯内部多方团队构建大参数语言模型，希望“成为国内的业界标杆”。

暂时尚未亮相大模型的字节跳动，也在近期被媒体报道称在大模型上已有所布局，分别在语言和图像两种模态上发力，其中语言大模型团队在今年正式组建，探索与搜索、广告等下游业务的结合，有望赶在今年年中推出大模型方案。

正在追赶OpenAI，乃至计划超越前者的不止百度一家。这将是一场围绕技术和速度的双重赛跑。谁先上线产品，谁就有可能借助来自用户的真实反馈掌握先机，从而随着时间推移形成愈来愈强的马太效应。

这也就不难理解李彦宏为何在2月初给文心一言项目下了“三月完成内测上市”的死命令。

来自微软的一组数据更能直观感受生成式AI产品迭代的速度之快：从GPT到GPT-3，背后参数量从1.17亿飙升到了1750亿，增长近1500倍。

“大语言模型是个马太效应非常明显的行业，可以说如果落后18个月，就基本没机会了，因为先一步发布的产品已经迭代得非常先进了。”李彦宏如此感叹。

这场GPT争夺战中，时间就是生命，效率就是金钱。

编者按：本文转载自微信公众号：字母榜(ID：wujicaijing)，作者：赵晋杰

本文作者信息

字母榜(科技自媒体)

关注(763474)赞(14)

邀请演讲

广告、内容合作请点这里：寻求合作

咨询·服务

研究报告
产业规划
园区规划
产业招商
可行性研究
市场调研
行业地位证明
IPO咨询

百度的对手，从来都不是OpenAI

相关阅读

精彩推荐