AI贡献4.59亿收入！李彦宏透露已有18%的百度搜索结果由AI生成，文心大模型日均调用量超6亿次，半年增长超10倍【附大语言模型技术路线图】

瞻研究 2024-08-23 18:39

图源：摄图网

8月22日，百度发布2024年Q2财报，显示季度总营收339亿元，与去年相比大致持平；核心营收267亿元，同比增长1%；核心经营利润56亿元，同比增长23%。

大模型成为了百度财报的焦点之一。百度在6月发布文心大模型4.0 Turbo，近期还下调了两款旗舰模型文心大模型3.5和4.0价格，并免费开放ERNIE Speed、ERNIE Lite、ERNIE Tiny三款模型。

据业绩会披露，文心大模型日均调用量超6亿次，日均处理Tokens文本约1万亿，而23年Q4公布日均调用量为5000万次，半年增长超10倍。

李彦宏表示，已有18%的百度搜索结果由AI生成。同时，智能体在百度生态的分发量有所增加，7月日均分发次数超800万次，为5月的两倍。目前有超过1万个智能体在平台之上。

此外，百度智能云在本季度营收达51亿元，同比增长14%，并实现盈利（Non-GAAP）。同时，AI贡献的收入占比进一步提升至9%，上一季度为6.9%。按此测算，本季度AI贡献的收入约为4.59亿元。

大语言模型技术路线分析

根据技术路线不同，大语言模型可分为Encoder-Decoder(或者Encoder-Only)和Decoder-Only，其中，Encoder-Decoder或者Encoder-Only训练方式为Masked语言模型，代表性模型包括ELMo，BERT，RoBERTa，DistilBERT，BioBERT，XLM，Xlnet，ALBERT，ELECTRA，T5，XLM-E，ST-MoE，AlexaTM;Decoder-Only训练方式为自回归语言模型，代表模型包括GPT-3，OPT，PaLM，BLOOM，GLM，MT-NLG，GLaM，Gopher， chinchilla，LaMDA，GPT-J，LLaMA，GPT-4，BloombergGPT等。

2020年后，Encoder-Only技术基本不在发展，近年来，Encoder-Decoder类型技术路线较多。Encoder-Decoder模型相比Encoder-Only模型，通常具有更强的序列学习和生成能力，尤其擅长实现输入序列到输出序列的结构映射，所以在机器翻译、文摘生成和聊天机器人等任务上有更好的应用前景。但Encoder-Only的模型结构简单，training和inference速度更快，在一些简单分类或标注任务上也具有优势。

图表8：大语言模型技术分类总结

国内外主要大语言模型研发路径与技术对比

在大语言模型(LLMs)的全球竞技场中，ChatGPT与Google的Gopher、LaMDA，以及Meta的Llama等构成了国际标杆，而国内则由百度的“文心一言”、360的大语言模型、阿里的“通义千问”和商汤的“商量”等引领潮流。从对话和文本生成能力的角度，ChatGPT暂居优势，但这并非因为技术壁垒不可逾越。实际上，Google等国外企业因战略和技术理念选择了不同的发展路径，这是其暂时落后的主因。随着新技术的不断涌现，赶超ChatGPT并非不可能。相对而言，百度等国内企业在数据集、计算能力和工程化方面存在短板，短期内难以实现对国外模型的迎头赶上，这更多地需要国内AI产业全链条的协同进步。

在影响大语言模型性能的因素方面，训练数据、模型规模(即参数数量)、生成算法和优化技术被认为是核心变量。然而，如何准确量化这些因素对模型性能的具体影响，目前还处于探索阶段，没有明确的结论。总体来看，世界顶级的大语言模型在技术层面上尚未拉开明显的差距。

图表4：截至2024年国内外主要大语言模型研发路径与技术对比

注：该图表数据截至2024年1月。

中国大语言模型商业化探索进程

截至2024年，中国的大型语言模型(LLMs)在商业化进程中表现出显著的活力和创新。百度的文心一言在智能办公、旅行服务、电商直播、政务服务和金融服务等多个领域实现应用，技术迭代迅速，用户规模庞大。讯飞星火在智能办公上优势明显，2024年4月，公司推出了业界性能最优的130亿参数的大模型，在效果损失仅3%以内的情况下，输出效率、语义理解准确率等均得到提升，在讯飞星火大语言模型的飞速发展下，讯飞自有的硬件产品也受到消费市场的关注，搭载讯飞星火的讯飞智能办公本、讯飞听见、讯飞智能录音笔以及讯飞AI学习机等销量不断攀升。阿里巴巴的通义千问以其开源策略和高性能，在中文大模型领域占据一席之地，推动了低成本、易于部署的商业化解决方案。整体来看，中国的LLMs正通过技术创新、行业合作和安全合规等多维度努力，加速推动AI技术的商业化落地和产业智能化转型。

图表10：中国代表性大语言模型产品商业化进程

整体而言，语言大模型能够模仿人类的对话和决策能力，是率先实现技术突破和应用落地的大模型，也是当下人工智能的“主赛道”。目前，语言大模型在金融、医疗、教育、工业、游戏、法律等多个行业得到了广泛的应用。

前瞻产业研究院认为，大型语言模型(LLMs)的发展趋势预示着向更大规模、多模态交互、行业定制化、增强的可解释性、强化的安全性与隐私保护、跨语言能力、开源协作、商业化服务、硬件协同优化，以及法规与伦理框架的构建方向发展。这些趋势将共同推动LLMs在提升性能、拓宽应用场景、增强用户信任、促进技术共享与创新、加快企业集成和部署，以及确保社会责任和伦理标准等方面的进步，从而更广泛地融入各行各业，实现AI技术的可持续和负责任的发展。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《全球及中国多模态大模型行业发展前景与投资战略规划分析报告》

同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报、十五五规划等解决方案。如需转载引用本篇文章内容，请注明资料来源（前瞻产业研究院）。

更多深度行业分析尽在【前瞻经济学人APP】，还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】，性价比最高功能最全的企业查询平台。

AI贡献4.59亿收入！李彦宏透露已有18%的百度搜索结果由AI生成，文心大模型日均调用量超6亿次，半年增长超10倍【附大语言模型技术路线图】

相关深度报告

相关阅读

精彩推荐