AI贡献4.59亿收入!李彦宏透露已有18%的百度搜索结果由AI生成,文心大模型日均调用量超6亿次,半年增长超10倍【附大语言模型技术路线图】
图源:摄图网
8月22日,百度发布2024年Q2财报,显示季度总营收339亿元,与去年相比大致持平;核心营收267亿元,同比增长1%;核心经营利润56亿元,同比增长23%。
大模型成为了百度财报的焦点之一。百度在6月发布文心大模型4.0 Turbo,近期还下调了两款旗舰模型文心大模型3.5和4.0价格,并免费开放ERNIE Speed、ERNIE Lite、ERNIE Tiny三款模型。
据业绩会披露,文心大模型日均调用量超6亿次,日均处理Tokens文本约1万亿,而23年Q4公布日均调用量为5000万次,半年增长超10倍。
李彦宏表示,已有18%的百度搜索结果由AI生成。同时,智能体在百度生态的分发量有所增加,7月日均分发次数超800万次,为5月的两倍。目前有超过1万个智能体在平台之上。
此外,百度智能云在本季度营收达51亿元,同比增长14%,并实现盈利(Non-GAAP)。同时,AI贡献的收入占比进一步提升至9%,上一季度为6.9%。按此测算,本季度AI贡献的收入约为4.59亿元。
大语言模型技术路线分析
根据技术路线不同,大语言模型可分为Encoder-Decoder(或者Encoder-Only)和Decoder-Only,其中,Encoder-Decoder或者Encoder-Only训练方式为Masked语言模型,代表性模型包括ELMo,BERT,RoBERTa,DistilBERT,BioBERT,XLM,Xlnet,ALBERT,ELECTRA,T5,XLM-E,ST-MoE,AlexaTM;Decoder-Only训练方式为自回归语言模型,代表模型包括GPT-3,OPT,PaLM,BLOOM,GLM,MT-NLG,GLaM,Gopher, chinchilla,LaMDA,GPT-J,LLaMA,GPT-4,BloombergGPT等。
2020年后,Encoder-Only技术基本不在发展,近年来,Encoder-Decoder类型技术路线较多。Encoder-Decoder模型相比Encoder-Only模型,通常具有更强的序列学习和生成能力,尤其擅长实现输入序列到输出序列的结构映射,所以在机器翻译、文摘生成和聊天机器人等任务上有更好的应用前景。但Encoder-Only的模型结构简单,training和inference速度更快,在一些简单分类或标注任务上也具有优势。
国内外主要大语言模型研发路径与技术对比
在大语言模型(LLMs)的全球竞技场中,ChatGPT与Google的Gopher、LaMDA,以及Meta的Llama等构成了国际标杆,而国内则由百度的“文心一言”、360的大语言模型、阿里的“通义千问”和商汤的“商量”等引领潮流。从对话和文本生成能力的角度,ChatGPT暂居优势,但这并非因为技术壁垒不可逾越。实际上,Google等国外企业因战略和技术理念选择了不同的发展路径,这是其暂时落后的主因。随着新技术的不断涌现,赶超ChatGPT并非不可能。相对而言,百度等国内企业在数据集、计算能力和工程化方面存在短板,短期内难以实现对国外模型的迎头赶上,这更多地需要国内AI产业全链条的协同进步。
在影响大语言模型性能的因素方面,训练数据、模型规模(即参数数量)、生成算法和优化技术被认为是核心变量。然而,如何准确量化这些因素对模型性能的具体影响,目前还处于探索阶段,没有明确的结论。总体来看,世界顶级的大语言模型在技术层面上尚未拉开明显的差距。
注:该图表数据截至2024年1月。
中国大语言模型商业化探索进程
截至2024年,中国的大型语言模型(LLMs)在商业化进程中表现出显著的活力和创新。百度的文心一言在智能办公、旅行服务、电商直播、政务服务和金融服务等多个领域实现应用,技术迭代迅速,用户规模庞大。讯飞星火在智能办公上优势明显,2024年4月,公司推出了业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,输出效率、语义理解准确率等均得到提升,在讯飞星火大语言模型的飞速发展下,讯飞自有的硬件产品也受到消费市场的关注,搭载讯飞星火的讯飞智能办公本、讯飞听见、讯飞智能录音笔以及讯飞AI学习机等销量不断攀升。阿里巴巴的通义千问以其开源策略和高性能,在中文大模型领域占据一席之地,推动了低成本、易于部署的商业化解决方案。整体来看,中国的LLMs正通过技术创新、行业合作和安全合规等多维度努力,加速推动AI技术的商业化落地和产业智能化转型。
整体而言,语言大模型能够模仿人类的对话和决策能力,是率先实现技术突破和应用落地的大模型,也是当下人工智能的“主赛道”。目前,语言大模型在金融、医疗、教育、工业、游戏、法律等多个行业得到了广泛的应用。
前瞻产业研究院认为,大型语言模型(LLMs)的发展趋势预示着向更大规模、多模态交互、行业定制化、增强的可解释性、强化的安全性与隐私保护、跨语言能力、开源协作、商业化服务、硬件协同优化,以及法规与伦理框架的构建方向发展。这些趋势将共同推动LLMs在提升性能、拓宽应用场景、增强用户信任、促进技术共享与创新、加快企业集成和部署,以及确保社会责任和伦理标准等方面的进步,从而更广泛地融入各行各业,实现AI技术的可持续和负责任的发展。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《全球及中国多模态大模型行业发展前景与投资战略规划分析报告》
同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。
广告、内容合作请点这里:寻求合作
咨询·服务