全球最强开源大模型一夜易主!3000亿的超级独角兽推出DBRX,一举超过扎克伯格、马斯克【附AI大模型行业现状】

瞻研究

1

图源:摄图网

全球最强开源模型,一夜易主!

近日,超级独角兽Databricks重磅推出1320亿参数的开源模型——DBRX,超越了Llama 2(Meta)、Mixtral和Grok-1(注:马斯克旗下AI初创公司xAI研发的大模型)。

据了解,DBRX采用了细粒度MoE架构,推理速度比LLaMA 2-70B快了2倍。最重要的是,训练成本只用了1000万美元和3100块H100,成本直降50%。Databricks就在2个月内推出了DBRX。比起Meta开发Llama2所用的成本和芯片,这是非常小的一部分。

DBRX在语言理解、编程、数学和逻辑方面轻松击败了开源模型LLaMA2-70B、Mixtral,以及Grok-1。另外,与闭源模型GPT-3.5相比,DBRX Instruct的性能全面超越了它,甚至还可与Gemini 1.0 Pro和Mistral Medium相较量。

Databricks自从2013年成立以来共完成了11轮融资,根据最新一轮融资,Databricks估值高达430亿美元(约合3000亿元人民币)。

Databricks通过DBRX向Meta、谷歌、OpenAI等AI公司发起挑战。目前,企业可以在Databricks平台上访问DBRX,能在RAG系统中利用长上下文功能,还可以在自己的私有数据上构建定制的DBRX模型。而开源社区可以通过GitHub存储库和Hugging Face访问DBRX。

中国AI算力产品竞争态势

目前可以衡量国内AI算力竞争情况的模型有百度的文心大模型、腾讯的混元大模型、华为盘古大模型、阿里的通义大模型以及浪潮的源AI大模型。其中参数量最高的是阿里的通义大模型,高达十万亿级,而应用场景相对较广的是百度的文心大模型,涵盖聊天互动、文本生产以及文生图等。

图表4:2023年中国AI算力产品竞争情况

易用性和性能成为AI框架的核心竞争力

中国人工智能开发者选择开源框架最重要的两个因素是:易用性和性能。人工智能框架隔离了底层的复杂性,更加易用的框架能够让开发人员以更快的速度和更高的效率,来探索、创建、改进和迭代人工智能项目。而人工智能框架的性能则涉及到框架本身的底层性能,包括框架的底层算法效率,以及框架利用底层硬件资源进行优化开发、训练和推理的能力。

有40%的开发者将“易用性“作为选择框架的首选因素,34%的开发者将”性能“作为选择框架的首选因素。在第二重要的因素选择中,开发者选择“性能”比“易用性”更多。与“易用性”和“性能”这两个因素相比,选择其他选项作为首选的比例很少。受访者把对“社区活跃度”、“框架厂商提供的技术支持或培训”,“知名度或流行程度”,以及“前沿技术支持”的关注放在了同等位置上。

图表4:2022年中国开发者选择AI框架的前三大考虑因素(单位:%)

泛开发、全场景、超大规模将成为主流趋势

展望未来,AI框架将注重前端便捷性与后端高效性的统一,AI框架将支持端边云全场景跨平台设备部。另外,随着处理任务的复杂化、处理数据的密集化,跨架构的开发能力将会成为常态化的需求。AI框架需要与硬件基础设施平台充分解耦,通过标准的硬件注册接口实现跨设备平台的快速部署。

图表5:中国AI框架行业发展趋势分析

中国科学院院士、复旦大学副校长张人禾表示,科学智能正在改变基础科学研究范式,新型大模型融合了Type 1(数据驱动)与Type 2(机理驱动)模型,将科学机理、知识注入模型构建中。有效融合数据和机理,降低大数据和大算力依赖,提升模型可解释性。

360CEO周鸿祎指出,大模型首次让人们看到了人工智能的统一可能性。他解释说,尽管人工智能在过去一直备受关注,但其实际应用一直受限于各个领域的算法不统一。而大模型则通过统一的数据处理和知识方法,有可能将众多人工智能垂直领域的问题统一解决。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《中国人工智能行业发展前景预测与投资战略规划分析报告

同时前瞻产业研究院还提供产业大数据产业研究报告产业规划园区规划产业招商产业图谱智慧招商系统行业地位证明IPO咨询/募投可研专精特新小巨人申报等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。

可行性研究报告

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐