李彦宏给AI开发者搭了一把梯子

解码Decode

作者|解码工作室 来源|解码Decode(ID:kankeji001)

1725年,法国的纺织工人Basile Bouchon发明了一种织布机,可以根据送入的穿孔卡片指令编织图案。打孔的是“1”,没有打孔是“0”。这几乎是最早出现的二进制代码,虽然此后执行的机器发生了很大变化,但代码的基本构建块却就此延续了下来。

三百年后,编程已成为改变世界的无形力量。今天我们手中的智能手机、办公室的自动化系统甚至工厂的智能制造,它无处不在。

但AI浪潮的席卷速度,不仅超过了以往任何一场技术革命,也让编程有了另外一种可能——按照李彦宏的说法,大模型和生成式AI将彻底改变开发者这个群体。

而在这背后,是百模大战后徐徐铺开的AI原生应用建设,以及在这关键的赛道上,中国企业已经率先站上了起跑线。

1

AI原生应用开发,没那么复杂

到目前为止,全世界已经发展出超过600门的编程语言。从语法简单只有32个keywords的C语言,到以但丁《地狱》中第八层地狱命名的Malbolge(第一个程序花了两年时间才被写出来)。

但无论是哪种编程语言,开发者想要创建程序就要敲下海量的代码。随着代码量越来越大,程序开发工作也变得无比繁杂。

例如Windows 95只有1500万行,Windows XP为3500万行,而目前程序员写出来的最大软件是Google在线服务,大概是20亿行代码,大概是一名程序员正常发量的13000倍。

而当前正值移动互联网转向AI时代,按照李彦宏的观点,AI时代需要100万量级的原生应用,趋近2021年手机App总量的三分之一。

如果参考支付宝仅2019年一年就增加了4亿行代码(相当于80个魔兽世界)的话,AI原生应用需要程序员敲下的代码量可想而知。

而且AI原生应用在逻辑上完全不同于Native App,需要以AI为出发点,将AI作为核心驱动力,重新设计和构建应用。

不久前,一位开发者在论坛上发布了一则AI原生应用速通指南,虽然开发流程只有5条,但对于开发者来说工作量并不低,仅数据准备一项就要耗费大量的人力物力,更别提需要用到的关键技术。

但随着Transformer推开大模型时代的大门,不仅AI应用的转机来了,程序员开发者的转机也出现了。

在AI时代,科技巨头们不仅在意如何让技术更容易地被用户接受,同时也在思考如何简化程序员的工作。

去年OpenAI推出的GPTs和今年Hugging Face发布的HuggingChat助手,它们通过将能力封装,把开发门槛拉低,进而创造了一个新的职业——不会编程的开发者、任何一个普通用户都能创建自己的AI应用。

如今,给普通人搭梯子的名单上又多了一家科技巨头,并且是使用中文作为自然语言prompt。

2

“人人都是开发者”

「打开开发界面,第一步给应用起名,第二步填写角色指令,第三步再插入需要的工具组件。」

这是出现在今年Create2024百度AI开发者大会上的一幕。在零代码的情况下,一个AI原生应用就生成了。

开发者借助百度发布的AI原生应用开发工具AppBuilder,不写一行代码,最快只需三步,就可以用自然语言开发出一个应用,并且还能便捷地发布、集成到各种各样的业务环境中。

在AppBuilder上面,百度也提供了一定的跨模态能力,开发者只需要给一段文字,或者几句话,就可以快速创建绘画类应用。百度文库最新推出的漫画生成和绘本生成功能,就利用了AppBuilder上提供的这类组件。

关键,类似这样的开发工具,百度一口气发布了三款,除了AppBuilder,还有智能体开发工具AgentBuilder和面向专业开发者的ModelBuilder,主打一个「开箱即用」。

其中,AgentBuilder也是零代码开发,整个过程完全不需要编程,通过类似prompt(提示词)的信息输入,和简单的几步操作调优,就能迅速生成一个智能体。目前百度已经与携程合作,提供酒店、景点、票务等旅游服务工具。

而为专业开发者准备的ModelBuilder,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,达到更好的效果。

ModelBuilder中既包括适合通用复杂场景的旗舰版ERNIE3.5和ERNIE4.0,也有Speed、Lite、Tiny三个轻量级大模型和ERNIE Character、ERNIE Functions两个垂直场景模型,也覆盖了国内外其它第三方主流模型,预置量多达77个大模型,是国内拥有大模型数量最多的开发平台。

前两款工具可实现“人人都是开发者”,相当于是AI原生应用的冲量担当,而后一款工具则是保质担当。

李彦宏判断,未来绝大多数的AI原生应用都是MoE的,也就是大小模型混用,不依赖一个模型来解决所有问题。

而ModelBuilder也是参考MoE思路,开发者在一个平台上可调用多个大模型,意味着开发成本和产品性能都能达到相对最优。

大会上展示的小度添添AI机器人日程规划功能,就是调用了不同的模型。

先是由小模型ERNIE Tiny执行“模型路由”工作,把晨跑中的天气问题分配给基于ERNIE Lite打造的精调模型,快速查出气温25度、天气晴朗这些信息;同时,又把更复杂的日程安排,分配给性能最好的文心4.0大模型,来计算一天各项事项安排。

总的来说,MoE架构既能提升开发平台的“宽度”,也能兼顾“深度”,大大降低开发时的算力消耗,降低应用门槛。

对多模态大模型而言,百度推出的三大AI开发神器,将会加速killer App的出现时间,而对于视觉大模型来说,其最大应用场景——自动驾驶,早已被市场验真了。

百度在视觉大模型的发展有目共睹,不只是训练AI如何生成视频,更是训练AI理解和生成一个真实的场景或世界。

基于超过1亿公里的中国复杂城市道路测试里程数据,百度训练出来的Apollo视觉感知大模型,具备检测、跟踪、理解、建图四大基础能力。百度也将这些能力下放到了具体产品,比如已在武汉实现7X24小时全天候运营的萝卜快跑,以及将视觉感知大模型应用到了制图领域的百度地图。

3

梯子要稳固

去年,著名计算机科学家吴恩达曾在斯坦福做过一场题演讲。他认为AI其实和电力、互联网一样,是一项通用技术,更多的机会在于大规模应用落地。

这与李彦宏此前的观点不谋而合。在基础模型之上,要有千千万万甚至数以百万计的AI原生应用,大模型的价值才能被体现出来。

而今天百度发布的三大AI开发神器,相当于搭了一把梯子,让开发者和企业能够不费力的进入AGI时代。但这里面一个重要的前提是,这把梯子要足够的稳固。

而所谓稳固,指的就是基础大模型的技术水平要过硬。

从数据上看,相比一年前文心大模型的算法训练效率提升了5.1倍,周均训练有效率超过了98%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。

发布一年零一个月以来,文心一言用户数突破2亿,API日均调用量也突破了2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。

对于企业和开发者来说,基于文心大模型开发原生应用、做二次开发,都能够拥有更低的推理成本和更高的训练效率。

这主要基于李彦宏此前对大模型一个精准判断,与模型开源会越来越落后不同,闭源有真正商业模式,能够赚到钱,且在成本上有优势,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。

事实上,有了强大的基础大模型,百度能提供很多低门槛,甚至零门槛的开发工具,大大提高开发者的生产力。比如三大AI开发工具之外,基于文心大模型的智能代码助手Comate。

不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、进行代码续写、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。

上岗一年多以来,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。

显然,想要壮大AI原生应用生态,仅靠某一家公司远远不够,需要发动更多人一起参与创新。

去年5月,百度启动了“文心杯”创业大赛,帮助创业者、开发者开发各种AI原生应用。在第一届大赛中,百度为15支优胜团队提供了数千万元的资金支持,并在技术、团队和资源上持续提供全方位扶持。今年将扩大项目筛选范围、设置分赛场,加大对创业者的支持力度,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。

4

尾声

2023年6月,Open AI安全系统负责人&前应用研究负责人Lilian Weng在博客中发表了一篇文章《大模型驱动的自主代理(LLM Powered Autonomous Agents)》。

Lilian Weng将AI发展路径类比自动驾驶L1-L5,而人类当前所处的位置正好从Copilot向Agent过渡。

这对人类社会而言,意味着一次巨大的变革正在孕育,它将惠及产业和生活的方方面面。而在这个过渡阶段里,如何让更多“高楼大厦”在大模型的地基上拔地而起,正是中国在生成式AI的赛道上,实现反超的最大机会。

与此同时也是百度的巨大机会。文心一言、百度文库、百度新搜索等,AI原生应用释放出的新变现机会,将开启长期增长空间。

中国有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持“人工智能+”行动,每一个人,每一个企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。

免责声明:本文基于已公开的资料信息或受访人提供的信息撰写,但解码Decode及文章作者不保证该等信息资料的完整性、准确性。在任何情况下,本文中的信息或所表述的意见均不构成对任何人的投资建议。

编者按:本文转载自微信公众号:解码Decode(ID:kankeji001),作者:解码工作室 

可行性研究报告
解码Decode

本文作者信息

解码Decode(科技自媒体)

关注(63557)赞(1)

邀请演讲

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐