商汤科技AGI这些年:上半场「基建」,下半场「变现」
作者|潮汐商业评论 来源|潮汐商业评论(ID:daily-case)
纵观一次次科技革命引领的生产力变革,都绝非一蹴而就,而是在不断的技术突破中,找到产业的落脚点,再回归到社会应用中去。
当下的人工智能也是如此。今年以来,大模型和生成式AI作为重要的科技突破,刷新了大众对人工智能的认知,也为AI的商业化落地打开了广阔空间。
其中,以商汤科技为代表的龙头企业凭借着布局深耕多年构筑的竞争壁垒,在令人眼花缭乱的新技术、新产品比拼中脱颖而出。
前路漫漫亦灿灿,上下求索终有得。近日,商汤公布了2023年中期业绩,大模型驱动全线业务升级,生成式AI相关收入多倍增长。
潮汐商业评论也从商汤集团这些年的发展历程中,探寻到这个全球领先的人工智能软件公司通向AGI的扎实路径,商汤AGI从「基建」走向「落地」的过程中,在「变现」上迈进一大步。
1
基建先行,当看【执牛耳者】
任何一个龙头企业,都是在行业浪潮汹涌中沉浮而起的。
2010年前后,大数据、云计算、互联网、物联网等信息技术的迅猛发展,推动人工智能大幅跨越科学与应用之间的技术鸿沟,图像分类、语音识别、知识问答等一系列智能技术实现重大突破,AI进入全面影响人类生活的阶段。
直到2022年底,聊天机器人ChatGPT正式发布,再次刷新人工智能技术应用的新高度,作为其背后重要技术支撑的大模型,在全球掀起了关注热潮。
为什么大模型如此重要?简单点说,一个模型通常由输入、算法(计算)、输出组成,大模型的优势在于参数量足够大,能够包含各种各样的变量,假若把大模型视为一位“智者”,它的见识越多,即数据维度多,泛化能力就越好,解决问题的效果也越好;与此相应,大模型通用能力就越强,处理各种类型的单个问题成功率也就越高。
这正是当前AI领域所急需的重要能力。目前,各行各业对AI场景提出大量需求,尤其是出现的很多长尾问题,表现为差异化、碎片化和细节化需求。
但这些与真实世界拟合度极高的需求,对AI基础设施提出了一般厂商难以满足的要求,如指数级增长的算力工程能力、高复杂度的识别算法模型,以及强大的深度学习通用模型。
而这类新兴产业的基础设施建设,需要源源不断的资金、人力和技术投入,当大模型浪潮来临之际,乘势而上、一展所长的往往都是龙头企业。
以头部AI企业商汤为例,今年4月,商汤发布了“日日新”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
这背后,商汤已经在AI新基建的路上走了多年。2019年,商汤率先建设了SenseCore商汤AI大装置,建立了一套工程化体系来支撑大模型敏捷、低成本及大批次地迭代。
首先是先进的算力基础设施,在商汤的持续升级下,目前,SenseCore上线GPU数量从2万7千块提升至3万块,算力规模提升20%达到6 ExaFLOPS,为日益增长的大模型训练提供可靠、先进的算力供应,今年以来,1000多个参数量数十亿至上千亿的大模型在此之上完成训练。
其次是海量的有效数据集,多年的模型开源和商业化实践为商汤积累了大量原始语料数据,沉淀了很多宝贵know-how(如专业知识),每月可产出2万亿token(数据处理量),高质量训练数据将应用到大模型上,复现相应改进效果。
此外是稳定的大规模集训,在大装置的支持下,商汤很早就具备千卡并行的系统能力,即使用上千张GPU卡进行单任务训练,以实现千亿参数量超大规模的训练,每个季度甚至能迭代1到2个版本的基模型,保持长期领先。
在如此强大的AI大装置支撑下,今年以来,商汤大模型成果叠出。4月商量SenseChat1.0发布,是国内最早推出的基于千亿参数大语言模型的聊天机器人产品之一;6月,商汤联合上海人工智能实验室等多家国内顶尖科研机构发布了首个综合能力超越GPT-3.5-turbo的大语言模型书生·浦语(InternLM)。
8月,新模型InternLM-123B完成训练,语言、知识、理解、推理和学科五大能力显著提高,在全球51个知名评测集的30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo、LLaMA2-70B等模型。
InternLM-123B还重点升级了代码解释器及插件调用能力,可使用python解释器、API调用和搜索等工具来解决复杂任务,灵活搭建智能应用。
商汤是国内最早引入“工具调用”的AI企业之一。工具的规模集成能提高大模型的适用性和解决问题的能力,能够准确使用工具的大模型也是解放行业生产力的关键。
值得一提的是,商汤大模型在开源上也走在了前列,系统开源能让更多的人接触并应用大模型,促进技术的共享和交流,推动大模型生态的建设,并加速AI的发展。
商汤已与多家科研机构合作推进AI开源平台建设。2018年至今,商汤开源的AI大工具涉及决策智能、大语言模型、数据平台、高性能训练、推理框架和AI智能体框架等。
其中,InternLM-7B(70亿参数)模型的部分训练数据、训练代码及基模型权重已向学术界和工业界开放、支持商用,并登顶多个模型测试榜单成为性能最好的轻量级基模型。能力更强的InternLM-20B模型(200亿参数)也将于近期开源。
商汤文生图模型的迭代也相当迅速。7月,商汤文生图大模型产品秒画升级3.0,与年初发布的秒画1.0相比,应用搭载的自研基模型参数量从8亿提升至70亿,其核心算法在COCO benchmark上超过了谷歌的Imagen与OpenAI的DALL·E 2,能够更智慧地理解用户需求,出图效果跻身全球前列,国内领先。
2
商业落地,重在【全面赋能】
从科学研究、科研成果到科技产品、商业应用,是每个新技术都要走的路,要保持AI的长期可持续发展,商业落地是重中之重。
现实因素来看,AI的商业化需要落地到具体的应用场景,赋能下游企业,实现降本增效,才会有人愿意“买单”,AI企业也才能获得相应的经济效益。
长远因素来看,长期的商业化探索能助推大模型技术迭代,反哺AI应用的落地和优化,持续提升AI的市场渗透率,形成行业发展的良性循环。
而2021年底登陆港交所之时,商汤的AI商业化模式已经“五脏俱全”,在当时的招股说明书中,将要打造的业务结构总结为“一个平台、四个支柱”。
其中,“一个平台”指商汤的AI大装置SenseCore,“四大支柱”分为智慧商业、智慧城市、智慧生活、智能汽车等板块,囊括了所有的落地场景。
今年上半年,基于AI大装置SenseCore和“日日新”大模型系列,商汤发布了一系列生成式AI产品,如,自然语言交互的“商量”、AI文生图的“秒画”、数字人视频生成的“如影”、3D大场景重建的“琼宇”、3D小物体生成的“格物”,并将之应用于各个业务板块,赋能行业创新。
商汤的“大模型力量”正驱动着集团全线业务升级。半年报显示,今年上半年,商汤集团的生成式AI相关收入同比增长670.4%,对集团业务的贡献迅速提升至20.3%。
例如智慧商业板块,大模型技术下诞生的企业级AI应用打开极为广阔的商业应用场景,成长为商汤第一大收入来源。商汤深入能源、金融、地产等十个行业的数百家客户深度定制行业大模型,如针对头部金融机构,以商量赋能关键业务,包括智能客服、营销培训等,并开展金融大模型合作研发;针对头部保险机构,提供基于AI遥感大模型的农作物承保数据交叉验证,效率提高60倍。上半年,智慧商业营收8.54亿元,同比增长50.2%。
在智慧生活板块,大模型产品提前抢占tob市场空间,“商量”和“秒画”深受移动互联网行业用户青睐,如影落地电商、直播、银行客服场景,格物与香港最大的珠宝集团之一实现商品3D数字化合作等。上半年,智慧生活营收3.12亿元;客户数达270个,同比增长47.5%。
趁着AI东风,智能汽车板块也成为商汤的重要发展引擎,并由研发转化为规模量产。上半年,绝影量产业务同比增长573%,量产交付数量39万台,规模量产带动单车毛利提高29%。基于大语言模型“商量”打造的车舱内智能助理备受关注,智能座舱前装产量同比增长3倍。
智慧城市板块,则是持续推进业务转型,聚焦头部城市,优化收入结构、改善现金流。上半年商汤在一二线城市的智慧城市收入占比由去年同期的34%上升至64%。
商汤的AI商业落地,也与整个行业的大规模产业化路径不谋而合,在经历长期的投入后,跨越工业红线,终于量变引发质变,大模型和生成式AI产品对各行各业的强大赋能,打开广阔的商业应用场景,助推企业在变现路上迈进一大步,有望进入高获利区间。
3
优胜劣汰,始终【向前迭代】
目前来看,商汤在AI新基建领域的提前布局和前瞻地位,让其在此次大模型的浪潮中构筑了强大的技术竞争壁垒,并加速商业化落地进程,但大模型的意义远不止于此。
与当年移动互联网之争一般无二,AI之争最终也会从单个应用的流量争夺走向整个生态系统的比拼。
而在AI生态中基础软硬件、基础模型和创新应用这三大层次中,基础模型可谓是AI生态的“支点”,大模型向下能带动AI基础软硬件发展,向上能支撑AI智能应用赋能社会各行各业。
业内普遍认为,大模型用一套算法、一套模型结构、一套训练思路,就能解决AI中的很多碎片化问题,标志着通用人工智能时代的到来。
“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。商汤科技联合创始人、首席科学家王晓刚指出,“AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”
这种技术层面上的演进也将延伸至应用层面。与此前“空中楼阁”般的AI,存在研发成本高、规模生产难、落地场景模糊大等问题相比,大模型时期的AI重视泛化能力、产业结合和安全保障,有望成为拉动全球经济增长的新引擎。
据IDC预测,2026年中国AI大模型市场规模将达到211亿美元。而生成式AI更有可能是个万亿市场,麦肯锡的报告指出,在其研究的63种应用中使用生成式AI,将为全球经济带来每年2.6万亿-4.4万亿美元的增长。
嗅到机遇的不止有商汤,当年日新月异的互联网行业里,“一步慢步步慢”的竞争态势,被普遍认为在AI领域只会愈演愈烈,引得一众厂商纷纷下场。
赛迪数据显示,今年1-7月国内共发布了64个大模型。截至2023年7月,中国累计已经有130个大模型问世。
目前,热度较高的大模型中,除了像商汤这样的AI新贵所出之外,还有互联网大厂和学院派的力作。如阿里的通义大模型家族、腾讯的行业大模型解决方案、华为的盘古大模型系列,以及复旦的MOSS大模型、清华的ChatGLM、中科院自动化所的紫东·太初等。
正如手机系统一样,过多的大模型并不利于AI的标准化、统一化发展,持续的巨额投入也意味着这是个少数人的游戏,大模型,尤其是通用大模型的数量终将从上升转向下探。
生成式AI更是打响争夺用户“第一枪”。8月31日,首批国产AI大模型获批面向公众开放,包括百度“文心一言”、商汤“日日新大模型”、抖音“云雀大模型”、中科院“紫东太初大模型”、智谱AI“智谱清言”等。商汤“商量SenseChat”也在31日当天全面向用户开放服务。
AI企业该如何迎战?答案是始终向前迭代,以持续领先的技术优势,建立独特的市场定位,快速抢占市场份额,而商汤早已做好准备。
今年上半年,在“基建”成果的大力支持下,商汤全力投入在基模型研发,与顶尖科研机构联合发布的InternLM成为了中国首个全面超越GPT-3.5-turbo性能的大模型。下半年,商汤将借助丰厚的数据和算力资源,制作更强的基模型。2024年,通过开源和商业化的双重推动,商汤想要打造领先的生成式AI应用生态平台,类似当年的AI助手、操作系统等互联网应用生态平台,成为新的流量入口。
对于商汤来说,大模型的技术优势和平台的赋能服务,能够牢牢把握住生成式AI市场的刚性需求。对于其他企业来说,它们可以更快更好地利用AI解决生产经营痛点,或是构建AI商业生态,这也是商汤的初心与愿景。“商汤的长远目标仍然是向AGI持续迭代,用我们的创新力为AGI时代更快到来做出努力。”
近年来,AI在技术突破和应用方面,都取得了突破性的飞跃进展。但正如爱因斯坦所说,科学绝不是也永远不会是一本写完了的书,每一项重大成就都会带来新的问题,任何一个发展,随着时间的推移,都会出现新的严重的困难。
AI未来已来,却仍需要如商汤这类头部从业者,持续向新技术与新产品迭代,用自身的创新力为更多的行业与企业全面赋能,加速推动AGI时代到来,让AI真正成为解放人类双手、补足人类大脑的最强力量。
编者按:本文转载自微信公众号:潮汐商业评论(ID:daily-case),作者:潮汐商业评论
广告、内容合作请点这里:寻求合作
咨询·服务