当前位置: 厦门雄霸 > 新闻中心 > 国内AI大模型投资新方向:既要做淘金者,也要卖铲子
国内AI大模型投资新方向:既要做淘金者,也要卖铲子
时间:2023-05-12 10:24:48 点击次数:

国内科技大厂,在大模型竞争上再一次取得共识:既要做淘金者,也要卖铲子。

进入4月份,阿里云一边发布通用大模型“通义千问”,一边致力于帮助其他企业打造专属大模型。一位接近阿里云的人士表示,阿里云“甚至可以只卖铲子”。

尚未公开内测自有大模型产品的腾讯和字节跳动,也抢先盯上了卖铲子的生意。

腾讯云发布了面向大模型训练的新一代HCC(High-Performance Computing Cluster)高性能计算集群,通过搭载英伟达最新H800 GPU,将整体性能提升了3倍。

字节更是明确表态,火山引擎不做大模型,而是要为大模型客户提供算力平台,帮助其做好大模型开发。

在阿里、腾讯、字节相继决定卖铲子之前,百度其实是这一策略的更早提出者。但百度不同的是,前述大厂们都是在卖算力,百度更多是聚焦在服务。

国内AI大模型投资新方向:既要做淘金者,也要卖铲子

头部厂商聚焦AI软件开发

在卖铲子上达成新共识后,头部云厂商之间的大模型之战,开始深入AIGC+Application的软件应用开发。

这也是时下投资机构最为青睐的方向之一。线性资本创始合伙人兼CEO王淮就表示,这是自己特别看重并且愿意花力气去挖掘的领域。今年上半年,线性资本至少看了两三百个基于大模型开发的各类应用。

已经走向全面开放或内测阶段的大模型产品提供商,由此掀起新一轮的应用生态建设竞赛。

OpenAI发布了ChatGPT Plugins插件功能,开始将大模型能力直连第三方应用;微软推出了AI版Office“全家桶”——Microsoft 365 Copilot,并将其测试企业数量从最初的20家,在近期扩展到600多家。

截至5月上旬,百度文心一言的内测企业数量超过300家,并在400多个企业内部场景取得了测试成效。

然而,目前企业应用大模型仍面临诸多难点,如模型体积大,训练难度高;算力规模大,性能要求高;数据规模大,数据质量参差不齐。

随着越来越多应用与大模型相结合,其也将倒逼云厂商对自己的大模型服务体系进行升维,走向一条追求更好效果、更低成本的道路。

通过全栈自研体系的端到端整体优势,百度智能云在实现大模型训练成本降低的同时,做到大模型产品服务体验的不掉队,破除外界评判大模型优劣时唯算力论的极端观点。

百度集团副总裁侯震宇告诉字母榜,在接下来几个月,百度大模型服务通过迭代优化,还将实现大规模的成本下降,不仅算力不会成为阻碍,“价格应该也不会成为大家所使用或者是拥抱大模型的瓶颈。”

大模型重塑行业格局

大模型给传统应用带来的大幅体验升级,让越来越多人开始认同一种观点,即所有应用都值得用大模型重做一遍。

如同Windows带动了PC普及,Android催生了移动互联网的生态,AIGC时代“将诞生比移动互联网大十倍的平台机会,将把既有的软件、使用界面和应用重写一次。”李开复预测道。

眼下,百度等国产大模型厂商,正处于一场争夺AIGC时代“Android”的激烈竞争中。谁能抢先拿下更多的企业客户,谁就有望凭借“滚雪球效应”脱颖而出。

这是一场面向AIGC时代应用生态开发标准的抢位战,比的是谁能跑得更快,谁能拿到更多的反馈数据,谁能建立更多的应用落地优势。

尽管各家大模型产品在技术上大同小异,但大语言模型也是有“方言”的,相关产业专家表示,不同的大语言模型因为训练的数据分布不同,构造高质量数据不同,决定着用户提问的方式、调教和使用的方式也不尽相同。

就像开发者在不同手机操作系统上开发一款游戏,尽管最终游戏效果、赛制差不多,但分属不同操作系统的游戏好友,是没办法进行排位等操作的。一旦企业用了某个大语言模型,再切换到别的大模型,迁移成本会很高。

“这也造成了谁能够跑得更快一些,获取更多的应用,拿到更多的反馈,谁就能持续地保持一定程度的领先。”上述专家表示。

国内AI大模型投资新方向:既要做淘金者,也要卖铲子

大模型不仅将成为新的应用生态的Game Changer,当越来越多客户基于大模型重塑业务后,大模型还有望成为云服务行业的Game Changer,彻底改变云计算的游戏规则。

在李彦宏看来,过去,云计算主要卖算力,看速度、看存储。今天,客户购买云服务,则要看框架好不好、模型好不好。MaaS(模型即服务),将成为评判云服务的行业新标准。

更重要的是,在移动互联网时代已经划分好市场地位的云厂商,面对AIGC时代的新机遇,有望重塑行业格局。

美国第四大云计算厂商甲骨文,在过去一个月内,因为头部云厂商算力紧缺,甲骨文模型服务更便宜,已经吸引不少人工智能初创企业转而成为甲骨文的新客户。

随着越来越多企业将更多业务融入大模型,当AI能力逐步放大变成企业上云的主要需求后,如百度这类押注AI的云厂商,无疑将走上一条快速道。

大模型落地,企业怎么选?六大关键参考维度

大模型服务好不好,可以看一些硬指标。

一是高效性。影响大模型训练和推理效率的主要因素涉及整个IT技术栈,需要由算力、框架、模型(包括丰富的大模型体系)、应用构筑的四层架构相互配合提供支撑,形成很强的协同作用和高效的反馈闭环,帮助大模型调优迭代、降本增效。反映到实际数据上,可以重点关注千卡加速比、异构资源利率、模型开发迭代效率等参数。

以在这四层IT架构的每一层都做了重资产投入的百度为例,据百度集团副总裁侯震宇昨日在文心大模型技术交流会上分享,百度是全球唯一在这四层架构的各个层面都拥有领先自研产品的公司。百度AI大底座的千卡并行线性加速比达到90%以上,训练资源利用率超过70%,模型开发迭代效率提升100%。

二是易用性。即上手门槛有多高,这是影响客户体验的核心因素,包括有没有与实际业务需求匹配的服务模式、能否提供从开箱即用到深度定制的服务和工具,交付和部署方式是否灵活等。

三是全面性,包括是否覆盖大模型全生命周期(从训练大模型到用好大模型)的开发、管理、应用集成服务。

四是安全性。这也是越来越多企业关心的问题,最近三星为了防止企业机密泄露还下达了“AI聊天机器人封杀令”。因此大模型服务必须有完备的安全机制,来确保模型输入输出稳定,保障数据安全。此外是否完全自主可控也影响安全性。

五是开放性。有的大模型服务支持的大模型类型有限,有的则不仅支持自研大模型,还支持多种开源大模型及其他第三方大模型。

六是扩展性。如果大模型服务支持集成更多插件,并能够对插件做更多编排,则能通过外挂应用的方式,更好地拓展大模型能力边界。

Copyright © 2022-2023 贵州源妙自动化设备有限公司 版权所有     黔ICP备2022007086号-9