国产大模型已有超越ChatGPT之势，AI军备赛中国有望后发先至

当前位置：厦门雄霸 > 新闻中心 > 国产大模型已有超越ChatGPT之势，AI军备赛中国有望后发先至

时间：2023-10-24 15:07:26 点击次数：

2023科大讯飞全球1024开发者节24日至29日在安徽合肥召开。

今天的开幕式主论坛上，讯飞星火认知大模型V3.0正式发布，七大能力均持续提升，对标ChatGPT，号称中文超越，英文相当。具体来说，七大能力上，文本生成提升7%，语言理解提升6%，知识问答提升7%，逻辑推理提升8%，数学能力提升3%，代码能力提升9%，多模态能力提升7%。

刘庆峰透露，在数学能力上，讯飞星火3.0已遥遥领先于ChatGPT。在设计方案生成、代码补全、测试检错等领域，星火3.0的能力已经超越 ChatGPT。现场PPT展示了国务院发展研究中心国研经济研究院的横评报告：目前星火大模型综合能力已超越ChatGPT，国内领先，在教育、医疗、法律行业表现格外突出。

根据OpenAI在官网发布的英文任务测试集，在10月16日至20日的测试中，星火V3.0的英文能力对标ChatGPT48项任务结果相当，二者得分分别为85.1%（星火V3.0）和84.3%。

国产大模型已有超越ChatGPT之势，AI军备赛中国有望后发先至

不过，刘庆峰也表示，和GPT4相比，科大讯飞“还有一个学习的过程”。

刘庆峰指出，认知大模型正在开启一个增长新时代，大模型正日益与每个人息息相关。自9月5号讯飞星火正式对全民开放以来，现在星火的各类应用用户已经超过了1200万人。AI开发工具iFlyCode也迭代到2.0版本，可实现设计阶段、编码阶段、测试阶段分别可提效50%、37%、44%。

据刘庆峰表示，借助讯飞iFlyCode工具，程序员原本进行平台迁移需要3个月完成的开发工作，现在只需一个月就完成了。

人工智能加速落地，盈利模型成最后关卡

不同于传统科技的工业限制，依托于互联网和云技术的人工智能相关产业，很难准确描述其行业上限所在。

根据技术成熟度，以及商业化落地规模来考量，现阶段最受瞩目的人工智能项目，主要以AI大模型和智能驾驶为主。

AI大模型的热度不言而喻，自ChatGPT让所有人看到AI技术已经基本满足落地需求后，国产AI大模型产品项目就如雨后春笋般，被各大科技企业和机构推出。

仅是2023年上半年，就有复旦大学的“MOSS”、澜舟科技的“孟子”、百度的“文心一言”、清华大学的“ChatGLM-6B”、360的“360智脑”、商汤科技的“日日新”、阿里巴巴的“通义千问”等大模型项目公布。

等到上半年追赶热度的喧嚣散去，下半年的AI大模型赛道虽然略显沉寂，但也展露出头部企业用实际产品“亮肌肉”的势头。

例如科大讯飞在8月中旬发布了讯飞星火V2.0，9月下旬又和华为联手开启了“双子星”计划；百度则是在9月初公布文心一言大模型开源后，10月17日的2023百度世界大会上，又发布了文心大模型的4.0版本。

头部企业“你追我赶”的良性发展循环，加速了AI技术的研发和应用速度。照此下去，或许唯一能够限制行业上限的，就只剩下性能、算力等硬件基础。

国产大模型已有超越ChatGPT之势，AI军备赛中国有望后发先至

随着芯片短板的填补，这一限制也会慢慢消除，如果证监会新政策释放了更多融资渠道，不必担忧资金压力的研发环境下，等到AI大模型产品对行业结构的冲击平缓度过，商业落地高速发展窗口指日可待。

同样是人工智能的商用场景落地，智能驾驶的商业化落地显然要更进一步。

就像百度的萝卜快跑，已经实现了全无人自动驾驶出租车落地测试，目前已经覆盖国内三大一线城市部分区域，2023年更是Apollo量产落地大年；滴滴基于自动驾驶技术搭建的KargoBot，也逐步落地自动驾驶卡车在大宗运输领域的规划。

随着新能源汽车的销量达到增长瓶颈，智能汽车的行业大趋势已经形成。自动驾驶、智能座舱对技术力的追逐，也在快速增长中，释放更多市场增量空间。

尽管两大细分领域的发展各具特色，但摩根商研所认为，相对统一的是，二者距离大规模商业落地，目前都欠缺着稳定的盈利模型。

人工智能如何变现，早已是整个行业的困扰。面对动辄数亿、数十亿的研发投入，大部分企业都缺乏商业回报支持，以及短期内自我造血的能力，甚至大部分企业都倒在了盈利前的“黎明”。

这一点在智能驾驶领域显现的淋漓尽致，进入2023年以来，Argo AI、Embark等大型自动驾驶企业相继宣告破产。国内方面，今年5月份更是有消息传出，阿里达摩院已经解散自动驾驶团队，并放弃自动驾驶研发。

AI大模型企业的处境虽然更为宽容，但因为目前产品和服务定价较高，2C消费迟迟没能找到收费切入口。2B业务反馈中，许多对人工智能有需求的制造业，也因为成本费用支出过高的原因，采购意愿并不强烈。

国产大模型的战略价值

我把接入chatGPT站点各种连接称之为散兵游勇，而国产大模型则称之为“正规军”。

“散兵游勇”借助chatGPT链接打野战，做中间商赚差价，但账户没有沉淀，无法形成聚集用户规模，对于国内形成独立自主可控的大模型产业并没有助推能力。

互联网大厂的大模型实际上砸钱在做，现在也只有这些互联网大厂有动力、有资金去做，其他的小厂会做技术外包服务商，或者找个机会卖给大厂套现。

国产大模型已有超越ChatGPT之势，AI军备赛中国有望后发先至

虽然国产大模型是一个通用型产品，但是限于之前的内容生态以及各家本身也需要大模型符合各自公司战略，各家大厂还是会做差异化，不会真的成为chatGPT的国产版。

百度的文心一言、讯飞星火用的比较多，属于chatGPT的平替产品，这两家把智能语音优势发挥比较好；抖音出的“豆包”小助手产品设计简洁，输出专业内容也比较好用；阿里的通用千问上线用的不多，可能是与阿里本身的内容基因不强原因有关，腾讯混元处于内测阶段，360智脑没拿到邀请码。

这些国内大厂的大模型产品的战略价值主要体现在：

作为新的入口，内置在自己生态内全家桶产品之中，未来通过聊天形式唤醒可以打开。

基于各自的云服务比如百度智能云、腾讯云、阿里云、火山引擎等，对平台公开的数据进行深度学习，发掘资深平台大数据的复用价值。

增强自家主营业务的技术实力和服务实力，比如通用千问作为服务中小企业的BI；360智脑服务于政务安全市场大数据使用等等。

因此，国产GPT虽然不会改变互联网行业格局，但是对于整个中文互联网追赶国外人工智能产业带来了希望，他们共同作为基础设施，能够提供给用户更稳定、更普惠的AIGC服务，更多用户接触AI内容，掌握使用AI使用技能，则在中美AI的军备竞赛之中又多了一份胜算。

上一篇: 小镇惊现巨大页岩气储量震撼全球，中国涪陵能否成为“东方沙特”？