大模型竞速迎来“iPhone时刻” :高昂算力成本怎么破?寻找优质“算料”或成博弈焦点

◎阿里巴巴集团董事局主席、首席执行官张勇表示,阿里云要全面走向“模型即服务”。一方面,阿里云希望大模型技术的应用打开更大的使用入口;另一方面,阿里云在4月底率先宣布公有云大降价后,引发了公有云市场多家云服务厂商的价格调整。

◎技术迭代、价格下降,能否释放新的增量空间、形成正向循环,有待新一季财报验证。而对诸多云计算厂商而言,大模型应用带来了云计算市场的“iPhone时刻”,新格局正在开启。

每经记者 叶晓丹    每经编辑 董兴生    

6月1日,阿里云对外披露了通义大模型进展,推出聚焦音视频的AI产品“通义听悟”,该产品成为国内首个开放公测的大模型应用产品。

阿里云方面透露,通义听悟接入了通义千问大模型的理解与摘要能力,能实现随时随地高效完成对音视频内容的转写、检索、摘要和整理,可成为用户工作学习中的得力AI助手。

此前的5月6日,科大讯飞正式对外发布“讯飞星火认知大模型”。据悉,6月9日,科大讯飞还将发布这一大模型的新进展,包括开放式问答取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升等。

阿里云智能CTO周靖人在接受包括《每日经济新闻》记者在内的媒体采访时透露,通义听悟结合了之前阿里云研发的语音能力,下一阶段会陆续推出增强版并进行商业化安排。

阿里云智能CTO周靖人(左) 图片来源:每经记者 叶晓丹 摄

今年4月26日,阿里云提出要走向“产品被集成”,形成“1+3+1”的产品被集成结构:顶层为MaaS模型即服务,阿里云向生态开放大模型能力和训练底座。值得注意的是,阿里云此次发布的通义千悟既可以作为SaaS应用层,又可以被集成为MaaS层。

可以说,阿里云将大模型提到了一个新的高度。阿里巴巴集团董事局主席、首席执行官张勇表示,阿里云要全面走向“模型即服务”。一方面,阿里云希望大模型技术的应用打开更大的使用入口;另一方面,阿里云在4月底率先宣布公有云大降价后,引发了公有云市场多家云服务厂商的价格调整。

技术迭代、价格下降,能否释放新的增量空间、形成正向循环,有待新一季财报验证。而对诸多云计算厂商而言,大模型应用带来了云计算市场的“iPhone时刻”,新格局正在开启。

公有云“价格战”连锁反应

继4月26日阿里云宣布公有云价格大幅下调以来,腾讯云、移动云、京东云等头部云厂商也先后降价。

5月16日,腾讯云宣布对多款核心云产品实施降价,部分产品线最高降幅达40%;5月23日,京东云称,全系核心产品的官网列表价均低于特定云厂商官网对标的产品列表价格,实际成交单价将在特定云厂商实际成交最低单价的基础上再打九折,“买贵就赔”。

值得注意的是,公有云价格战对私有云市场也有所搅动。5月初,一家IT服务商上市公司就告诉记者,公有云市场的价格战,也会进一步引起私有云市场的价格向下。

图片来源:每经记者 叶晓丹 摄

近日,一家头部云服务厂商的第三方服务商在和《每日经济新闻》记者交流时亦透露,公有云价格下降,必然给私有云带来一定的波动性。“但这和公司规模、行业有关,像大型央企国企、金融行业更看重安全保密性,选择私有化比较多,而普通公司则会根据价格和需求来选择。”

数澜科技董事长甘云峰在5月底的“数栖大会”上接受记者专访时表示,公有云市场的大降价对私有云的建设成本有影响,不过,由于私有云价格成本相对固定,所以私有云的价格波动空间不会非常大。

而对于公有云市场价格战,甘云峰表示,这对于下游的数据应用服务商而言,可以有更好的促进作用。“过去客户数字化的服务,在硬件上的投入往往占据大部分经费,而随着公有云市场价格的下降,客户可以将更多的费用投入到业务策略、应用层面,也更有助于行业的发展,尤其有助于数据应用领域的发展,可以让终端客户将更多的资金投入到业务场景,在产业数据上挖掘更多的价值。”

作为数据应用基础设施供应商,数澜科技搭建了一站式数据中台基础设施“数栖平台”,提供数据中台解决方案、数据可视化服务、数据智能解决方案等产品矩阵。不过,甘云峰也提及,客户对云计算厂商的选择,一般不会根据价格高低进行调整,而是首先基于客户选择匹配的服务器。但基于成本考虑,会推荐更具性价比的服务器,让客户能够有更多资金投入到真正的业务场景中。

而大模型技术为云计算市场带来了新的变化。招商证券研报分析认为,整体而言,大模型的定位从简单的技术赋能转向平台生态入口卡位,同时ChatGPT Plugins的出现将加速“AI+”时代生态的明晰和应用层的繁荣,两者协同将为现代人类的生活带来全维度的颠覆性变化。

周靖人透露,在各种企业与行业之间仍有不少基于大模型的新需求,阿里云还在继续探索,接下来会发布一系列新产品。对提出“模型即应用”的阿里云而言,在公有云价格下降的同时,通过大模型打造新的生态入口,做大规模效应的成效如何,仍有待市场校验。

走向开源是必然?

不过,从目前来看,大模型技术距离走向整个生态的繁荣还有一段路程。

而对以大模型为代表的AGI产业结构,此前的2023阿里云峰会上,招商局创投汪婧在演讲中表示,整体结构共分为四层,分别是计算层、模型层、中间层和应用层。其中,如当前算力以及训练成本会以多快的速度、下降多少,会影响到整个产业链。

招商局创投汪婧 图片来源:每经记者 叶晓丹 摄

AI大模型催生了巨大的算力需求,当前,A100是大模型应用的“主力芯片”。据媒体报道,在眼下的AI时代,“算力即权力”似乎已成为行业主旋律,算力设施需求量仍在持续攀升。OpenAI指出,AI大模型要持续取得突破,所需消耗的计算资源每3~4个月就要翻一倍,资金也需要通过指数级增长获得匹配。

A100的价格大约为1万美元,是目前AI应用的“主力芯片”。另据了解,此前一些零售商对另一款芯片H100的报价大约在3.6万美元,近期价格又有了显著上涨。

英伟达的研究表明,GPT3最大规模的模型需要使用175 Billions的参数量,需要使用512颗V100显卡训练7个月时间,或者使用1024颗A100芯片训练一个月时间。大模型训练每月成本在数百万美元以上量级。

大模型的开发成本高昂,也成为国内外巨头一场昂贵的尝试。

图片来源:视觉中国-VCG41N1462568496

在业内人士看来,公共云是AI新型基础设施的最佳载体。头部云厂商已经搭建好超大规模、高性能、低成本的算力公共设施,不需要“重复造轮子”。

汪婧表示,在重资本和人才投入的基础通用模型层,国内大厂会是通用大模型的重要参与者。与此同时,极少数创业公司以其人才技术积累,以及创新和灵活性,有机会在国内做出好用的通用大模型。

在应用层及中间件领域,汪婧表示,当前许多领域在国内尚未发展,随着后续国内基础模型的能力提升和产业成本下行,预计未来会百花齐放。

每日互动董事长方毅在接受《每日经济新闻》记者专访时透露,大模型算法慢慢会走向开源,估计在未来三年内会迎来“安卓时代”,就是开源的大模型或达到相当水平的时代,会有更好的、更繁茂的生态发展。

周靖人在回应开源问题时表示:“我们其实非常支持开源,通过开源一系列的模型,能够让大家降低学习的成本,去尝试自己的一些突破。每个企业有具体的核心业务环境,就需要更加精细化选择,到底是用什么样的模型。”

5月30日,中国信息通信研究院联合产业各方共同编制“纸鸢”开放人工智能模型许可证,旨在为共同打造具有变革意义的大模型开源项目奠定坚实基础。

中国信通院云大所开源和软件安全部主任郭雪表示,AI大模型的本质决定了开源是其必经之路。编制“纸鸢”开放人工智能模型许可证,正式为了充分发挥大型模型的通用性优势,促进大型模型技术在产业中真正落地。下一步,将发布《纸鸢开放人工智能模型许可证(征求意见稿)》。

寻找优质的“算料”

每日互动(300766.SZ,股价18.63元,市值74.54亿元)董事长方毅认为,大模型计算需要大数据训练,所以优质的数据非常重要。算法、算力很重要,而数据这个“算料”可能会更重要,“算料”将成为非常重要的一个引擎。

数澜科技董事长甘云峰则提出,大模型技术给大数据行业带来了两方面的主要影响。一是基础能力建设,可以通过大模型技术完成,极大地提升效率。另一方面,当前存在数据急剧增长和算力增长之间的矛盾,技术的进步已经跟不上数据的增速,大模型技术的应用对GPU要求非常高。

高昂的算力成本既然无解,当硬件发展跟不上软件发展速度时,能否从数据入手,通过挖掘数据自身的组织能力来弥补算力短板?甘云峰认为,这是很有可能的,AI的土壤是数据。

数澜科技董事长甘云峰 图片来源:受访者供图

在大模型“百花齐放”的背景下,民生证券在研报中指出,“单纯发布一个大模型的门槛没有市场想象中的那么高”,“有大模型不难,难的是有一个能持续迭代,性能不断提升的优质大模型”。也有观点提出,高质量数据才是大模型发展的稀缺要素。

数据要素也成为资本市场备受关注的细分领域。6月6日,数据要素概念股震荡反弹,金桥信息(603918.SH,股价34.08元,市值125.33亿元)、中国科传(601858.SH,股价48.14元,市值380.55亿元)涨停;开普云(688228.SH,股价61.84元,市值41.52亿元)、中远海科(002401.SZ,股价28.11元,市值104.54亿元)、美亚柏科(300188.SZ,股价25.18元,市值216.42亿元)等跟涨。

近期,多家券商的最新研报也对数据要素进行了密集覆盖。

德邦证券介绍,数字经济的上游基础层在于数据价值化,上游包括数据要素、信创、数字基建三个细分,其中数据要素又是整个数字经济产业链循环的基础。

天风证券分析认为,算法、算力、数据是AI核心三要素,当前AI大模型的训练,算法端向神经网络Transformer模型收敛,算力端依赖具备大规模并行计算能力的AI服务器集群,数据端则需要巨大数据量的大规模数据集投喂。AI三要素中数据是直接影响AI大模型在垂直行业落地效果的关键,而垂类数据通常由政府和行业机构掌握,相比于模型和算力,数据稀缺性明显。

目前,通用大模型的训练数据集多来自互联网文本数据,例如ChatGPT训练数据集来自维基百科、互联网新闻、社交媒体、电子书等。彭博社发布了针对金融领域的大型语言模型BloombergGPT,训练采用51.27%金融信息数据和48.73%的公共数据,在500亿参数规模下,BloombergGPT对金融任务效果好于通用大模型。

那么,未来针对“算料”的博弈是否会更加白热化?

方毅认为,数据要素市场最终会形成某种程度上的开放合作。第一级的核心数据开发商可能以央企、国企为主,第二级开发商可能会有更多民营企业和市场化力量参与进来

责编 董兴生

原标题: 大模型落地的iPhone时刻:一场昂贵尝试、走向开源和寻找优质“算料”

Copyright© 2014 成都每日经济新闻社有限公司版权所有,未经许可不得转载使用,违者必究

互联网新闻信息服务许可证:51120190017  

网站备案号:蜀ICP备19004508号-2  

川公网安备 51019002002025号