买币
行情
现货
合约
理财
活动
更多
reward-center新手专区
资讯首页快讯详情
花旗:AI推理需求仍紧,瓶颈正从芯片扩散至电力和数据中心
  • GPU0%

BlockBeats 消息,6 月 16 日,花旗称,人工智能推理需求的强度仍在延续,算力稀缺正从最新一代芯片外溢至上一代 GPU,并推动模型厂商通过价格、限额和路由机制加速变现。

Heath Terry 等花旗分析师在 6 月 14 日发布的报告中写道,A100 GPU 租赁价格过去一周上涨 0.6%,六周累计上涨 11%,显示 AI 算力需求并未只集中在最先进硬件上。与此同时,部分前沿模型在智能得分提升后显著提价,花旗称「稀缺性被货币化的速度快于被解决的速度」。

报告指出,当前没有任何模型供应商能同时占据 智能、速度和价格 三个优势。最新前沿模型智能分数提高约 4 点,但综合价格接近翻倍;而中端模型在速度上取得进展,Top 20 模型的中位输出速度六周内从 64 tokens/s 升至 105 tokens/s。

花旗还称,闭源模型与开源模型之间的能力差距正在扩大,专有模型相对开源模型的智能领先幅度从约 6 点扩大至约 10 点。这意味着头部模型厂商仍倾向于用更强能力守住高端市场,而不是直接与开源模型展开价格竞争。

算力之外,电力和数据中心选址正成为 AI 扩张的新约束。报告提到,一家私有 neocloud 已签约 4.9GW 需求,但规划管线超过 40GW,凸显需求爆发与供给落地之间的差距。花旗称,数据中心倾向布局在电价约 9-12 美分/kWh 的地区,同时可再生能源占比和长期购电协议也在影响选址。

报告认为,未来 AI 基建成本将继续上升。随着组件价格、电力接入和前期基础设施投入增加,按 H100 等效算力计算的资本开支正在走高,电力成本也正从运营阶段前移为建设前的资本投入。

花旗表示,下一阶段的价值可能流向「推理路由层」,即能够判断不同任务该使用哪种模型、量化方式和硬件的平台。该层既能降低推理成本,也能提高输出效率,但企业数据、知识产权和隐私保护将是落地难点。

从产业链看,报告指向的不只是 GPU,还包括数据中心、电力、光通信、云基础设施和模型应用。花旗在附录中列出 Ciena、Lumentum 和 MiniMax 等相关覆盖标的,显示 AI 推理周期正在从芯片扩散到更广泛的基础设施和应用层。

来源:BlockBeats

免责声明:当前内容均来自第三方观点或由AI直接翻译第三方观点,CoinEx不保证内容的真实性、准确性和原创性,不构成CoinEx相关的任何投资建议。数字资产价格波动剧烈,请注意潜在风险。

热搜榜
  • 币种
    价格
    24H涨跌