你的位置:米乐体育app官方网站 > 米乐滚球 > 米乐app AI推理成为下一代芯片竞争新战场
米乐app AI推理成为下一代芯片竞争新战场
发布日期:2026-02-26 10:50    点击次数:187

米乐app AI推理成为下一代芯片竞争新战场

AI推理——运行教悔好的模子来提供输出——已成为该行业的新盈利中心。主要芯片制造商正在争相优化蔓延、功耗和老本,股东向通用GPU与专用硅芯片配对的诊治,并收购构建这些本领所需的工程东说念主才。

英伟达与Groq价值200亿好意思元的许可左券凸显了这一行向。AMD已收购了Untether AI的工程团队,英特尔正在寻求收购SambaNova,据报说念其估值约为16亿好意思元。分析师暗意,行业整合不会关闭阛阓;需求扩大的进度足以让现存企业和初创公司在数据中心和边际部署中竞争。

Moor Insights & Strategy数据中心副总裁兼首席分析师Matt Kimball暗意:"大公司正在投资加强其推理产物组合,既通过产物也通过收购工程东说念主才。但会有好多芯片初创公司出现,它们将阐扬要紧作用。"

为什么推理是盈利中心

Cambrian AI Research创举东说念主兼首席分析师Karl Freund暗意,推理与教悔在经济性和性能条目方面压根不同。教悔AI模子是老本中心,而推理是平直产生收入的"盈利中心"。

Freund和Kimball指出,天然GPU提供出色的性能,但它们时常具有为教悔优化的架构特质,这些特质在纯推理用例中并不老是能振荡为更低的蔓延或更高的效果。专用推理芯片——ASIC和其他加快器——不错提供更快的反应、改革的能效和更低的总领有老本。

"当作盈利中心,若是你有精采的蔓延,你将获取更多收入,因为东说念主们但愿尽可能快速的反应,而况你但愿老本尽可能低,"Freund说。

2026年:从试点到企业出产

{jz:field.toptypename/}

分析师暗意,以英伟达为主导、AMD渐渐增强实力的GPU在大范畴教悔和推理中占主导地位,并将不绝在最大职责负载中当先。相关词,推理需求激增正在创造GPU除外的契机,特殊是主流企业本年从试点膨胀到出产时。

"你将运转看到范畴不是100,000名职工,而是10,000名职工的小公司,运转在制造、后台、前台和边际激活AI,"Kimball说。这些组织濒临功耗规定、冷却敛迹和抓续的GPU供应挑战,使得GPU密集型集群在许多环境中虚假用。

"当你部署GB200或H100时,你部署的是千瓦级的设备,"Kimball指出。"零卖环境功耗预算有限,莫得精采的冷却系统,是以你无法运行GPU机架。你需要寻找其他部署有筹画。"

关于较小的公司,如领有100家分支机构的银行,总领有老本和功耗预算是优先接头要素,为专注于推理的初创公司创造了骄矜其需求的契机。"这是芯片初创公司的紧要契机,"Kimball说。"它骄矜了现时厂商无法骄矜的客户需求,要么是因为可用性问题,要么是因为特定的性能功耗条目。"

跟着推理增长,阛阓呈现千般化

Freund暗意,天然GPU已经当今推理的最好通用搞定有筹画,但阛阓正在向AWS、Google和初创公司的ASIC和替代架构转换。

凭据Futurum Group 2025年11月的访问,2025年GPU占数据中心理较支拨的58%;2026年,XPU——既不是GPU也不是CPU的处理器,如ASIC和定制加快器——掂量将以22%的增长率当先,特别GPU(19%)和CPU(14%)。

Futurum Group半导体、供应链和新兴本领商议总监Brendan Burke暗意:"跟着推理职责负载在Token输出方面特别教悔职责负载的总量,将更需要千般性,因为替代XPU架构不错在某些特定推理任务上已毕更好的效果。"

超大范畴厂商和硅供应商的策略

AWS展示了连续扩大的需求。这家超大范畴厂商复旧英伟达、AMD和英特尔芯片用于AI职责负载,同期也提供定制芯片给客户采选,AWS本领总监Shaown Nandi暗意。许多客户爱重英伟达的CUDA优化模子,而其他客户越来越多地继承AWS的Trainium以获取性价比和效果,Nandi补充说念。

"两者皆有很大需求,"他施展说。"Bedrock(AWS推理干事)上近50%的Token运行在咱们的Trainium芯片上。"

英伟达已意志到专用推理处理器的需求。2024年,高管暗意其数据中心收入约40%来自推理。2025年9月,米乐app下载英伟达告示推出Rubin CPX,这是为超大范畴和大型企业部署中的大范畴高下文推理遐想的GPU,特殊是在解码前处理提醒的预填充阶段。英伟达与Groq的许可左券旨在将快速、低蔓延、低老本的推理集成到其AI工场架构中;CNBC报说念策画整合Groq的低蔓延处理器以复旧更泛泛的及时推理。

英特尔除了策画收购SambaNova外,还在追求多种推理采选。该公司通过AMX加快器增强了其Xeon CPU,并为推理职责负载提供专用的Gaudi AI加快器。"今天好多推剪发生在CPU上。未来好多推理仍将发生在CPU上,"Kimball说。

AMD通过收购Untether AI工程团队,并在2025年11月收购推理初创公司MK1来增强实力。MK1开发优化AMD GPU在大范畴企业部署中进行高速推理和推理的软件。

Freund在2025年12月的博客著作中暗意,Google的最新TPU芯片将成为推理的有劲竞争者,而高通行将推出的AI200和AI250芯片答应大容量内存和更低老本,可能成为引东说念主注筹画数据中心采选。

值得热心的初创公司

推理契机涵盖数据中心和边际,条目因职责负载和部署而大不换取。"你在自动驾驶汽车中进行的推理与在线客服机器东说念主中的推理整个不同,"Kimball说。

Tirias Research首席分析师Jim McGregor指出,推理契机存在于任何有计较的地点,包括智高东说念主机、PC和汽车。"莫得两个职责负载是换取的,但咱们将看到针对不同职责负载类型的多种不同AI加快器,"他说。"阛阓仍处于早期阶段,仍有好多厂商的空间。"

Freund预测2026年大部分推理仍将在数据中心而非边际运行。

数据中心推理挑战者包括Cerebras和Tenstorrent。Cerebras开垦于2015年,简略一年前运转在其晶圆级芯片上提供推理能力。其系统不错通过软件在教悔和推理款式之间切换,当今约70%的职责负载专注于推理,Cerebras产物和计谋高等副总裁Andy Hock暗意。教悔仍占该公司大部分收入。

Tenstorrent开垦于2016年,由匡助遐想AMD Zen架构的Jim Keller攀附,正在构建基于RISC-V的AI推理处理器。

韩国NPU体现了边际到数据中心的千般性。Kimball暗意,FuriosaAI以节能NPU架构和LG等主要客户而驰名。据报说念该公司在2025年拒却了Meta的收购冷漠。另一家韩国初创公司Rebellions以其ARM本领和来自ARM和Samsung Ventures的要紧资金而驰名。

初创公司还在搞定推感性能的中枢内存和网罗瓶颈。开发RISC-V芯片遐想的SiFive于2025年9月推出其Intelligence系列协处理器的第二代,旨在最小化其AI CPU中的内存蔓延。NeuReality于2025年9月推出其NR2 AI-SuperNIC,这是复旧Ultra Ethernet Consortium顺序进行横向膨胀计较的网罗接口卡。据Freund称,d-Matrix开发的内存搞定有筹画不错以更低老本运行速率比高带宽内存快四倍。

阛阓预测

分析师预期英伟达将在教悔和推理中保抓主导地位,但千般化的条目为专用搞定有筹画创造了获取份额的空间。McGregor对初创公司在快速本领变革中的远景抓严慎格调,并预期会有更多整合。天然Groq已取得得手,但其他早期初创公司却举步维艰。除了AMD收购Untether AI和软银收购Graphcore外,McGregor指出,接头到SambaNova此前融资11亿好意思元,据报说念16亿好意思元的出售代表了一次"甩卖"。

GPU仍占主导地位,因为它是通用且多功能的。"这等于GPU仍然称王的原因。它是可编程的,"McGregor说。"你不错改变它、分叉它,并同期运行多个模子。"

Kimball抓不同不雅点,预期2026年主流企业继承将开释对推理为中心的初创公司的需求。"当推理阛阓已毕时,这些初创公司会作念得更好,"他说。他预期通用推理芯片和专科垂直搞定有筹画皆有契机。

总的来说,Kimball暗意,专用推理芯片的上风——更低老本、减少功耗和强盛性能——创造了紧要契机。现时的初创公司能否行使这些契机仍有待不雅察。"这是一个丰富而充满活力的初创公司场景,"他说。"有如斯多的契机、如斯多的篡改正在进行,而况仍处于游戏的早期阶段。"

Q&A

{jz:field.toptypename/}

Q1:AI推理和AI教悔有什么区分?

A:AI推理是运行教悔好的模子来提供输出,而教悔是构建模子的经过。推理与教悔在经济性和性能条目方面压根不同。教悔AI模子是老本中心,而推理是平直产生收入的"盈利中心"。推理需要更低的蔓延、更高的效果和更低的总领有老本。

Q2:为什么专用推理芯片比GPU更有上风?

A:天然GPU提供出色的性能,但它们时常具有为教悔优化的架构特质,在纯推理用例中并不老是能振荡为更低的蔓延或更高的效果。专用推理芯片如ASIC和其他加快器不错提供更快的反应、改革的能效和更低的总领有老本,特殊顺应对蔓延条目严格的应用场景。

Q3:哪些公司在推理芯片阛阓值得热心?

A:数据中心推理挑战者包括Cerebras和Tenstorrent。韩国的FuriosaAI以节能NPU架构驰名,Rebellions以ARM本领著称。此外还有特意搞定内存和网罗瓶颈的初创公司,如SiFive、NeuReality和d-Matrix等,它们皆在不同范畴提供专科化的推露出决有筹画。