英伟达计划推出全新AI推理芯片整合Groq技术欲重塑市场格局
英伟达计划推出全新AI推理芯片整合Groq技术欲重塑市场格局
英伟达计划发布一款专为OpenAI及其他客户定制的全新处理器,助力打造更快、更高效的工具。这是其业务的重大调整,或将重新定义AI竞赛格局。
整合Groq技术
据知情人士透露,该公司正在为AI推理计算设计全新系统——这类计算负责让AI模型响应用户请求。这款新平台将于下月在圣何塞举办的英伟达GTC开发者大会上正式公布,将整合初创公司Groq设计的芯片。
部分知情人士称,OpenAI已同意成为这款新处理器的最大客户之一,对英伟达而言是重大胜利。这家ChatGPT开发者本就是英伟达的核心客户,过去数月一直在寻找英伟达芯片的更高效替代方案。
推理芯片市场竞争激烈
推理计算已成为行业激烈竞争的焦点。竞争对手谷歌和亚马逊均已推出芯片,与英伟达旗舰产品抗衡。同时,科技行业自主编码技术的爆发式增长,催生了对能更高效处理复杂AI任务的新型芯片的需求。
英伟达在设计与销售GPU领域占据主导地位,掌控着90%以上的GPU市场份额。但随着市场向推理方向转移,部分客户正施压英伟达,要求推出能更高效支撑AI应用的芯片。

市场格局生变
过去一年,随着企业纷纷部署AI智能体等工具,高端计算需求已从训练转向推理。智能体是可相对自主地代用户完成任务的AI系统。许多企业发现GPU成本过高、功耗过大,且并不完全适配模型实际运行需求。
上月,OpenAI与Cerebras达成数十亿美元的计算合作。此外,英伟达于去年底同意以200亿美元获得Groq关键技术授权,并引进其核心管理团队。Groq所设计的芯片采用与英伟达截然不同的架构,名为语言处理单元,在推理功能上效率极高。



