辉达新一代AI伺服器效能提升10倍



(旧金山4日综合电)辉达公司(Nvidia)周三公布最新数据,显示其新一代人工智能(AI)伺服器能让中国两款热门模型在内的新型AI模型效能提升10倍。
路透社报导,这项数据发布之际,AI产业重心正从辉达长期主导的“训练AI模型”转向“实际对数百万用户的应用上”,辉达在这一领域正面临超微公司(AMD)、Cerebras等对手更激烈的竞争。
ADVERTISEMENT
辉达释出的数据著重于所谓的“混合专家”(mixture-of-expert)AI模型,这种技术透过将问题拆分给模型中的多个“专家”,大幅提升AI模型的运算效率。自从中国DeepSeek今年以效能突出的开源模型震撼全球,并展示这种模型今年初训练时耗用辉达晶片数量少于竞争者后,让这种技术爆红。
自此之后,ChatGPT开发商OpenAI、法国AI新创公司Mistral、中国的月之暗面(Moonshoot AI)等业者也都采用混合专家技术。月之暗面今年7月也推出效能备受肯定的开源模型。
辉达表示,新一代AI伺服器是由72颗尖端晶片组成,并以高速连线相互串接,能让月之暗面的Kimi K2 Thinking模型效能比前一代辉达伺服器提升10倍,对DeepSeek模型也有类似效益。
辉达指出,效能大幅提升,主要因伺服器内可容纳更多晶片,以及晶片间高速连结,这些方面仍是辉达目前相对于竞争者的优势。
辉达的竞争者超微也正积极研发类似产品,计划明年推出以多颗强大晶片组装的AI伺服器。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT

