首页 数码 > 内容

谷歌云正在打造迄今为止最强大的超级计算机

时间:2023-07-26 10:56:00 来源:
导读 新的强大功能可用于训练机器学习(ML)模型,延续这家科技巨头最近为AI目的提供云基础设施的努力,例如新的G2,这是首款使用新NVIDIAL4Tensor

新的强大功能可用于训练机器学习(ML)模型,延续这家科技巨头最近为AI目的提供云基础设施的努力,例如新的G2,这是首款使用新NVIDIAL4Tensor的云虚拟机(VM)核心GPU。

该公司在一篇博客文章中指出,“谷歌计算引擎A3超级计算机是专门为训练和服务最苛刻的人工智能模型而设计的,这些模型为当今的生成式人工智能和大型语言模型创新提供了动力。”

A3使用NvidiaH100GPU,它是流行的A100的后继产品,A100曾为之前的A2提供动力。它还用于为ChatGPT提供支持,ChatGPT是一款AI编写器,去年11月推出时,它启动了生成式AI竞赛。

A3也是第一款GPU使用Google定制设计的200GbpsVPU的虚拟机,其网络带宽是之前A2虚拟机的十倍。

A3还将利用谷歌的Jupiter数据中心,该数据中心可以扩展到数以万计的互连GPU,并“允许全带宽可重构光学链路,可以根据需要调整拓扑”。

谷歌还声称“工作负载带宽......与更昂贵的现成非阻塞网络结构没有区别,从而降低了总体拥有成本。”A3还“提供高达26exaFlops的AI性能,这大大缩短了训练大型ML模型的时间和成本。”

当谈到推理工作负载(生成式AI执行的实际工作)时,Google再次大胆宣称A3的推理性能比A2提高了30倍。

除了八个H100之间的对分带宽为3.6TB/s之外,A3的其他出色规格还包括下一代第四代IntelXeon可扩展处理器,以及通过4800MHzDDR5DIMM提供的2TB主机内存。

NVIDIA超大规模和高性能计算副总裁IanBuck表示:“GoogleCloud的A3VM由下一代NVIDIAH100GPU提供支持,将加速生成式AI应用程序的训练和服务。”

在GoogleI/O2023上的一份免费声明中,该公司还表示,VertexAI中的生成式AI支持现在将向更多客户提供,这允许在完全托管的基础设施上构建ML模型,而无需维护。

客户还可以在GoogleKubernetesEngine(GKE)和ComputeEngine上部署A3,这意味着他们可以获得自动扩展和工作负载编排方面的支持,并有权自动升级。

在人工智能方面,谷歌似乎采取的是B2B方式,而不是释放人工智能供任何人使用,也许是因为其ChatGPT竞争对手GoogleBard的不吉利推出而受到了伤害。然而,它还在GoogleI/O上宣布了PaLM2,这是它的继任者,据说比其他LLM更强大,所以我们必须关注这个领域。

标签:
最新文章