首页 >> 数码 >

谷歌云正在打造迄今为止最强大的超级计算机

2023-07-26 10:56:00 来源：用户：

新的强大功能可用于训练机器学习(ML)模型，延续这家科技巨头最近为AI目的提供云基础设施的努力，例如新的G2，这是首款使用新NVIDIAL4Tensor的云虚拟机(VM)核心GPU。

该公司在一篇博客文章中指出，“谷歌计算引擎A3超级计算机是专门为训练和服务最苛刻的人工智能模型而设计的，这些模型为当今的生成式人工智能和大型语言模型创新提供了动力。”

A3使用NvidiaH100GPU，它是流行的A100的后继产品，A100曾为之前的A2提供动力。它还用于为ChatGPT提供支持，ChatGPT是一款AI编写器，去年11月推出时，它启动了生成式AI竞赛。

A3也是第一款GPU使用Google定制设计的200GbpsVPU的虚拟机，其网络带宽是之前A2虚拟机的十倍。

A3还将利用谷歌的Jupiter数据中心，该数据中心可以扩展到数以万计的互连GPU，并“允许全带宽可重构光学链路，可以根据需要调整拓扑”。

谷歌还声称“工作负载带宽......与更昂贵的现成非阻塞网络结构没有区别，从而降低了总体拥有成本。”A3还“提供高达26exaFlops的AI性能，这大大缩短了训练大型ML模型的时间和成本。”

当谈到推理工作负载(生成式AI执行的实际工作)时，Google再次大胆宣称A3的推理性能比A2提高了30倍。

除了八个H100之间的对分带宽为3.6TB/s之外，A3的其他出色规格还包括下一代第四代IntelXeon可扩展处理器，以及通过4800MHzDDR5DIMM提供的2TB主机内存。

NVIDIA超大规模和高性能计算副总裁IanBuck表示：“GoogleCloud的A3VM由下一代NVIDIAH100GPU提供支持，将加速生成式AI应用程序的训练和服务。”

在GoogleI/O2023上的一份免费声明中，该公司还表示，VertexAI中的生成式AI支持现在将向更多客户提供，这允许在完全托管的基础设施上构建ML模型，而无需维护。

客户还可以在GoogleKubernetesEngine(GKE)和ComputeEngine上部署A3，这意味着他们可以获得自动扩展和工作负载编排方面的支持，并有权自动升级。

在人工智能方面，谷歌似乎采取的是B2B方式，而不是释放人工智能供任何人使用，也许是因为其ChatGPT竞争对手GoogleBard的不吉利推出而受到了伤害。然而，它还在GoogleI/O上宣布了PaLM2，这是它的继任者，据说比其他LLM更强大，所以我们必须关注这个领域。

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！