英伟达公开最快AI超级计算机Eos:集成了4608个H100!
近日,英伟达(NVIDIA)首度对外公开了其最新的面向企业的AI超级计算机Eos,这是专为数据中心规模的高阶AI开发所设计,也是英伟达目前速度最快的AI超级计算机。
据介绍,Eos配备了576个NVIDIA DGX H100系统,每个系统搭载8个H100 GPU,即共计拥有4,608个Nvidia H100 GPU,同时还配备了1,152个英特尔Xeon Platinum 8480C处理器(每个CPU有56个内核),使得Eos在HPC和AI的性能表现令人印象深刻。此外,Eos采用英伟达的Mellanox Quantum-2 InfiniBand技术,支持高达400 Gb/s数据传输速度,对训练大型AI模型和系统扩展至关重要。
根据英伟达公布的数据显示,在最新的Top500超级计算机当中,Eos的峰值性能达到了188.65 Peta FLOPS ,成为了全球第九大超级计算机。同时,Eos的FP64性能更是居于前列,达到了121.4 Peta FLOPS。Eos不仅供英伟达自身使用,其构架也为其他想打造面向企业的超级计算机的公司提供蓝本。英伟达在视频中表示:“EOS 每天都会迎接数千名英伟达内部开发人员进行人工智能研究的挑战,帮助他们解决以前无法解决的问题。”
英伟达表示,除强大硬件,Eos专为AI开发和部署设计的强大软件,包括协调和集群管理工具、加速运算存储和网络库,以及优化的操作系统。因此,Eos可应对从类似ChatGPT生成式AI到AI工厂等各种应用。
英伟达强调,Eos整合了其在AI领域的专业技术和经验,是先前DGX超级计算机知识的结晶,可以帮助企业处理最具挑战性的项目,并实现AI目标。
尽管Eos具体成本未公开,且Nvidia DGX H100系统定价是保密的,具体售价也取决于很多因素,但考虑到每个H100成本可能在3万至4万美元之间,因此整个系统成本可能非常高昂。