Intel lança oficialmente Sapphire Rapids e HPC
Por Tiffany Trader
10 de janeiro de 2023
Após vários atrasos, a Intel lançou seu processador Intel Xeon Scalable de quarta geração, codinome Sapphire Rapids, o sucessor do Ice Lake. Fabricado no nó Intel 7 (anteriormente conhecido como 10nm) e com até 60 núcleos Golden Cove por processador, além de novos núcleos aceleradores dedicados, a plataforma oferece um ganho médio de desempenho de 1,53x em relação à geração anterior e um desempenho médio de 2,9x por eficiência de watt melhoria para cargas de trabalho direcionadas usando os novos aceleradores, de acordo com a Intel.
O lançamento, realizado hoje como uma festa global transmitida ao vivo, também incluiu a CPU e a GPU da série Max recentemente renomeada, anteriormente chamadas de "Sapphire Rapids HBM" e "Ponte Vecchio", respectivamente.
A família Sapphire Rapids inclui 52 SKUs (consulte o gráfico) agrupados em 10 segmentos, incluindo a série Max: 11 são otimizados para desempenho de 2 soquetes (8 a 56 núcleos, 150-350 watts), 7 para desempenho de linha principal de 2 soquetes ( 12 a 36 núcleos, 150-300 watts), 10 alvos de quatro e oito soquetes (8 a 60 núcleos, 195-350 watts) e há 3 peças otimizadas de soquete único (8 a 32 núcleos, 125-250 watts ). Também existem SKUs otimizados para nuvem, rede, armazenamento, mídia e outras cargas de trabalho.
A linha de SKUs da série Xeon Max "Otimizada para HPC" inclui versões de 32, 40, 48, 52 e 56 núcleos. Todas essas cinco peças de 2 soquetes atingem o máximo de 350 watts, e os preços de tabela variam de US$ 7.995 para o 9462 de 32 núcleos a US$ 12.980 para o 9480 de 56 núcleos. núcleo 8490H, que custa US $ 17.000, e o 8460H de 48 núcleos por US $ 13.923.
Em um evento para a imprensa em Hillsboro, Oregon, no mês passado, o Intel Senior Fellow Ronak Singhal fez referência à ampla variedade de SKUs, dizendo: "Os clientes dirão que vocês têm muitos SKUs, vocês podem reduzir o número de SKUs, mas podem adicionar esses três SKUs que são muito, muito importantes? Portanto, temos esse empurrão e puxa com nossos clientes."
Novos recursos nos processadores Intel Xeon Scalable de quarta geração incluem PCIe 5.0, memória DDR5 e suporte para CXL 1.1.
A parte superior de dois soquetes (não HBM) 8480+ de 56 núcleos - com 40% a mais de núcleos do que sua contraparte Ice Lake - obteve aumentos de desempenho geração após geração em vários benchmarks, oferecendo um aumento de 1,5x melhoria no Stream Triad, uma melhoria de 1,4x para HPL e uma melhoria de 1,6x para HPCG. Os testes da Intel em mais de uma dúzia de aplicativos do mundo real (incluindo WRF, Black Scholes, Monte Carlo e OpenFoam) mostraram acelerações semelhantes, com o maior ganho para uma carga de trabalho física, CosmoFlow (2,6x).
A CPU da série Max é o primeiro processador x86 com memória de alta largura de banda integrada. Ele oferece um ganho de desempenho de 3,7 vezes para cargas de trabalho ligadas à memória, de acordo com a Intel, e requer 68% menos energia do que "sistemas concorrentes implantados". No aplicativo AlphaFold2, a CPU Xeon Max mostrou uma aceleração de 3x sobre o processador Ice Lake nos testes da Intel. Notável para observadores de benchmark HPC, o processador da série Max atinge uma aceleração de quase 2,4x em HPCG e uma aceleração de 3,5x para Stream Triad, em comparação com o equivalente Sapphire Rapids somente DDR. O HBM na CPU da série Max não ofereceu nenhuma melhoria de desempenho para o benchmark High Performance Linpack.
A GPU "Ponte Vecchio" da série Max, também lançada hoje, contém mais de 100 bilhões de transistores em um pacote de 47 blocos com até 128 núcleos Xe HPC. Dependendo do fator de forma, ele suporta até 128 GB de memória HBM2e e oferece até 52 teraflops FP64 de pico. A combinação da GPU da série Max com a plataforma de CPU da série Max (em uma proporção de três para um GPU:CPU) oferece um aumento de desempenho de 12,9x para cargas de trabalho de dinâmica molecular LAMMPS, em comparação com uma plataforma Ice Lake sem GPUs, de acordo com o benchmarking realizado pela Intel. A adição de GPUs Max (seis GPUs adicionadas a um servidor de 2 CPUs) se traduziu em um aumento de 9,9x em comparação com uma plataforma somente de CPU da série Max para a mesma carga de trabalho. A memória de alta largura de banda nas CPUs host permitiu uma melhoria de desempenho de 1,55x em comparação com o uso apenas de DDR5. (Foto de demonstração realizada em Hillsboro, Oregon, no mês passado.)