Créditos: Divulgação | Intel

GPUs Intel Xe HP podem oferecer desempenho em PetaFLOPs - Confira desempenho

Porém, os resultados não representam uma carga de trabalho gráfica em tempo real

O arquiteto-chefe e vice-presidente sênior da divisão de gráficos dedicados da Intel, Raja Koduri, deu uma palestra na HotChips 32 e, agora, temos mais informações sobre os avanços arquitetônicos na indústria de semicondutores. Entre os destaques, o executivo mostrou pela primeira vez como é a GPU Xe HP de 4 tiles e os seus benchmarkings, registrando a potência bruta desse componentes.

A GPU apresentada representa a maior e mais rápida variante entre as Intel Xe HP, que, pelo mapa da empresa, já está entre os componentes premium voltados para computação mais pesada.

Rodando com um único tile, a GPU conseguiu entregar o desempenho de 10588 GFLOPs, ou cerca de 10.588 TeraFLOPs. No outro extremo, usando os quatro tiles, o resultado é escalonado em 3,993 vezes e pontua 41908 GFLOPs, resultando em 41,908 TeraFLOPS.

A Intel não confirmou as especificações exatas, mas mostrou o dimensionamento de desempenho para uma carga de trabalho computacional das variantes de 1, 2 e 4 tiles - a Xe HP usa apenas EMIB para escalonar a configuração multi-tile (ou seja, os pacotes para os dois últimos têm basicamente 2x e 4x o tamanho do design básico). Os testes foram medidos em FP32 de precisão simples.

- Continua após a publicidade -

Koduri ainda mencionou que o chip de 4 tiles é capaz de oferecer "desempenho em nível PetaFLOPs", o que significa que a GPU seria incrivelmente rápida para tarefas como aprendizado de máquina e IA. Como o TechPowerUp menciona:

"Dado que a GPU suporta tensor cores, se calcularmos que ela tem 2.048 unidades de execução (EUs), capazes de realizar 128 operações por ciclo (128 TOPs), e o fato de haver cerca de 2 unidades FMA (Fused Multiply-Add), isso é igual a cerca de 524.288 FLOPs de potência AI. Isso significa que ela precisa ter uma frequência de pelo menos 2GHz para atingir a meta de desempenho PetaFLOP ou ter mais de 128 TOPs de capacidade de computação." - Trecho da publicação do TechPowerUp.

"Dado que a GPU suporta tensor cores, se calcularmos que ela tem 2.048 unidades de execução (EUs), capazes de realizar 128 operações por ciclo (128 TOPs), e o fato de haver cerca de 2 unidades FMA (Fused Multiply-Add), isso é igual a cerca de 524.288 FLOPs de potência AI. Isso significa que ela precisa ter uma frequência de pelo menos 2GHz para atingir a meta de desempenho PetaFLOP ou ter mais de 128 TOPs de capacidade de computação." - Trecho da publicação do TechPowerUp.

No entanto, é válido lembrar que esses resultados não espelham o que os usuários finais devem receber. O escalonamento oferecido pelos tiles adicionais pode parecer quase perfeito demais, mas não representam uma carga de trabalho gráfica em tempo real. Para cargas de trabalho computacionais, as tarefas geralmente são independentes e podem atingir o dimensionamento perfeito. O trabalho entre GPUs para tecnologias como SLI e CrossFire normalmente oferece 50-80% mais desempenho  aos jogadores.

Um dos objetivos da família Xe é englobar diferenciados níveis de demanda , desde soluções gráficas integradas de baixo consumo sob a marca Xe LP até soluções multi-chip com empilhamento de matrizes voltadas para data centers.

- Continua após a publicidade -

Via: TechPowerUp, Tomshardware
Tags
  • Redator: Saori Almeida

    Saori Almeida

    Saori Almeida é natural do Rio Grande do Sul, técnica em administração formada pelo Centro Tecnológico de Caxias do Sul (CETEC) e estudante de Jornalismo na Universidade Federal de Santa Catarina (UFSC). Gosta da cultura asiática e nerd no geral e tem interesse crescente por tecnologia e games desde pequena - gosto que se intensifica diariamente na redação.

Qual vai ser o melhor game de outubro de 2020?

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.