Créditos: Adrenaline

TFLOPS e a treta Xbox Series X vs Playstation 5

E também demos uma olhadinha nesse tal de SSD mais rápido

SonyMicrosoft soltaram suas cartas na mesa quando o assunto é o hardware de seu videogame de próxima geração. Enquanto muito da estratégia é compartilhada, como uso de componentes da AMD, SSDs como tecnologia armazenamento dos games e o aumento de performance - algo esperado de uma nova geração de consoles - duas diferenças técnicas chamaram a atenção: o "poder de fogo" maior do Xbox e o SSD mais rápido do Playstation. Mas, afinal, o quanto eles serão diferentes?

Começando pela performance gráfica, uma das partes mais importantes para quem está de olho em um novo videogame, já que isso define a capacidade de gerar belos visuais nos jogos, e temos bastante chão separando os dois modelos. Se preparem, aí vem especificações: o Playstation 5 tem um total de 36 unidades computacionais com 2304 shaders e um clock variável com máximo em 2,23GHz. Já o Xbox Series X traz clock menor e fixo, os 1,825GHz, mas com um chip muito mais "parrudo" com 52 unidades computacionais e um total de 3.328 shaders.

Mesmo com a diferença nos clocks variáveis, há uma diferença bastante respeitável entre a estrutura do Xbox frente ao Playstation, pois 40% mais shaders é muita coisa. Mas um número que o pessoal se apegou bastante é outro: 12 TFLOPS. A meta da Microsoft era dobrar a performance comparado ao Xbox One X. Apesar do clock do Playstation 5 ser variável, a empresa definiu os 2.23GHz para manter a estabilidade, e a expectativa é que em alta carga o Playstation 5 fique próximo de sua capacidade máxima, que é em torno de 10.3 TFLOPS.

Aqui começa e infelizmente termina boa parte das discussões sobre o tópico. 12 é maior que 10,3. Como diz H. L. Mencken, "Para todo problema complexo existe sempre uma solução simples, elegante e completamente errada.", e essa discussão virou isso. Comparar os dois sistemas olhando apenas para isso é um reducionismo de duas estratégias bem diferentes de implementação de um console, e vamos nos aprofundar mais nisso. E para começar, precisamos entender o que é TFLOPS.

O que é TFLOPS?

Além de uma gíria para lançamento de produto fracassado, FLOPS é um acrônimo para Floating-Point Operations per Second, ou em tradução livre, operações de ponto flutuante por segundo. É uma unidade de medida bastante comum na supercomputação para comparar performance, e indica a capacidade de um sistema realizar cálculos de ponto flutuante.

FLOPS = Operações de Ponto Flutuante por Segundo

- Continua após a publicidade -

Como todo benchmark de desempenho, ele tem justamente o mérito de facilitar comparações. TFLOPS de um sistema é só um número, e comparar X é maior ou menor que Y fica bastante facilitado.

O problema é que TFLOPS também é um processo computacional bem específico. É tipo determinar se uma pessoa é atlética pelo seu desempenho no salto em distância. Sim, dá uma noção, já que alguém que salta longe provavelmente tem boa condição atlética, mas rodar um game envolve processos e fluxos de trabalho muito mais complexos e variados que isso, assim como ser bom em um esporte não garante ser bom em todos os esportes. Rodar um game moderno está mais para o Decatlo, e esse excelente saltador pode não correr muito bem.

Essa é a realidade dos chips gráficos modernos desde o Unified Shader Model, introduzido nas microarquiteturas NVIDIA a partir das Teslas, em 2006, e com as AMD Xenos, que equipariam por exemplo o Xbox 360, lançado em 2005. Cada unidade computacional é capaz de fazer múltiplas ações diferentes, e por isso tanto NVIDIA quanto AMD vem investindo em cada vez por mais desses shaders versáteis em seus produtos. Até mesmo aprendizado da máquina tem aparecido entre as possibilidades com o uso do DirectML.

RTX 2080 Super vs 2080 Ti

Então usar apenas os TFLOPS como unidade de medida pode não ser a melhor alternativa. Para exemplificar isso, vamos para um comparativo. Pegamos de referência duas placas de vídeo: uma RTX 2080 Super e uma RTX 2080 Ti. Elas tem uma relação parecida de salto no tamanho do chip (3072 shaders para 4352 shader, na casa dos 40%) e TFPLOS (11.15 para 13.45, beirando os 20%). Abaixo, o quanto há de diferença entre elas na prática, em games:

- Continua após a publicidade -

Como dá pra ver bem, o ganho de performance varia bastante. Pode ir desde singelos 7,5% até impressionantes 25%, com uma média geral mais próximo dos 18%. É bem evidente a vantagem para rodar em 4K, onde surgem as maiores diferenças, enquanto que FullHD outros elementos além da performance do chip gráfico vão ficando se tornando limitadores, pois passamos a rodar os games bem acima dos 100fps e aí "tudo atrapalha", desde latência de comunicação com as memórias até limitações do processador e do motor gráfico do jogo.

Esse comparativo nos leva a duas conclusões. A primeira é que sim, tem consoles, mas que essa diferença também não será suficiente para ser decisiva. Um dono de uma RTX 2080 Super e de uma RTX 2080 Ti tem que configurar seus games de forma levemente diferente, mas no fim do dia ainda ambos estão com um hardware poderoso em mãos e na essência tem uma experiência bastante próxima.

Conceito PS5 vs Conceitos XBox Series X

Mas tem outro fator que estou muito curioso para ver, e que justifica novamente eu usar esses dois modelos. A diferença de filosofia entre os dois consoles é algo que vai ser muito interessante de ver na prática. 

Explico-me: na apresentação tediosa do Playstation 5, essa abordagem é detalhada. Abaixo, em inglês, dá pra ver na íntegra:

O balanço entre tamanho do chip e a frequência é algo que a apresentação de Mark Cerny, líder da arquitetura do sistema do Playstation 5, se debruçou bastante no trecho acima, e Sony e Microsoft seguiram caminhos bem diferentes.

A Sony aposta em clocks mais altos. Isso quer dizer que a cada segundo, o PS5 vai fazer mais ciclos de processamento comparado ao Xbox Series X. Essa filosofia tem uma vantagem: aumentar frequência de operação atinge múltiplos aspectos do funcionamento do chip, ou como o próprio Cerny compara: "uma maré alta levanta todos os barcos". Clock mais alto aumenta largura de banda de comunicação entre componentes, poder de processamento, velocidade dos caches e vários aspectos ao mesmo tempo. O engenheiro só citou dois defeitos: uma maior discrepância em relação com os ciclos das memórias, um problema que acho pouco relevante, e maiores dificuldades com questões como aquecimento e alimentação de energia, afinal um chip operando em frequências mais altas também fica mais exigente tanto no sistema de alimentação quanto de resfriamento. Nesse último tópico, o engenheiro da empresa disse que a Sony é excelente em desenvolver consoles lidando com esses desafios e, cá entre nós, nunca que ele iria afirmar outra coisa.

Eu adicionaria outro problema a essas afirmações. De acordo com Cerny, 30% mais clock resulta em 30% mais capacidade de rasterização. Em nossos testes aqui no Adrena, sabemos bem que aumento de clock e aumento de performance não são grandezas lineares, então não raro temos ganhos irrisórios de performance em overclock. Normalmente os chips tem um patamar de operação em que há um equilíbrio entre performance, consumo de energia e estabilidade, e forçar clocks mais elevados vai tornando a curva da evolução na performance cada vez menos eficiente, com muita energia e resfriamento sendo necessários para ganhos cada vez menores. Os 2,23GHz de operação parecem bastante impressionantes mesmo considerando a nova microarquitetura RDNA 2, pois modelos en RDNA de primeira geração, como a RX 5700 XT de desktop, com toda uma estrutura de resfriamento e alimentação dedicada só para ela, fica na casa dos 1,8GHz, como dá pra ver no vídeo abaixo:

Menor forçado ou Maior tranquilo?

Mas outra parte da explicação de Cerny nos leva ao Xbox Series X. Enquanto defende a implementação de chips menores e frequências mais altas, a Sony está falando justamente que seu plano é melhor que o da Microsoft. O Series X aposta no oposto: um chip de grande porte operando fixo em uma frequência mais baixa. E obviamente a abordagem diferente tem benefícios e desafios.

O primeiro problema é o custo: quanto maior o chip, mais caro é sua fabricação. Isso acontece porque quando a peça em silício é trabalhada através do processo de litografia, invariavelmente erros acontecem. Quanto maior o chip, mais difícil é garantir que o componente seja funcional dentro das especificações requeridas. É por isso que o chip do Series X tem, na realidade, 56 unidades computacionais, mas apenas 52 que serão ativas. Aí surge uma margem de erro de até 4 unidades computacionais defeituosas para se trabalhar e garantir que menos chips sejam desperdiçados. 

Novamente, as opções feitas por cada empresa tem sempre impactos em diferentes frentes. Se para a Microsoft o custo do chip aumenta, a Sony vai precisar de cuidado adicional na alimentação e resfriamento de seu chip com operação em frequências mais altas. Clocks mais altos também são mais difíceis de se estabilizar, e se por um lado nunca vimos uma RDNA operando em 2,23GHz, pode ser que a segunda geração dessa microarquitetura consiga isso com facilidade. Estamos falando aqui de território desconhecido, pois nunca vimos um produto com RDNA 2 em ação.

Outro ponto é a eficiência de um chip de maior porte. Chips gráficos tem trazido grandes benefícios com suas grandes quantidades de unidades computacionais, mas a verdade é que nem tudo na computação funciona bem em paralelismo. É mais difícil otimizar o uso de 3.328 shaders e garantir que todos estão sendo aproveitados do que 2.304 shaders. Essa é uma aversidade que sempre impediu a indústria de simplesmente colocar mais núcleos em tudo para ganhar mais performance - isso e problemas de alimentação, resfriamento e custo que esses "gigachips" teriam.

E por isso nossa escolha de placas na comparação é relevante. A GeForce RTX 2080 Ti, além de ser um chip maior, tem um clock de operação mais discreto, chegando a 1850MHz em nosso gameplay, enquanto a RTX 2080 Super chega a 1935MHz, em geral. As diferenças vão ser um pouco maiores, chegando a 500MHz se a Sony conseguir manter seu console próximo dos 2,23GHz, mesmo.

SSDs NVMe de alto desempenho

E para finalizar, o lado favorável para a Sony nesse comparativo, o SSD. Mesmo havendo uma diferença relevante entre os dois sistemas quando o assunto é velocidade de comunicação do armazenamento, com o Playstation trazendo 5,5GB/s de performance bruta e até 9GB/s comprimido os dados, versus os 2,4 GB/s brutos ou 4,8 GB/s comprimidos do Xbox Series X, a verdade é que na prática pode não ser algo tão diferente assim. Basta olhar nosso comparativos de SSDs. Em testes sintéticos, temos a seguinte realidade:

No gráfico, há gigantescas diferenças separando um HD dos mais rápidos que testamos, o Velociraptor, o SSD ainda operando na tecnologia mais antiga SATA, o A400 da Kingston, e um dos mais rápidos modelos que já testamos, o TeamGroup operando em NVMe PCI 3.0. E não é de ficar surpreso, o SSD NVMe da TeamGroup tem velocidade de leitura de até 2700MB/s, versus os 500 MB/s do SSD SATA da Kingston e os 200MB/s do HD de 10000RPM da Western Digital, o Velociraptor.

Mas isso são testes sintéticos, vamos ao mundo real:

Fica evidente que a evolução na performance não é linear. Quando chegamos a um certo patamar de performance, o carregamento das coisas se torna muito rápido e a experiência na ponta do consumidor vai ficando cada vez mais próxima mesmo com novos incrementos na performance. Mesmo com uma leitura 273% mais rápida em nosso testes sintético, o SSD mais rápido só levou 10% menos tempo para iniciar o Windows, e 16% menos tempo para abir uma fase. Na segunda abertura da mesma fase todos empatam, pois muitos dos dados necessários ainda estavam na RAM.

Já vimos isso com a chegada dos SSDs PCIe 4.0 NVMe. Apesar de serem muito superiores em testes sintéticos, é difícil achar uma situação em que vemos ele entregando diferenças grandes de performance em usos práticos. Um dos poucos exemplos foi a renderização em tempo real de um vídeo em 8K, coisa que um SSD menos ágil não dá conta. Isso dá uma dimensão do quanto mesmo o SSD do Series X, operando a 2400MB/s sem compressão e 4800MB/s, será um "overkill" para qualquer missão de carregar texturas ou geometria em tempo real, ou mesmo carregar toda uma nova fase ou jogo. Dificilmente a diferença de desempenho do armazenamento dos dois consoles deve impactar muito na experiência do jogador.

Conclusão

A conclusão é que mesmo tendo diferenças estruturais, ambos os consoles não estão tão distantes em termos de capacidades. Vai ser muito interessante ver qual das duas apostas vai se sair melhor, o chip menor e com clock mais alto da Sony ou a mais robusta e potente GPU da Microsoft fixa em uma frequência mais baixa. Existe uma diferença de potência gráfica, mas não o suficiente para desqualificar o console da Sony, enquanto o SSD mais rápido não deve ser um diferencial marcante, com ambos abrindo jogos de forma muito ágil e ambos viabilizando novos tipos de games graças ao armazenamento rápido. Agora é esperar a maior cartada de cada empresa, e que ambas estão esperando os movimentos do adversário: definir o preço.

  • Redator: Diego Kerber

    Diego Kerber

    Formado em Jornalismo pela Universidade Federal de Santa Catarina (UFSC), Diego Kerber é aficionado por tecnologia desde os oito anos, quando ganhou seu primeiro computador, um 486 DX2. Fã de jogos, especialmente os de estratégia, Diego atua no Adrenaline desde 2010 desenvolvendo artigos e vídeo para o site e canal do YouTube

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.