ANÁLISE: Threadripper 3990X - Inacreditáveis 64 núcleos e 128 threads em um CPU

Processador é uma peça surreal de engenharia que parece até fora de lugar

O AMD Ryzen Threadripper 3990X é um processador de altíssimo desempenho, e o mais poderoso modelo da linha Threadripper. Ele redefine esse mercado de super-entusiastas, chamados de HEDT, com configurações que só víamos em processadores para super-computação e servidores, com 64 núcleos e 128 threads, valores inconcebíveis para esse segmento e esse preço, no passado.

Site oficial do AMD Ryzen Threadripper 3990X
Link de compra na Pichau

Mas, não é só no número de núcleos/threads que trazem novidades na geração TR 3000. Os produtos herdam a microarquitetura Zen2 e suas melhorias, como a adição do cache L3 disponível (saltando de 256MB versus os 64MB do 2990WX), clocks base de operação mais altos e também a nova litografia de 7nm.

Outros dois tópicos críticos são as memórias, que buscam contornar aquelas complexidades das gerações anteriores quando o assunto é gerenciamento de acesso às memórias - a necessidade até de desabilitar núcleos ou mudar distribuição de acesso da RAM para buscar mais performance - , e um suporte mais completo ao AVX2. 

E, por fim, outro desafio foi melhorar a performance single-thread, ponto em que a Intel ainda possuía a vantagem e trazia benefícios para os modelos Core em determinados ciclos de trabalho.

Comparativo

AMD Ryzen Threadripper 3990XAMD Ryzen Threadripper 3970XAMD Ryzen Threadripper 2990WXAMD Ryzen Threadripper 1950X

Preços

Preço no lançamentoU$ 3.990,00 US 1.999,00 U$ 1.799,00 U$ 999,00
Preço atualizadoR$ 26.999,00 R$ 11.449,86 R$ 8.999,00 R$ 5.499,00

Especificações

CodinomeZen 2 Zen 2 Zen+ Zen
SoquetesTRX4 sTRX4 sTR4 sTR4
Fabricação em7nm 7nm 12nm 14nm
Instruções64-bit 64-bit 64-bit 64-bit
Núcleos64 32 32 16
Threads128 64 64 32
Clock2900 MHz3700 MHz3000 MHz3400 MHz
Clock (Turbo)4300 MHz4500 MHz4200 MHz4000 MHz
DesbloqueadoSim Sim Sim Sim
Canais de memóriaquad-channel quad-channel quad-channel quad-channel
MemóriasDDR4 @ 3200MHz DDR4 @ 3200MHz DDR4 @ 2933MHz DDR4 @ 2667MHz
Cache256 128 64 32
PCI Express4.0 4.0 3.0 3.0
Canais PCI Express64 64 64 64
TDP280 280 250 180

Vídeo Integrado

GPUSEM VÍDEO INTEGRADO SEM VÍDEO INTEGRADO SEM VíDEO INTEGRADO SEM V͍DEO INTEGRADO

Características Gerais

Acompanha cooler?Não Não Não Não

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4

AMD Ryzen Threadripper 3990WX, without cooler 64 Cores Cache 288MB 4.3GHz sTR4


O Threadripper 3000

- Continua após a publicidade -

A nova geração de processadores Threadripper traz importantes reestruturações. A nova família Zen2 oferece suporte ao PCIe 4.0, assim como acontece nos modelos mainstream Ryzen. Além dos slots com mais largura de banda e comunicação mais eficiente, a AMD evoluiu a comunicação do CPU com o chipset, passando do PCIe 3.0 x4 usado na geração anterior para o PCIe 4.0 x8. 

Os Threadrippers 3000 trazem novas tecnologias e trocam o soquete para o TRX4

Claro que essa mudança não chegou sem um impacto importante: o fim do suporte ao soquete TR4. Para tornar essa melhoria geral possível, foi preciso utilizar um novo soquete - o TRX4. Enquanto nas plataformas de entrada faz sentido estender sua longevidade, como acontece no AM4 e sua contagem de 3 séries Ryzen suportadas, também faz sentido fazer trocas com maior frequência na plataforma entusiasta para introduzir novas tecnologias com mais celeridade.

Na estrutura das memórias, temos outra das principais mudanças. Enquanto a empresa distribuía as memórias e os canais de comunicação com a RAM nas gerações anteriores, só "unindo" mais chips segundo a estrutura utilizada nos processadores Ryzen mainstream, agora o die com os núcleos possue apenas os núcleos em si. A forma de distribuição antecessora criou uma série de problemas, sendo o mais crítico as latências bastante ruins de comunicação com as memórias RAM, já que muitos núcleos nem sequer tinham uma via de comunicação direta. Eles precisavam passar pelo Infinity Fabric antes de chegar ao die que realmente possuía acesso direto.

Isso ficava evidente em alguns cenários mais dependentes de agilidade na comunicação com as memórias, e as mitigações até existiam. Porém, elas envolviam reiniciar o sistema e mudar a distribuição das comunicações, algo que melhorava em alguns cenários, mas piorava para outros.

A reestruturação das memórias é um elemento importante para a evolução de performance em pontos fracos dos modelos anteriores

Felizmente, a AMD não manteve essa estrutura e trouxe uma solução já na série 3000 que não apresenta esses comprometimentos. Os chiplets foram reestruturados e o novo die agrupa estruturas de memórias em outra estrutura para dar um acesso mais equilibrado e eficiente a qualquer um dos núcleos, ou seja, não privilegiando aqueles mais próximos e com comunicação direta em detrimento dos outros.


Fotos

Abaixo, algumas fotos do CPU, que tem o mesmo formato das gerações anteriores apesar da incompatibilidade entre placas-mãe X399 e TRX40. O acabamento também é igual, apesar da gigante diferença de preço entre eles.

- Continua após a publicidade -

Para os testes utilizamos alguns dos componentes que farão parte do PC dos Sonhos 2020, como a placa-mãe MSI Creator TRX40 e o kit de memórias Team Group XCalibur 64GB (8x8GB) de 3600MHz (mas usando frequência de 3200MHz na review).

Fisicamente, os CPUs Threadripper 3000 são iguais aos 2000 e 1000, mas não tem compatibilidade com as mesmas placas-mãe


Sistema utilizado


Abaixo, detalhes sobre o sistema utilizado para os testes.

Máquinas utilizadas nos testes:
Todos os sistemas usaram componentes com as mesmas características técnicas, com exceção da placa-mãe/processador (isso varia de acordo com a plataforma). Veja a configuração:

- Placa-mãe para o CPU analisado: MSI CREATOR TRX40 [site oficial]
- Placa de vídeo: GeForce RTX 2080 Ti [análise]
- Memórias: 32GB TeamGroup XCalibut @ 3200MHz (4x8GB) [site oficial]
- SSD: Kingston Savage 240GB Sata 6Gb/s [análise]
- HD: Seagate Barracuda 2TB 7200RPM Sata 6Gb/s [site oficial]
- Cooler: Noctua NH-U12S TR4 [site oficial]
- Fonte de energia (PSU): Thermaltake Toughpower 850W GOLD [site oficial]

Sistema Operacional e Drivers:
- Windows 10 "1909" 64 Bits com Updates
- GeForce 445.xx

Aplicativos/Games:
- 7-Zip [site oficial]
- Adobe Encoder [site oficial]
- Blender [site oficial]
- CineBench R20 [site oficial]
- x264 Full HD Benchmark [download]
- HWBot x265 Benchmark [site oficial]
- V-Ray [site oficial]
- wPrime 1.55 [site oficial]
- WinRAR 5.x [site oficial]

- 3DMark (DX11)
- Assassin's Creed Odyssey (DX11)
- Battlefield V (DX12)
- Grand Theft Auto V (DX11)
- Red Dead Redemption 2 (Vulkan)
- Shadow of Tomb Raider (DX12)
- The Division 2 (DX12)

CPU-Z/AIDA64
Através do CPU-Z e AIDA64, vemos algumas informações técnicas do processador, como modelo, clocks, número de núcleos e threads etc.

- Continua após a publicidade -

Game Mode
O modo de jogo "desativa" temporariamente alguns dos núcleos e threads, já que teoricamente nessa situação o comportamento será melhor visto que vários games não utilizam esse alto número de núcleos e threads. Porém na prático isso pode nãos er o melhor cenário, inclusive com o avanço natural na programação dos games visando usar melhor processadores de múltiplos núcleos.

DOWNLOAD - AMD Ryzen Master

O software utilizado para esse processo é o Ryzen Master da própria AMD, apesar de ser possível também fazer via BIOS da placa-mãe, nesse caso menos amigável.


Overclock

O cenário ideal para esse tipo de processador é trabalhar em conjunto com um liquid cooler, especialmente se a ideia é fazer overclock, mas como sempre utilizamos os modelos da Noctua para ter um cenário mais próximo de um comparativo entre diferentes processadores, seguimos com ele nesse teste.

E ai vem um problema! Uma coisa é overclockar um CPU de 4 núcleos, outra coisa é quando ele tem 64 núcleos, já que tudo é "MAIS" nessa situação, núcleos, energia, potencia e calor, sendo esse o maior problema que enfrentamos. Foi possível subir o clock para 4GHz com tensão em modo automático pela mainboard MSI CREATOR TRX40, mas apenas no teste do Blender o sistema travava quando o CPU alcançava 110ª graus, aparentemente sendo esse o único problema, já que outros testes e até mesmo o wPrime conseguiam finalizar.

Um bom Liquid Cooler é obrigatório para um cenário ideal com essa CPU

Como procuramos um cenário de overclock que passa em todos os testes, baixamos um pouco até o cooler aguentar, e isso aconteceu em 3.9GHz em todos os 64 núcleos. Sim, é abaixo dos 4.3GHz do clock em Boost, mas nessa situação são poucos núcleos que ficam em clocks mais altos. O cenário ideal é tentar alguns acima, ou mesmo mais núcleos próximos desse BOOST, mas como não achamos ter muito sentido na prática overclockar um processador desse nível, seguimos com um cenário que pode mostrar efeitos princialmente em aplicações, já que para games quando mais alto o clock melhor.

OBS.: Faça overclock por sua conta e risco. Evite deixar o CPU com tensões altas por muito tempo.


Consumo de energia

Fizemos os testes de consumo de energia do sistema em modo ocioso e rodando o 3DMark, aplicativo que exige bastante do sistema.

É importante destacar que o consumo de energia depende bastante da placa-mãe e da placa de vídeo, podendo variar consideravelmente de um sistema para outro com configurações semelhantes.

IDLE (Sistema ocioso)
Começamos pelo teste com o sistema em modo ocioso.

Rodando o 3DMark
Quando colocamos os sistemas rodando o 3DMark, conseguimos os consumos abaixo:


Temperatura

Começamos pelos testes de temperatura, com o sistema em modo ocioso e rodando o wPrime, aplicativo que "estressa" todos os núcleos dos processadores.

IDLE (Sistema ocioso)
Começamos pelo teste com o sistema em modo ocioso, com o Windows em espera sem estar executando nenhuma tarefa além das tradicionais do sistema.

Rodando o wPrime
Quando colocamos os sistema rodando o aplicativo wPrime, que faz todos os núcleos trabalhem em modo full, temos os consumos abaixo:

"A temperatura varia de acordo com o programa utilizado. Mesmo o wPrime estressando todos os núcleos sendo uma boa opção para ver o comportamento desse cenário, alguns programas podem exigir ainda mais do processador e, consequentemente, esquentar mais o mesmo. Como exemplo, citamos o Blender."


Testes sintéticos


Abaixo, temos uma série de testes de desempenho com o sistema, comparando o processador analisado com outros modelos do mercado e fazendo exatamente os mesmos testes.

Alguns testes podem tirar maior proveito de CPUs com clocks mais altos,independente da arquitetura e do número de núcleos/threads. Já outros podem tirar mais proveito de mais núcleos/threads

AIDA64 Latency
O software AIDA64 tem vários testes de performance. Separamos um que mostra um cenário diferente dos demais: a velocidade de latência das memórias, que quanto menor o resultado, melhor.

Blender
O aplicativo Blender é voltado aos profissionais de edição de filmes e para manipulação de objetos 3D, sendo um bom teste real de como o sistema se comporta nesse tipo de cenário.

V-Ray
O teste V-Ray Benchmark utilizado consiste no resultado de renderização do CPU. Quanto menor for, melhor é o desempenho.

CineBENCH R20
O CineBench está entre os mais famosos testes de benchmarks para processadores, baseado em um teste convertendo uma imagem. Fizemos teste em Single e Multi Core, já na versão R20 lançada em março de 2019:

x264 Full HD Benchmark
Em um teste de conversão de vídeo Full HD, temos os seguintes resultados:

HWBOT x265 Benchmark 2.0
Agora, outro teste de conversão de vídeo, mas com o codec h265, e testes em FullHD e 4K:

Adobe Premiere CC
Mais um teste de renderização de vídeo, em um cenário real renderizando com o Adobe Premiere CC 2018 sem uso de GPU:

7-Zip
O software de compactação 7-Zip se tornou um dos mais populares do mundo por se tratar de um aplicativo de código aberto. Ele possui também um benchmark interno que vem sendo muito utilizado para métrica de performance. Abaixo, o desempenho dos sistemas com ele:

WinRAR
Outro teste interessante para medir o comportamento do processador é o WinRAR, que consegue fazer bom uso de todos os cores.

wPrime
Rodando o wPrime, teste que estressa todos os cores do processador, temos os resultados abaixo:

3DMarkComeçamos nossos testes com foco em vídeo com o 3DMark.


Teste em games

Em nossos testes com games, selecionamos alguns dos principais títulos do mercado para mostrar como os processadores se comportam utilizando configurações semelhantes. Usamos sempre a mesma placa de vídeo, uma RTX 2080 Ti Founders Edition.

Assassin´s Creed Odyssey
O game da Ubisoft baseado na tecnologia DirectX 11 é uma referência de software que demanda alto desempenho tanto do chip gráfico quanto do processador. Isso é resultado do mapa amplo e complexo recriando a região da Grécia Antiga.


Battlefield V
O game desenvolvido pela DICE segue como uma referência de qualidade gráfica, operando tanto na API DirectX 12 quanto na11. O jogo também se tornou um marco nos games para PC ao ser o primeiro a introduzir a técnica de Ray Tracing híbrido da Nvidia através das placas RTX.


GTA V
Grand Theft Auto V está entre os maiores sucessos dos últimos anos, trazendo entre seus destaques boa qualidade gráfica. Ele é um dos games que mais faz uso do CPU, sendo um ótimo teste para ver o comportamento e diferença entre esses componentes. Confiram abaixo os resultados nesse game:


Red Dead Redemption 2
Novo game da RockStar, com belíssimos gráficos e uma boa referência para medir o comportamento de sistemas. Nosso teste considera o game rodando sobre a API Vulkam, que se comportou melhor tanto em placas AMD como Nvidia.


Shadow of Tomb Raider
O mais recente game da franquia da Lara Croft, Shadow of Tomb Raider traz ótimos gráficos, exigindo muito do sistema, mesmo de alta performance.


Tom Clancy's The Division 2
The Division 2 usa um motor gráfico próprio desenvolvido pela Ubisoft Massive, lidando com cenários complexos e grandes quantidades de partículas na tela.


Teste em vídeo


Conclusão

O AMD Ryzen Threadripper 3990X é praticamente um produto fora de seu mercado natural. Essa besta traz configurações surreais para um usuário doméstico, e até mesmo para um "power user" que vá tentar dar trabalho para todos os 128 threads com algum ciclo de trabalho pesadíssimo. Lembramos que para os processadores Threadripper 3000, é necessário uma placa-mãe com chipset TRX40, ou seja, eles são incompatíveis com os modelos de chipset X399, apesar do soquete ser idêntico.

Segue o desafio do escalonamento: mesmo com o dobro de núcleos, não temos esse mesmo salto em desempenho

Mas como já falamos em diversas outras análises de produtos com esse perfil, escalonar na computação não é um desafio fácil, e mesmo possuindo o dobro de núcleos e threads que o 3970X, são pouquíssimos os cenários que vemos saltos de performance equivalentes. Um dos poucos onde ganhamos esses 100% a mais foi no WinRAR, com todo o restante da bateria oscilando entre 10 a 40% de ganho.

Algo que chama a atenção é que a AMD conseguiu resolver os problemas de escalonamento dos Threaripper, e isso fica evidente em cenários como games. Nessas situações onde a grande quantidade de núcleos e threads, sua grande estrutura para tanto acaba mais atrapalhando do que ajudando, já que esses softwares dependem de latências e performance por thread. O 3990X, mesmo com sua estrutura colossal, não fica muito longe de outros processadores muito menores e mais ágeis para esses cenários de uso, e mesmo o modo gamming parece totalmente desnecessário, como já havíamos notado jogando com o 3970X.

A AMD resolveu a estrutura dos Threadrippers, que não perdem mais performance em cenários single-thread

Com isso fica bem claro que temos aqui um produto muito difícil de ser recomendado. Ele tem cenários muito específicos onde vai trazer ganhos de performance, e sua quantidade de núcleos absurda pode fazer sentido em situações como virtualização ou HPC, mas é preciso ter certeza que seu fluxo de trabalho vai se beneficiar dessa estrutura monumental.

Isso porque o salto de preço é equivalente ao salto em especificações. O Ryzen Threadripper 3970X e seus já impressionantes 32 núcleos custa o salgadíssimo preço de pouco mais de R$ 11 mil, com o 3990X estamos falando de nada menos de 27 mil reais de investimento. É algo que está em um segmento teoricamente "doméstico", mas mesmo para um consumidor extremamente exigente pode ser uma "bazuka para disparar em mosquitos".

É preciso se certificar que seu ciclo de trabalho vai tirar benefícios das características desse CPU, já que há um grande salto em preço

Se você olhar do ponto de vista de um consumidor doméstico, ele é um produto deslocado e incrivelmente caro, porém se você olha do ponto de vista da super-computação, as coisas mudam bastante. Essas configurações são totalmente inviáveis de serem adquiridas em um processador Intel, com custos que passam dos 100 mil reais, fazendo o 3990X parecer uma verdadeira pechincha.

Mas nem tudo é só vantagens, já que a AMD também precisa criar diferenciais com sua linha para servidores, a Epyc. O 3990X possui algumas limitações para alguém buscando ciclos de trabalho de servidores ou HPC, como os quatro canais de comunicação das memórias versus os 8 da linha Epyc, além dos 64 canais PCIe versus os 128 da linha para servidores da AMD. Não é que essa configuração do 3990X. No exterior, a diferença entre o modelo Epyc e o Threadripper é de 500 dólares, algo que faz sentido pagar se precisa dessa robustez adicional da plataforma.

O Ryzen Threadripper 3990X redefine o mercado oferecendo um processador de 64 núcleos por um preço nunca antes visto

O Ryzen Threadripper 3990X mantém a vocação dessa linha de CPUs de redefinir o nível de performance e as configurações no mercado. Mesmo com seu custo extremamente alto, ele traz um processador de 64 núcleos e 128 Threads para um patamar de preço nunca visto antes, e vai fazer toda a diferença para consumidores que possuem ciclos de trabalho ou demandas que necessitam dessa tipo de configuração "insana", e não vão esbarrar com as limitações do quad-channel ou das 64 linhas PCIe, que forçam um upgrade para um Epyc.

PRÓS
Contagem de núcleos e threads sem precedentes nessa faixa de preço
Performance mais consistente e evolução em cenários que a geração 1000 e 2000 se saíam mal
Altíssima performance em aplicações específicas
Recordes de performance em diversos cenários
CONTRAS
Altíssimo custo
Limitação em canais de RAM e PCIe comparado a um Epyc
Aumento no aquecimento por conta dos clocks maiores
Modularidade encontra limitações (dobro de núcleos não passam nem perto de entregar 100% de incremento no desempenho)
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Adrenaline é responsável por análises e artigos de processadores, placas de vídeo, placas-mãe, ssds, memórias, coolers entre outros componentes.

  • Redator: Diego Kerber

    Diego Kerber

    Formado em Jornalismo pela Universidade Federal de Santa Catarina (UFSC), Diego Kerber é aficionado por tecnologia desde os oito anos, quando ganhou seu primeiro computador, um 486 DX2. Fã de jogos, especialmente os de estratégia, Diego atua no Adrenaline desde 2010 desenvolvendo artigos e vídeo para o site e canal do YouTube

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.