ANÁLISE: Threadripper 3970X - mais um monstro de 32 núcleos e 64 threads da AMD

Processador traz importantes melhorias sobre a geração anterior e ainda não é o topo de linha
Por Fabio Feyh, Diego Kerber 04/02/2020 20:00 | atualizado 09/02/2020 10:11 comentários Reportar erro

O AMD Ryzen Threadripper 3970X é um processador de altíssimo desempenho.  Suas especificações são voltadas para quem busca performance extrema em aplicações com alta capacidade de paralelismo, tirando proveito das características impressionantes desse modelo como os 32 núcleos e 64 threads.

As grandes novidades da série 3000 são são os incrementos em especificações, com destaque para a contagem de núcleos. O Ryzen Threadripper 3970X já iguala a contagem de núcleos do mais completo Threadripper da série 2000, o 2990WX, mas ainda não é "o monstrão". Estamos esperando um modelo ainda mais parrudo, o 3990X, com impressionantes 64 núcleos e 128 threads

Nos EUA, o Threadripper 3970X foi lançado por US$1.999. Já por aqui, está custando R$10.999. O TR 3990X chegará custando US$3.999.

Site oficial do AMD Ryzen Threadripper 3970X
Link de compra na Pichau

Mas, não é só no número de núcleos/threads que trazem novidades na geração TR 3000. Os produtos herdam a microarquitetura Zen2 e suas melhorias, como a adição do cache L3 disponível (128MB versus os 64MB do 2990WX), clocks base de operação mais altos e também a nova litografia de 7nm. Outros dois tópicos críticos são as memórias, que buscam contornar aquelas complexidades das gerações anteriores quando o assunto é gerenciamento de acesso às memórias - a necessidade até de desabilitar núcleos ou mudar distribuição de acesso da RAM para buscar mais performance - , e um suporte mais completo ao AVX2. E, por fim, outro desafio foi melhorar a performance single-thread, ponto em que a Intel ainda possuía a vantagem e trazia benefícios para os modelos Core em determinados ciclos de trabalho.

Comparativo

AMD Ryzen Threadripper 3990XAMD Ryzen Threadripper 3970XAMD Ryzen Threadripper 2990WXAMD Ryzen Threadripper 1950X
Dados não oficiais?SimSimNãoNão

Preços

Preço no lançamentoU$ 3.990,00 US 1.999,00 U$ 1.799,00 U$ 999,00
Preço atualizadoU$ 3.990,00 US 1.999,00 R$ 9.650,00 U$ 999,00

Especificações

CodinomeZen 2 Zen 2 Zen+ Zen
SocketsTRX4 sTRX4 sTR4 sTR4
Fabricação em7nm 7nm 12nm 14nm
Instruções64-bit 64-bit 64-bit 64-bit
Núcleos64 32 32 16
Threads128 64 64 32
Clock2900 3700 3000 3400
Clock (Turbo)4300 4500 4200 4000
DesbloqueadoSim Sim Sim Sim
Canais de memóriaquad-channel quad-channel quad-channel quad-channel
MemóriasDDR4 DDR4 DDR4 DDR4
Cache L3256 128 64 32
PCI Express4.0 4.0 3.0 3.0
Canais PCI Express64 64 64 64
TDP280 280 250 180

Vídeo Integrado

GPUSEM VÍDEO INTEGRADO SEM VÍDEO INTEGRADO SEM VíDEO INTEGRADO SEM V͍DEO INTEGRADO

Características Gerais

Acompanha cooler?Não Não Não Não


O Threadripper 3000

A nova geração de processadores Threadripper traz importantes reestruturações. A nova família Zen2 oferece suporte ao PCIe 4.0, assim como acontece nos modelos mainstream Ryzen. Além dos slots com mais largura de banda e comunicação mais eficiente, a AMD evoluiu a comunicação do CPU com o chipset, passando do PCIe 3.0 x4 usado na geração anterior para o PCIe 4.0 x8. 

Os Threadrippers 3000 trazem novas tecnologias e trocam o soquete para o TRX4

Claro que essa mudança não chegou sem um impacto importante: o fim do suporte ao soquete TR4. Para tornar essa melhoria geral possível, foi preciso utilizar um novo soquete - o TRX4. Enquanto nas plataformas de entrada faz sentido estender sua longevidade, como acontece no AM4 e sua contagem de 3 séries Ryzen suportadas, também faz sentido fazer trocas com maior frequência na plataforma entusiasta para introduzir novas tecnologias com mais celeridade.

Na estrutura das memórias, temos outra das principais mudanças. Enquanto a empresa distribuia as memórias e os canais de comunicação com a RAM nas gerações anteriores, só "unindo" mais chips segundo a estrutura utilizada nos processadores Ryzen mainstream, agora o die com os núcleos possue apenas os núcleos em si. A forma de distribuição antecessora criou uma série de problemas, sendo o mais crítico as latências bastante ruins de comunicação com as memórias RAM, já que muitos núcleos nem sequer tinham uma via de comunicação direta. Eles precisavam passar pelo Infinity Fabric antes de chegar ao die que realmente possuía acesso direto.

Isso ficava evidente em alguns cenários mais dependentes de agilidade na comunicação com as memórias, e as mitigações até existiam. Porém, elas envolviam reiniciar o sistema e mudar a distribuição das comunicações, algo que melhorava em alguns cenários, mas piorava para outros.

A reestruturação das memórias é um elemento importante para a evolução de performance em pontos fracos dos modelos anteriores

Felizmente, a AMD não manteve essa estrutura e trouxe uma solução já na série 3000 que não apresenta esses comprometimentos. Os chiplets foram reestruturados e o novo die agrupa estruturas de memórias em outra estrutura para dar um acesso mais equilibrado e eficiente a qualquer um dos núcleos, ou seja, não privilegiando aqueles mais próximos e com comunicação direta em detrimento dos outros.


Fotos

Abaixo, algumas fotos do CPU, que tem o mesmo formato das gerações anteriores. Porém, não tem compatibilidade com as mesmas placas-mãe, sendo necessário uma mainboard com chipset TRX40 para modelos Threadripper 3000.

Fisicamente, os CPUs Threadripper 3000 são iguais aos 2000 e 1000, mas não tem compatibilidade com as mesmas placas-mãe

Os processadores Threadripper 3000 vem dentro dessa caixa, diferente das duas anteriores. Em nosso caso, recebemos apenas em versão OEM, ou seja, não acompanha a caixa como das outras vezes.


Sistema utilizado


Abaixo, detalhes sobre o sistema utilizado para os testes.

Máquinas utilizadas nos testes:
Todos os sistemas usaram componentes com as mesmas características técnicas, com exceção da placa-mãe/processador (isso varia de acordo com a plataforma). Veja a configuração:

- Placa-mãe para o CPU analisado: Gigabyte TRX40 AORUS MASTER [site oficial]
- Placa de vídeo: NVIDIA GeForce RTX 2080 Ti FE [análise]
- Memórias: 32GB G.Skill Trident @ 3200MHz (4x8GB) [site oficial]
- SSD: Kingston Savage 240GB Sata 6Gb/s [análise]
- HD: Seagate Barracuda 2TB 7200RPM Sata 6Gb/s [site oficial]
- Cooler: Noctua NH-U12S TR4 [site oficial]
- Fonte de energia (PSU): Thermaltake Toughpower 850W GOLD [site oficial]

Sistema Operacional e Drivers:
- Windows 10 "1909" 64 Bits com Updates
- GeForce 441.xx

Aplicativos/Games:
- 7-Zip [site oficial]
- Adobe Premiere [site oficial]
- Blender [site oficial]
- CineBench R20 [site oficial]
- x264 Full HD Benchmark [download]
- HWBot x265 Benchmark [site oficial]
- V-Ray [site oficial]
- wPrime 1.55 [site oficial]
- WinRAR 5.x [site oficial]

- 3DMark (DX11)
- Assassin's Creed Odyssey (DX11)
- Battlefield V (DX12)
- Grand Theft Auto V (DX11)
- Red Dead Redemption 2 (Vulkan)
- Shadow of Tomb Raider (DX12)
- The Division 2 (DX12)

CPU-Z/AIDA64
Através do CPU-Z e AIDA64, vemos algumas informações técnicas do processador, como modelo, clocks, número de núcleos e threads etc.


Overclock

Como destacamos anteriormente, o Threadripper 3970X já é um modelo overclockado de fábrica. E não é com qualquer overclock, mas um com todos os núcleos trabalhando em uma frequência bastante alta - tanto que o cenário ideal é utilizar um liquid cooler, assim como acontece com o Ryzen 9 3950X. No entanto, sempre tentamos colocar os CPUs um pouco acima, e, nesse caso, também fizemos isso, subindo para 5.2GHz. Isso é muito pouco baseado em nossos overclocks normais para CPUs Intel e está muito mais parecido com os overclocks com CPUs AMD, que sempre trabalham em seu limite.

Um bom Liquid Cooler é obrigatório para um cenário ideal com essa CPU

Além das considerações acima, sequer tentamos fazer o processo com o cooler da Noctua, visto que o CPU já trabalha com temperaturas altas. Como vai ser possível notar nos testes de temperatura, nem tem como pensar diferente - um liquid cooler é obrigatório para trabalhar junto com esse CPU.

Faça overclock por sua conta e risco. Evite deixar o CPU com tensões altas por muito tempo


Consumo de energia

Fizemos os testes de consumo de energia do sistema em modo ocioso e rodando o 3DMark, aplicativo que exige bastante do sistema.

É importante destacar que o consumo de energia depende bastante da placa-mãe e da placa de vídeo, podendo variar consideravelmente de um sistema para outro com configurações semelhantes.

IDLE (Sistema ocioso)
Começamos pelo teste com o sistema em modo ocioso.

Rodando o 3DMark
Quando colocamos os sistemas rodando o 3DMark, conseguimos os consumos abaixo:


Temperatura


Começamos pelos testes de temperatura, com o sistema em modo ocioso e rodando o wPrime, aplicativo que "estressa" todos os núcleos dos processadores.

IDLE (Sistema ocioso)
Começamos pelo teste com o sistema em modo ocioso, com o Windows em espera sem estar executando nenhuma tarefa além das tradicionais do sistema.

Rodando o wPrime
Quando colocamos os sistema rodando o aplicativo wPrime, que faz todos os núcleos trabalhem em modo full, temos os consumos abaixo:

"A temperatura varia de acordo com o programa utilizado. Mesmo o wPrime estressando todos os núcleos sendo uma boa opção para ver o comportamento desse cenário, alguns programas podem exigir ainda mais do processador e, consequentemente, esquentar mais o mesmo. Como exemplo, citamos o Blender."


Testes sintéticos


Abaixo, temos uma série de testes de desempenho com o sistema, comparando o processador analisado com outros modelos do mercado e fazendo exatamente os mesmos testes.

Alguns testes podem tirar maior proveito de CPUs com clocks mais altos,independente da arquitetura e do número de núcleos/threads. Já outros podem tirar mais proveito de mais núcleos/threads

AIDA64 Latency
O software AIDA64 tem vários testes de performance. Separamos um que mostra um cenário diferente dos demais: a velocidade de latência das memórias, que quanto menor o resultado, melhor.

Blender
O aplicativo Blender é voltado aos profissionais de edição de filmes e para manipulação de objetos 3D, sendo um bom teste real de como o sistema se comporta nesse tipo de cenário.

V-Ray
O teste V-Ray Benchmark utilizado consiste no resultado de renderização do CPU. Quanto menor for, melhor é o desempenho.

CineBENCH R20
O CineBench está entre os mais famosos testes de benchmarks para processadores, baseado em um teste convertendo uma imagem. Fizemos teste em Single e Multi Core, já na versão R20 lançada em março de 2019:

x264 Full HD Benchmark
Em um teste de conversão de vídeo Full HD, temos os seguintes resultados:

HWBOT x265 Benchmark 2.0
Agora, outro teste de conversão de vídeo, mas com o codec h265, e testes em FullHD e 4K:

Adobe Premiere CC
Mais um teste de renderização de vídeo, em um cenário real renderizando com o Adobe Premiere CC 2018 sem uso de GPU:

7-Zip
O software de compactação 7-Zip se tornou um dos mais populares do mundo por se tratar de um aplicativo de código aberto. Ele possui também um benchmark interno que vem sendo muito utilizado para métrica de performance. Abaixo, o desempenho dos sistemas com ele:

WinRAR
Outro teste interessante para medir o comportamento do processador é o WinRAR, que consegue fazer bom uso de todos os cores.

wPrime
Rodando o wPrime, teste que estressa todos os cores do processador, temos os resultados abaixo:

3DMark
Começamos nossos testes com foco em vídeo com o 3DMark, mas por enquanto com a placa de vídeo dedicada.


Teste em games


Em nossos testes com games, selecionamos alguns dos principais títulos do mercado para mostrar como os processadores se comportam utilizando configurações semelhantes. Usamos sempre a mesma placa de vídeo, uma RTX 2080 Ti Founders Edition, e 16GB de RAM através de 2 módulos de 8GB com frequência de 3200MHz.

Assassin´s Creed Odyssey
O game da Ubisoft baseado na tecnologia DirectX 11 é uma referência de software que demanda alto desempenho tanto do chip gráfico quanto do processador. Isso é resultado do mapa amplo e complexo recriando a região da Grécia Antiga.


Battlefield V
O game desenvolvido pela DICE segue como uma referência de qualidade gráfica, operando tanto na API DirectX 12 quanto na11. O jogo também se tornou um marco nos games para PC ao ser o primeiro a introduzir a técnica de Ray Tracing híbrido da Nvidia através das placas RTX.


GTA V
Grand Theft Auto V está entre os maiores sucessos dos últimos anos, trazendo entre seus destaques boa qualidade gráfica. Ele é um dos games que mais faz uso do CPU, sendo um ótimo teste para ver o comportamento e diferença entre esses componentes. Confiram abaixo os resultados nesse game:


Red Dead Redemption 2
Novo game da RockStar, com belíssimos gráficos e uma boa referência para medir o comportamento de sistemas. Nosso teste considera o game rodando sobre a API Vulkam, que se comportou melhor tanto em placas AMD como Nvidia.


Shadow of Tomb Raider
O mais recente game da franquia da Lara Croft, Shadow of Tomb Raider traz ótimos gráficos, exigindo muito do sistema, mesmo de alta performance.


Tom Clancy's The Division 2
The Division 2 usa um motor gráfico próprio desenvolvido pela Ubisoft Massive, lidando com cenários complexos e grandes quantidades de partículas na tela.


Teste em vídeo


Conclusão

A AMD modificou toda a organização da indústria com os modelos Threadrippers, subindo em muito a contagem dos processadores para uso profissional fora do mundo Xeon e Epyc, e a terceira geração consolida essa transformação. O Threadripper 3970X tem avanços notáveis nos cenários em que a arquitetura Threadripper falhava - algo notável em games, que nem é o foco desse produto. E é ainda mais notável e importante ver avanços em testes como Premiere ou encoder de H.264.

Análise: AMD Ryzen Threadripper 2990WX

Ele apresenta ganhos mesmo quando comparado ao 2990WX, um processador com a mesma contagem de núcleos e threads, mostrando que a evolução é sim relacionada às novas tecnologias e à reestruturação da microarquitetura dos Threadrippers 3000. Alguns exemplos disso são o aumento das frequências e a reestruturação da comunicação com as memórias.

A linha Threadripper 3000 corrige pontos críticos em que os antecessores falhavam

Claro, nem tudo é perfeito e há um retrocesso: o aumento do preço. O 3970X chega por US$ 1.999, subindo dos US$ 1.799 do seu antecessor 2990WX com 32 núcleos e 64 threads. A troca, porém, mais que se justifica pelas evoluções em diversos cenários que a arquitetura Threaripper anterior se mostrava mais frágil, como a velocidade da comunicação das memórias. 

Para implementar as modificações tão importantes da nova estrutura dos Threadrippers, infelizmente foi preciso um novo chipset e soquete, além de novas tecnologias. É uma pena não ver replicada a política de longo tempo de suporte como nos AM4, mas ao mesmo tempo estamos falando de uma plataforma entusiasta, onde é preferível sempre buscar as melhores tecnologias do que ficar dando suporte extendido em detrimento da introdução de inovações.

AMD domina esse segmento de preço, entregando contagens de núcleo e performances sem competição

Mesmo se mostrando bem mais consistente em múltiplos cenários, esse não é um processador que se pode indicar para todos os consumidores. Seu custo extremamente elevado, passando dos R$ 15 mil nos poucos lugares em que é encontrado no Brasil, mostra que você precisa ter uma noção clara do ganho de produtividade que ele irá trazer para compensar esse investimento. 

Como podem ter notado, nossos gráficos foram dominados pela AMD. Isso acontece porque mesmo os modelos entusiastas da Intel, como o 9980XE, param em especificações bem distantes dos 32 núcleos desse modelo. Isso faz com que processadores como o Ryzen Threadripper 3970X dominem esse segmento e sejam nossa recomendação para consumidores com essa necessidade de altíssimo poder de processamento e paralelismo - e que vão fazer valer o investimento em um processador tão ca,ro encurtando longas horas de render, por exemplo. E olha que ainda tem o 3990X para ser lançado...

O AMD Threaripper 3970X traz importantes evoluções e é um processador indicado para o consumidor que vai fazer valer o alto investimento, tirando proveito do altíssimo poder de processamento desse modelo em aplicações profissionais e de alta demanda por processamento

PRÓS
Altíssima contagem de núcleos e threads
Performance mais consistente e evolução em cenários que a geração 1000 e 2000 se saíam mal
Altíssima performance em aplicações específicas
Recordes de performance em diversos cenários
Grande quantidade de linhas PCIe
CONTRAS
Altíssimo custo
Aumento no aquecimento por conta dos clocks maiores
Modularidade encontra limitações (dobro de núcleos não passam nem perto de entregar 100% de incremento no desempenho)
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Adrenaline é responsável por análises e artigos de processadores, placas de vídeo, placas-mãe, ssds, memórias, coolers entre outros componentes.

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.