Como escolher um processador AMD da linha FX

Então você precisa de um novo processador e se decidiu por um AMD, por causa da relação custo-benefício que ele oferece. Mesmo assim, a linha FX sozinha oferece uma grande variedade de opções, e pode ser confuso fazer a escolha sem grande domínio sobre o assunto. Este artigo existe para ajudÁ-lo a encontrar o modelo que melhor se ajuste às suas necessidades, discutindo coisas técnicas como frequência de operação (também conhecida como velocidade de clock), número de núcleos e memória cache, e como eles se encaixam nos aspectos prÁticos do cotidiano.



Linha FX
A linha conta com 8 modelos diferentes atualmente (com pelo menos mais 10 previstos para este ano), que podem ser divididos entre aqueles com 4, 6 e 8 núcleos (cores). Os FX foram os primeiros processadores domésticos a oferecer oito núcleos para o usuÁrio, chegando a até dois bilhões de transistores.


A nomenclatura de cada um, aliÁs, remete exatamente a esse número de núcleos, jÁ que o primeiro dígito remete a isso. Assim, um FX-8100 tem oito núcleos e um FX-4100 tem quatro, por exemplo. Os três dígitos seguintes crescem quando maior a frequência de operação. Ou seja, um FX-6200 apresenta frequência maior que um FX-6100.

Todos são membros da família de processadores Bulldozer (com excessão de quatro ainda não lançados, baseados nos Piledriver), a arquitetura mais recente da AMD, exigindo placas-mãe com soquetes AM3+ contam com uma estrutura baseada em pares de núcleos. Os 4000 contam com duas duplas, os 6000 com três e os 8000 com quatro. A quantidade de memória cache em segundo nível (L2) acompanha o número de cores com 2 MB por dupla, com todos os modelos apresentando o mesmo L3, 8 MB.

{break::Novidades da Linha FX}Turbo Core 2.0
Assim como o Llano (linha Vision A8/A6/A4), a nova geração Bulldozer trouxe um significativo aumento nos clocks e avanço no "power gating", recurso que desativa individualmente os núcleos de processamento subutilizados, abrindo espaço para que os cores ativos possam trabalhar com frequências de operação maiores. Este ajustamento dinâmico na velocidade de operação dos núcleos é chamado pela AMD de Turbo Core.

- Continua após a publicidade -

A AMD aprimorou o Turbo Core na geração Bulldozer FX, ao adicionar um terceiro elemento e estado (Max Turbo) à tecnologia. Desta forma, um processador, que por exemplo, tenha frequência base (nominal) de 3.6Ghz, poderÁ além ter todos os seus núcleos overclockados automaticamente para 3.9Ghz, ter apenas alguns de seus cores turbinados para uma frequência ainda maior, em 4.2Ghz. Trata-se de um grande avanço, principalmente porque muitas aplicações atualmente não utilizam mais do que 2 ou 3 núcleos.

DDR3-1866
Apesar do Bulldozer manter controladora dupla de memória (dual channel), a nova geração de CPUs da AMD trouxe como grande avanço, o suporte oficial aos módulos DDR3 de 1866Mhz, aumentando assim a largura de banda de memória, consequentemente melhorando certas aplicações que fazem intenso uso do trÁfego de dados do sistema.

{break::A Arquitetura modular do Bulldozer}Um dos grandes trunfos por trÁs da geração Bulldozer estÁ em sua nova arquitetura modular baseada no compartilhamento de recursos dentro do die da CPU. Na realidade, eis a primeira vez em 8 anos que a AMD projeta uma arquitetura genuinamente inovadora para os seus processadores.

A palavra chave da arquitetura Bulldozer estÁ no aproveitamento dos processos. Enquanto a Intel optou pelo uso da tecnologia de virtualização Hyper-Threading, que simula núcleos lógicos aos físicos – aumentando assim a performance em tarefas multi-threads, a AMD foi em outra direção, focando no aumento físico do número de instruções por clock (IPC) através de uma maior unidade interna de processamento. Em outras palavras, os engenheiros da companhia optaram por integrar dois núcleos para formar um bloco de construção fundamental, a famosa estrutura "modular do Bulldozer".


Conforme pode ser visto acima, tal módulo compartilha porções de um núcleo de processamento tradicional - incluindo a instrução fetch, unidades de ponto flutuante e decode, bem como o cache L2 - entre os dois núcleos de processamento. A AMD optou por compartilhar apenas os recursos que nem sempre são totalmente utilizados por um único núcleo. Desta forma, ao não duplicar tais recursos, a companhia ganhou em vÁrias frentes, como é o caso de otimização dos recursos e de seu gerenciamento, bem como na otimização da Área do chip.

A parte principal de cada módulo Bulldozer é composta de canais de predição (prediction pipeline) - que preveem quais serão as próximas instruções a serem utilizadas. O canal de busca (fetch pipeline) separado em seguida, preenche as duas filas de instruções - uma para cada thread - com essas instruções. Os decodificadores convertem instruções x86 complexas para as instruções internas mais simples da CPU. Vale ressaltar que os processadores da geração Bulldozer tem quatro destes.

Cada módulo tem um trio de catalogadores, um para cada núcleo inteiro e um para a FPU (Unidade de Ponto Flutuante). Cada núcleo inteiro tem ainda duas unidades de execução e duas unidades de geração de endereço, além de quatro ALUs. 


Embora cada módulo tenha apenas uma única unidade de ponto flutuante, a FPU do Bulldozer é consideravelmente mais capaz que as FPUs dos processadores das gerações passadas. É possível observar no diagrama acima duas unidades de inteiros MMX e duas unidades FMAC (Fused multiply-accumulate) de 128 bits. Em um arranjo semelhante ao SMT (simultaneous multi-threading) - tecnologia HyperThreading implementada pela Intel - o FPU pode lidar com duas threads de hardware, um para cada núcleo no módulo.

- Continua após a publicidade -

O FPU do Bulldozer tem uma vantagem em outra Área, graças a presença duas unidades de FMAC de 128 bits. O termo FMAC é a abreviação para "fusão de multiplicação-acumulação", também conhecido como FMA, para designar "fusão de multiplicação-adição". Ou seja, trata-se de uma estrutura que em uma única operação, une multiplicação com adição, algo novo para os processadores x86. Assim, as operações de FMA alimentam o resultado da multiplicação diretamente no somador sem arredondamento, aumentando assim a precisão matemÁtica do resultado. É por esta razão que as GPUs da geração DirectX 11 passaram a adotar o recurso FMA como seu novo padrão.

A Unidade de Ponto Flutuante suporta quase todas as extensões do padrão x86, incluindo SSSE3, SSE 4.1, 4.2, e o novo recurso AVX (Extensões de Vetor Avançado) da Intel. O AVX permite maior capacidade de processamento de grÁficos, mídia e outros processamentos paralelos, além de cargas de trabalho intensivas de pontos flutuantes, duplicando a largura de vetores SIMD de 128 bits para 256 bits. Assim as unidades FMAC do Bulldozer trabalham juntas formando um único vetor de 256 bits por ciclo. 


SMT x Arquitetura modular
A implementação do SMT por parte da Intel duplicou os estados arquitetônicos (parte de uma CPU responsÁvel pela condição de um processo), mas não a execução como um todo da engine. Isto permitiu que seus processadores maximizassem os recursos de execução pelos silícios ativos que, de outra maneira, estariam ociosos, ou pela injeção de threads dentro do pipeline da ocorrência do processo.

Como resultado, a Intel utiliza o SMT para garantir que seu processador esteja sempre ocupado "triturando" os dados, uma vez que, cada vez mais, os sistemas estão aumentando sua "inteligência" no sentido de despachar threads para esta finalidade. 

O "problema" com esta implementação de SMT (um recurso de execução/ registros duplicados) é que uma janela de instrução rastreia o despacho, a execução e a retirada de ambos os threads, ou seja, eventualmente pode sobrecarregar o processador, causando eventuais gargalos/falhas. 


JÁ no Bulldozer, o recurso de virtualização recebeu uma janela de instrução dedicada a ambos os threads emitidos ao processador pelo sistema operacional. 

O diagrama acima ilustra isso perfeitamente: Uma interface comum (fetch / decode) pode receber e despachar dois threads a um par de catalogadores de inteiros independentes. 

Os catalogadores de inteiros estão associados com seu próprio conjunto de pipelines de execução. O consenso geral é que eles são eventualmente divididos entre operações de ALU e armazenamento,  mas que poderiam, na verdade, reduzir a performance de execuções single thread. 

Estes recursos de execução gravam os dados em seus próprios pedaços de memórias cache L1, enquanto o SMT atual habilita núcleos a gravarem os resultados de ambos os threads em um mesmo cache de dados L1.


Saiba a seguir como as variações entre frequências e quantidades de núcleos - e, por que não?, preço - influenciam na utilidade e objetivo de cada um dos processadores FX.

{break::Mais núcleos ou frequência mais alta?}Uma dúvida comum na hora de escolher um processador é definir o que é mais importante: o número de núcleos ou a frequência mÁxima em que opera a CPU. Para escolher, é preciso entender cada um.

A frequência é medida em Hertz (normalmente em gigahertz, ou GHz) e determina quantas vezes o processador consegue realizar o seu ciclo de operações por segundo. Ela é a velocidade do processador. Quanto maior a frequência, mais poder de executar trabalhos ele possui.

Ok, então é só pegar o com maior frequência? Não exatamente. À medida que a indústria das CPUs evoluiu, as empresas foram entregando processadores cada vez mais rÁpidos (com maior frequência) até chegar à casa dos 4 GHz. Ali a indústria encontrou um limite: subir muito mais que isto torna o sistema instÁvel e faz o processador superaquecer.

A solução para continuar evoluindo foi criar novos núcleos de processamento. A lógica é simples: se não posso subir mais que 4 GHz, faço dois núcleos operando em 3 GHz e ganho mais performance. Na prÁtica, porém, um dual-core (dois núcleos) de 3GHz não é melhor que um single-core (apenas um núcleo) de 6GHz, pois hÁ perdas no desempenho com os núcleos trabalhando em conjunto, mas em compensação ele é mais estÁvel e aquece muito menos.


Por isto o FX 8100, que tem um limite de frequência de 3.7GHz, é superior a um FX 6200 que, apesar de alcançar até 4.1GHz, possui seis núcleos contra os oito presentes no modelo 8100. Ou seja, ele possuiu mais núcleos dividindo o trabalho, podendo assim realizar mais operações ao mesmo tempo, apesar de trabalhar em uma frequência inferior.

{break::Conclusão}A relação entre frequência e número de núcleos pode ser comparada ao trabalho realizado por uma pessoa ou por um grupo. Quando se estÁ sozinho, um trabalho sai de forma mais Ágil, pois a pessoa é responsÁvel por todas as etapas do projeto e sabe muito bem a ordem em que tem, ou pode, realizÁ-las. No entando, ele tem um limite de coisas que pode fazer em determinado tempo. Quando um grupo de pessoas se dedica à mesma tarefa, consegue realizar mais coisas, mas às vezes tropeça na organização e na integração entre os diferentes corpos.


Uso casual
Para quem estÁ interessado em um processador com boa relação custo-benefício e que aguente grande parte das aplicações bÁsicas atuais, um modelo FX de quatro núcleos é mais do que suficiente. Entre os 4000, a diferença fica por conta da frequência e do preço. Depende apenas do quanto se estÁ disposto a pagar. Considerando que no Brasil a variação entre o modelo mais bÁsico (FX-4100) e o mais rÁpido (FX-4170) é de 100 reais, o investimento pode valer a pena.

Games
A qualidade de um game depende muito mais da placa-de-vídeo, e muitas vezes encontra problemas com uma quantidade muito alta de núcleos. A latência e problemas de comunicação entre os diversos cores aumenta as dificuldades de processamento. Com estes dois fatores em consideração, processadores de oito núcleos rodam todos os títulos da atual geração, mas não são necessÁrios. Os dois modelos com seis cores, o FX-6100 e o FX-6200, são ideais para rodar qualquer game existente, com a vantagem de serem mais baratos e oferecerem menos riscos de problemas no processamento com múltiplos núcleos.

Processamento paralelo
Após todas essas explicações, fica claro que os mais indicados para qualquer trabalho ou atividade que exija grande carga de processamento paralelo, como renderização de vídeos ou imagens, são os processadores com oito núcleos. São atividades que não pedem muito poder, mas necessitam de atenção em diversos pontos, e podem sobrecarregar sistemas com poucos núcleos.
Os 8000 também são a melhor opção para aqueles que querem construir o melhor sistema possível dentro da linha FX, e não tem problemas com o orçamento. Apesar dos processadores AMD possuírem ótima relação custo-benefício e um preço bem reduzido, no Brasil os FX ainda são oferecidos por valores um pouco elevados, talvez por se tratarem dos modelos top da empresa.

Placas-mãe
Futuramente iremos fazer um artigo sobre placas-mãe destinadas aos processadores AMD, mas vale destacar que a linha de processadores FX é baseada no socket AM3+, dessa forma é necessÁrio comprar uma placa-mãe com esse socket.

Assuntos
Tags
  • Redator: César Massaki Teshima Soto

    César Massaki Teshima Soto

    Graduando de Jornalismo pela Universidade Federal de Santa Catarina, ganhou um Mega Drive aos 5 anos, mas nunca conseguiu fazer final em Sonic 2. Navegava pelas salas de bate papo nos tempos da internet discada e até hoje procura o disquete perdido com seu jogo salvo do América-MG no Elifoot 98.

Quem estava pior no primeiro vídeo?

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.