ANÁLISE: AMD FX-8150

ANÁLISE: AMD FX-8150

A nova geração de processadores Bulldozer gerou uma grande expectativa no mercado como um todo, ao prometer recolocar a AMD em condições de igualdade para brigar com a Intel no segmento das CPUs de alta performance. Tido como a "grande esperança" da companhia, o fato é que ao ser lançado, a nova geração decepcionou (ao menos em parte) os fãs da companhia.

AliÁs, no início de dezembro, a própria AMD emitiu uma nota à imprensa, informando que abandonarÁ (até segunda ordem) o segmento de processadores de alto desempenho. Em contra partida, a companhia focarÁ em nichos mais estratégicos (e de grande volume), como é o caso dos dispositivos portÁteis. Esta iniciativa estÁ alinhada com a nova política de reestruturação implantada recentemente pela empresa, onde visa o aumento da eficiência operacional como forma de reforçar o posicionamento competitivo da empresa frente ao mercado.

Se por um lado a linha Bulldozer não conseguiu disputar em condições de igualdade com as versões mais poderosas da linha Core i7, por outro, as novas CPUs chegaram com preços extremamente agressivos em se tratando de um processador de 8 núcleos. AliÁs, trata-se da primeira CPU octo core para o mercado doméstico. Ao que parece, o objetivo da AMD é o de "popularizar" os processadores hexa-cores e ocoto-cores nos lares dos consumidores.

Eis aqui um fato interessante. De quantos núcleos precisamos atualmente? Ou melhor, um processador com mais núcleos necessariamente serÁ mais veloz que outro com menos? As respostas para as duas perguntas é a mesma: depende! Games normalmente se dão muito bem com CPUs com 3 e 4 núcleos. Entretanto, é necessÁrio que a CPU trabalhe em uma frequência de operação elevada, haja vista que hÁ jogos onde um processador com menos núcleos, mas com alto clock, funciona melhor do que em outro com mais núcleos, mas com frequência de operação menor. Em certas aplicações multimídias – como de edição de imagens e vídeos – a presença de uma grande quantidade de núcleos acelera (e muito) o desempenho final do processamento. Assim, a chave para o sucesso parece a harmonia entre alto clock e grande quantidade de núcleos.

Uma das vantagens do Bulldozer para a AMD estÁ na modularidade de sua arquitetura. Com isso, a companhia tem condições de construir processadores mais simples com 2, 4, 6 ou 8 núcleos, podendo, inclusive, fabricar soluções bem mais robustas com 10, 12, 14, 16 núcleos, ou até mais.

Além de contar com um processo de fabricação (litografia) mais refinada, a nova geração possui ainda como destaques uma expressiva quantidade de memória cache – chegando até a 16MB (L2+L3), além de diversas novas instruções (com o intuito de acelerar o desempenho), como é o caso do SSE, criptografia, e AVX para operações de ponto flutuante, bem como as inéditas FMA4 (para aplicações voltadas para a computação de alto desempenho – HPC) e XOP (para aplicações muntimídias e numéricas).

Finalmente a nova geração Bulldozer possui ainda melhorias na tecnologia de overclock automÁtico, o TurboCore, e suporte para memórias DDR3 mais velozes.

- Continua após a publicidade -

{break::A Arquitetura modular do Bulldozer}Um dos grandes trunfos por trÁs da geração Bulldozer estÁ em sua nova arquitetura modular baseada no compartilhamento de recursos dentro do die da CPU. Na realidade, eis a primeira vez em 8 anos que a AMD projeta uma arquitetura genuinamente inovadora para os seus processadores.

A palavra chave da arquitetura Bulldozer estÁ no aproveitamento dos processos. Enquanto a Intel optou pelo uso da tecnologia de virtualização Hyper-Threading, que simula núcleos lógicos aos físicos – aumentando assim a performance em tarefas multi-threads, a AMD foi em outra direção, focando no aumento físico do número de instruções por clock (IPC) através de uma maior unidade interna de processamento. Em outras palavras, os engenheiros da companhia optaram por integrar dois núcleos para formar um bloco de construção fundamental, a famosa estrutura "modular do Bulldozer".


Conforme pode ser visto acima, tal módulo compartilha porções de um núcleo de processamento tradicional - incluindo a instrução fetch, unidades de ponto flutuante e decode, bem como o cache L2 - entre os dois núcleos de processamento. A AMD optou por compartilhar apenas os recursos que nem sempre são totalmente utilizados por um único núcleo. Desta forma, ao não duplicar tais recursos, a companhia ganhou em vÁrias frentes, como é o caso de otimização dos recursos e de seu gerenciamento, bem como na otimização da Área do chip.

A parte principal de cada módulo Bulldozer é composta de canais de predição (prediction pipeline) - que preveem quais serão as próximas instruções a serem utilizadas. O canal de busca (fetch pipeline) separado em seguida, preenche as duas filas de instruções - uma para cada thread - com essas instruções. Os decodificadores convertem instruções x86 complexas para as instruções internas mais simples da CPU. Vale ressaltar que os processadores da geração Bulldozer tem quatro destes.

Cada módulo tem um trio de catalogadores, um para cada núcleo inteiro e um para a FPU (Unidade de Ponto Flutuante). Cada núcleo inteiro tem ainda duas unidades de execução e duas unidades de geração de endereço, além de quatro ALUs. 


Embora cada módulo tenha apenas uma única unidade de ponto flutuante, a FPU do Bulldozer é consideravelmente mais capaz que as FPUs dos processadores das gerações passadas. É possível observar no diagrama acima duas unidades de inteiros MMX e duas unidades FMAC (Fused multiply-accumulate) de 128 bits. Em um arranjo semelhante ao SMT (simultaneous multi-threading) - tecnologia HyperThreading implementada pela Intel - o FPU pode lidar com duas threads de hardware, um para cada núcleo no módulo.

O FPU do Bulldozer tem uma vantagem em outra Área, graças a presença duas unidades de FMAC de 128 bits. O termo FMAC é a abreviação para "fusão de multiplicação-acumulação", também conhecido como FMA, para designar "fusão de multiplicação-adição". Ou seja, trata-se de uma estrutura que em uma única operação, une multiplicação com adição, algo novo para os processadores x86. Assim, as operações de FMA alimentam o resultado da multiplicação diretamente no somador sem arredondamento, aumentando assim a precisão matemÁtica do resultado. É por esta razão que as GPUs da geração DirectX 11 passaram a adotar o recurso FMA como seu novo padrão.

A Unidade de Ponto Flutuante suporta quase todas as extensões do padrão x86, incluindo SSSE3, SSE 4.1, 4.2, e o novo recurso AVX (Extensões de Vetor Avançado) da Intel. O AVX permite maior capacidade de processamento de grÁficos, mídia e outros processamentos paralelos, além de cargas de trabalho intensivas de pontos flutuantes, duplicando a largura de vetores SIMD de 128 bits para 256 bits. Assim as unidades FMAC do Bulldozer trabalham juntas formando um único vetor de 256 bits por ciclo. 

- Continua após a publicidade -


SMT x Arquitetura modular
A implementação do SMT por parte da Intel duplicou os estados arquitetônicos (parte de uma CPU responsÁvel pela condição de um processo), mas não a execução como um todo da engine. Isto permitiu que seus processadores maximizassem os recursos de execução pelos silícios ativos que, de outra maneira, estariam ociosos, ou pela injeção de threads dentro do pipeline da ocorrência do processo.

Como resultado, a Intel utiliza o SMT para garantir que seu processador esteja sempre ocupado "triturando" os dados, uma vez que, cada vez mais, os sistemas estão aumentando sua "inteligência" no sentido de despachar threads para esta finalidade. 

O "problema" com esta implementação de SMT (um recurso de execução/ registros duplicados) é que uma janela de instrução rastreia o despacho, a execução e a retirada de ambos os threads, ou seja, eventualmente pode sobrecarregar o processador, causando eventuais gargalos/falhas. 


JÁ no Bulldozer, o recurso de virtualização recebeu uma janela de instrução dedicada a ambos os threads emitidos ao processador pelo sistema operacional. 

O diagrama acima ilustra isso perfeitamente: Uma interface comum (fetch / decode) pode receber e despachar dois threads a um par de catalogadores de inteiros independentes. 

Os catalogadores de inteiros estão associados com seu próprio conjunto de pipelines de execução. O consenso geral é que eles são eventualmente divididos entre operações de ALU e armazenamento,  mas que poderiam, na verdade, reduzir a performance de execuções single thread. 

Estes recursos de execução gravam os dados em seus próprios pedaços de memórias cache L1, enquanto o SMT atual habilita núcleos a gravarem os resultados de ambos os threads em um mesmo cache de dados L1.

- Continua após a publicidade -

{break::A linha Bulldozer FX}

Embora conte com um total de 9 produtos em seu portfólio, a AMD lançou inicialmente apenas 4 processadores da linha Bulldozer FX. São eles: o 8150, o 8120, o 6100 e o 4100.

Entender sobre a nomenclatura da nova geração é extremamente simples e intuitiva, bem diferente, por exemplo, de seus rivais Core ix da Intel. O primeiro dígito indica a quantidade de núcleos da CPU. Assim, o FX-8150 é um octo core, assim como o FX-6100 é um hexa-core e o FX-4100, um quad-core.

Os 3 dígitos restantes servem para informar o desempenho dos processadores, ou melhor, para indicar que uma CPU é mais poderosa que outra, obviamente que dentro da mesma linha (8000, 6000 e 4000). Portanto, um FX-8150 é mais veloz que um FX-8120.

Falando agora sobre as memórias caches, a quantidade de L2 acompanha o número de núcleos, com um total de 2MB por módulo (conjunto dual core). JÁ a L3 é fixa em 8MB, independentemente da quantidade de núcleos.

As frequências de operações da memória cache L3 e do North Bridge alternam entre 2.0-2.2Ghz, dependendo do modelo da CPU, assim como o TDP (dissipação térmica mÁxima), que oscila entre 95-125W.

Vale ainda ressaltar que a linha Bulldozer conta apenas com um die. Assim, um FX-8150 e um FX-4100, possuem os mesmos 8 núcleos em seu chip, ainda que na versão quad core, outros 4 núcleos permaneçam desativados. De acordo com a AMD, não é possível ativar os núcleos "adormecidos". A ideia de utilizar um único die acaba que geral certa ineficiência de recursos da CPU, contribuindo para o aumento de custos e TDP.

Outro ponto interessante a mencionar é que, a julgar pel imensa diferença entre o FX-8120 (3.1Ghz) e o FX-8150 (3.6Ghz), é bastante provÁvel que a AMD lance no futuro, modelos com clocks intermediÁrios. E ao que tudo indica, a hipótese da chegada de um FX-8170 (4.2Ghz?) é bastante plausível, na medida em que hÁ um FX-4170.

Algumas novidades...

- Turbo Core 2.0

Assim como o Llano (linha Vision A8/A6/A4), a nova geração Bulldozer trouxe um significativo aumento nos clocks e avanço no "power gating", recurso que desativa individualmente os núcleos de processamento subutilizados, abrindo espaço para que os cores ativos possam trabalhar com frequências de operação maiores. Este ajustamento dinâmico na velocidade de operação dos núcleos é chamado pela AMD de Turbo Core, e de Turbo Boost pela Intel.

A AMD aprimorou o Turbo Core na geração Bulldozer FX, ao adicionar um terceiro elemento e estado (Max Turbo) à tecnologia. Desta forma, um processador, que por exemplo, tenha frequência base (nominal) de 3.6Ghz, poderÁ além ter todos os seus núcleos overclockados automaticamente para 3.9Ghz, ter apenas alguns de seus cores turbinados para uma frequência ainda maior, em 4.2Ghz. Trata-se de um grande avanço, principalmente porque muitas aplicações atualmente não utilizam mais do que 2 ou 3 núcleos.

- DDR3-1866

Apesar do Bulldozer manter controladora dupla de memória (dual channel), a nova geração de CPUs da AMD trouxe como grande avanço, o suporte oficial aos módulos DDR3 de 1866Mhz, aumentando assim a largura de banda de memória, consequentemente melhorando certas aplicações que fazem intenso uso do trÁfego de dados do sistema.

{break::AMD 990FX}O AMD 990 é na realidade, o chipset que a companhia produziu especialmente para a nova geração de processadores Bulldozer. Contudo, com o atraso na chegada das CPUs, a companhia resolveu lançar o chipset antes do lançamento da linha Zambezi FX.

A primeira vista pode parecer algo estranho e sem sentido, o lançamento de um chipset para um processador que só deve chegar em outubro. Contudo, é bom lembrarmos que estamos falando da AMD, uma companhia que tem dentre outros méritos, o fato de disponibilizar produtos com um incrível potencial de compatibilidade entre linhas distintas. Se por um lado, a compatibilidade permite uma maior escalabilidade e economia em termos de recursos, por outro, pode retardar a evolução tecnológica, uma vez que o hardware tem de se "prender" a certos requisitos de uma geração anterior, em detrimento do uso de recursos inovadores.
Assim, explica-se agora o fato do chipset AMD 990 ter chegado antes da geração Bulldozer, uma vez que este é retrocompatível com os atuais processadores AM3.

Na verdade, o AMD 990 estÁ longe de ser algo genuinamente novo. De fato, ele é uma evolução da geração anterior, o 890, que por sua vez é baseado no 790.

Apesar de ser possível utilizar uma placa-mãe com chipset AMD 890 em um processador Bulldozer, a AMD projetou a linha 990 para tirar o mÁximo proveito da nova geração de CPUs da companhia. Assim, além do fato dos chipsets 990 terem nativamente suporte ao socket AM3+, estes contam com um aprimoramento na tecnologia HyperTransport (versão 3.1), aumentando assim a vazão do fluxo de dados entre a CPU e o chipset de 5.2GT/s para 6.4GT/s. Trata-se de um fator preponderante para o perfeito funcionamento dos modelos mais poderosos da geração Bulldozer, com o é o caso dos processadores de 8 núcleos da série FX-8000.

O AMD 990 conta ainda com a interface A-link Express III com largura de banda de 4GB/s entre o Northbridge e o Southbridge. A versão SB950 do chip ponte sul presente no novo chipset , possui nativamente suporte ao USB 2.0, Áudio em HD, rede Gigabit, PATA e PCI, além, é claro, de um par de PCI Express Gen 2 x1 e SATA III de 6Gbps. Infelizmente o USB 3.0 ficou de fora, embora seja possível através de uma solução por parte da fabricante da placa-mãe.

Ao todo a companhia disponibilizou 3 versões de chipsets baseados na série AMD 990. São eles: o 970 – para o segmento de entrada, o 990X – para o intermediÁrio, e o 990FX – para o segmento top. Todos os 3 são similares, com o suporte aos processadores socket AM3 e AM3+, memória DDR3, PCIe 2.0 e SATA III. A diferença entre os modelos estÁ no suporte para a tecnologia multi-GPU, devido à quantidade de linhas disponíveis no PCI Express de cada um (mÁximo de até 42 pistas). Enquanto que o 970 suporta apenas uma VGA, o 990X acomoda duas placas 3D e o 990FX suporta até 4 VGAs.

Por falar em multi-GPU, um dos grandes destaques dos chipsets AMD 990 (990X e 990FX), estÁ na volta ao suporte da tecnologia SLI da NVIDIA, permitindo assim o uso de até 4 GeForces simultâneas – e também, é claro, de 4 Radeons em CrossFireX.


Vale ressaltar que a AMD continua a adotar a estratégia do uso de 2 chips na placa-mãe para compor o seu chipset. O Northbridge (ou chip ponte norte) e o Southbridge (ou chip ponte sul). Juntos, os dois formam a infraestrutura bÁsica para todos os dispositivos da placa, incluindo conectividade e interconexão.

O Northbridge funciona primariamente como um HUB controlador para o processador, memória e links PCIe em direção à GPU do chipset. Contudo, a linha 990 até o presente momento não possui nenhum modelo com vídeo integrado.

Conforme antecipado, o 990FX tem muitos links PCIe dedicados à VGA ou a outras placas. O chipset permite utilizar até 2 placas 3D na configuração completa x16, ou 4 GPUs em 4 links x8. A configuração possível das pistas do PCIe no AMD 990FX é  seguinte: 2x16 ou 4x8, e PCIe x16 e 6x1, 1x4.

O novo chipset da AMD permite ainda uma agressiva configuração RAID (0, 1, 10, 5 – este último apenas para o Southbridge SB950) e para SSD.

Uma grata novidade presente no chipset 990FX é o suporte à tecnologia IOMMU, permitindo o endereçamento virtual de memória pelos dispositivos do sistema. Com este recurso, os dispositivos conseguem utilizar seus drivers nativos em um ambiente virtualizado, de forma a aprimorar ainda mais o desempenho.

Em um ambiente não virtualizado, IOMMU fornece os recursos de isolamento de memória e proteção - o acesso ao dispositivo de memória do sistema é verificado pela IOMMU de tal forma que informações sobre a memória crítica / independentes (como é o caso das paginações do kernel) podem ser protegidas, conferindo assim mais robustez ao sistema.

{break::MÁquinas/Softwares utilizados}Nessa review utilizamos uma série de sistemas, desde o mais TOP da Intel da nova série Sandy Bridge-E, aos modelos que competem diretamente com o FX-8150 da linha Sandy Bridge.

Uma dica bastante importante a todos que estão montando um sistema baseado em uma mainboard AM3+ e algum processadores da linha FX (Bulldozer). ATUALIZE A BIOS ASSIM QUE MONTAR O SISTEMA!!!

Algumas mainboards nem dão boot antes de atualizar a BIOS, sendo que as versões originais de BIOS não tinham o suporte correto aos processadores FX, passamos por essa situação aqui, após o update da BIOS, o sistema funcionou normalmente.

Abaixo algumas fotos do processador. 

MÁquinas utilizadas nos testes:
- Processadores AMD: fx-8150 + (MSI 990FXA-GD80), Phenom II X6 1100T BE + (Gigabyte GA-890GPA-UD3H)
- Processadores IntelCore i7 3960X + (AsusRampage IV Extreme) Core i7 980X + (Gigabyte G1 Assassin), Core i7 2600K + (Asus P8Z68-V Pro)
- Memória: Corsair Vengeance 8GB DDR3 (2x4GB)
- Placa de vídeo: XFX Radeon HD 6970
- Cooler Master Hyper 212 EVO

Sistema Operacional e Drivers:
- Windows 7 64 Bits com Updates
- ATI Catalyst 11.12 WHQL

Aplicativos/Games:
- WinRAR 4.01
- CineBENCH 11.5
- x264 HD Benchmark 4.00
- Sandra 2012 (18.10)
- AIDA 64 2.00
- wPrime 2.07
- Adobe Photoshop CS 5
- 3DMark 11
- Crysis 2
- GTA 4 (Liberty City)

CPU-Z 
Abaixo temos a tela principal do CPU-Z, mostrando características do processador. Reparem que ele é reconhecido como FX-8130P no "nome", mas em especificações mostra o nome correto.

{break::Winrar, CineBench, x264 HD}WinRAR

O teste com o WinRar permite mensurar o desempenho do processador em comprimir e descomprimir dados, sendo o resultado expresso em KB/s.

Como pode ser visto, o FX-8150 obteve um resultando fabuloso, ficando em primeiro lugar, a frente do todo poderoso Core i7 3960X, com uma pequena vantagem de 1,7%. JÁ em relação ao seu adversÁrio direto, o 2600K, o ganho em favor do processador da AMD foi de 21%. Por fim, o FX-8150 mostrou uma evolução de 33,6% sobre o Phenom II X6 1100T.

{benchmark::2420}

CineBENCH 11.5
O CineBENCH é uma suíte de teste utilizado no "mundo real", que tem como objetivo avaliar a capacidade computacional do sistema. O programa é baseado no programa de animação CINEMA 4D da Maxon, amplamente utilizado por estúdios e produtoras para a criação de conteúdo 3D.

O cenÁrio do teste utiliza todo o poder de processamento do PC para renderizar uma cena 3D foto-realista, fazendo uso de vÁrios algoritmos diferentes com o intuito de "estressar" todos os núcleos disponíveis da CPU.

Apesar de possuir 8 núcleos, o FX-8150 decepcionou neste teste, ficando na penúltima posição, a frente apenas do Phenom II X6 1100T, por desprezíveis 0,5%. Em primeiro lugar – como era de se esperar, ficou o Core i7 3960X, com desempenho 63,6% superior ao Bulldozer. Em segundo lugar ficou o 980X, 11,7% atrÁs do Sandy Bridge E, seguido pelo 2600K, 13,5% a frente do FX-8150. Este benchmark deixa bastante claro, a superioridade dos processadores de alto desempenho da Intel sobre seus concorrentes, inclusive em relação ao Core i7 2600K.

{benchmark::2423}

x264 HD Benchmark
O X264 HD Benchmark é um software que simula a codificação de vídeos em alta definição em um arquivo de vídeo x264 de alta qualidade, para analisar o comportamento do computador mediante uma pesada carga de processamento. A cada passagem de codificação, o benchmark utiliza de forma bem eficiente os múltiplos núcleos do processador (bem como os demais recursos do sistema).

Na primeira passagem do teste, o FX-8150 decepcionou, ao amargar a última colocação, sendo 8,6%, 19,2%, 22% e 29% respectivamente mais lento do que o Phenom II X6 1100T, Core i7 2600K, 980X e 3960X.

JÁ na segunda passagem o Bulldozer se recuperou – provavelmente por necessitar de mais núcleos do que na primeira passagem – ficando na terceira posição, 28,5% e 22% respectivamente atrÁs dos Core i7 3960X e 980X, mas 0,8% e 9% a frente do 2600K e do Phenom II X6 1100T.

{benchmark::2424}

{break::Sandra 2012, AIDA64}SiSoftware Sandra 2012
O SiSoftware Sandra é um dos benchmarks mais populares do mercado, capaz de fazer uma série de anÁlises comparativas, como forma de mensurar o desempenho do sistema (computador) como um todo.  Utilizamos 3 testes: Processor Arithmetic, Processor Multi-Core Efficiency e Memory Bandwidth, de forma a analisar o poder das CPUs  em termos de processamento aritmético, eficiência dos múltiplos núcleos e da largura de banda de memória.

Neste benchmark entra mais um concorrente na disputa: o Core i5 2500K. No teste do processamento aritmético, a briga só ocorre a partir da quarta posição, ocupada justamente pelo FX-8150, sendo 24,5% mais lento que o terceiro colocado, o 2600K. O Bulldozer é 16% mais rÁpido que o Phenom II X6 1100T e 21% mais poderoso que o 2500K. Absoluto no topo estÁ o 3960X como quase o dobro de performance obtido pelo FX-8150, seguido do 980X.

No teste em que avalia a eficiência multicore dos processadores, hÁ mudança de posições em relação à comparação acima apenas nos dois últimos lugares. Invertem as ordens entre o Core i5 2500K e o Phenom II X6 1100T. Assim, o 3960X ocupa novamente a posição maior – 17,4% a frente do 980X, que por sua vez é 40% mais veloz que o 2600K. A diferença entre o terceiro e quarto colocado, ou seja, entre o 2600K e o FX-8150 é de 64,7% em favor da CPU da Intel. Em compensação, o Bulldozer é 25,6% mais rÁpido que o 2500K. Em última posição ficou o PII X6 1100T, sendo 70,8% mais lento que o Core i5.

Finalmente no item em que se mensura a largura de banda de memória, hÁ algumas mudanças curiosas, como é o fato do Core i7 980X cair para a penúltima posição – indicando assim o grande avanço tanto da linha Sandy Bridge, quanto do próprio Bulldozer. AliÁs, a Intel trabalhou tão bem neste ponto, que o 2500K conseguiu desbancar o FX-8150. Vale ressaltar que a briga foi bastante acirrada em todas as colocações, a exceção da última posição ocupada pelo Phenom II X6 1100T. Assim, os primeiros lugares são ocupados pelo 3960X (3,3% a frente do 2600K), Core i7 2600K (3,7% a frente do 2500K) e Core i5 2500K. Ocupando a quarta posição, o FX-8150 foi 7,5% mais lento que o 2500K, 3,6% mais rÁpido que o Core i7 980X e 29,6% mais veloz que o Phenom II X6 1100T.

{benchmark::2421}

AIDA64
Temos dois testes com o AIDA64, CPU Queen e CPU ZLib. O CPU Queen é um teste de inteiro focado na capacidade das ramificações de previsões e nas penalidades de erros de previsões da CPU. Para um entendimento mais simples, o teste encontra as soluções para o clÁssico "problema das Rainhas" em um tabuleiro de xadrez 10 por 10. Desta forma, em processadores com mesma frequência de operação – em teoria – aquela que tiver um menor pipeline e menores penalidades de mÁ previsão dos dados, obterÁ uma maior pontuação no benchmark. Vale ainda mencionar que o CPU Queen faz uso de vÁrias otimizações na arquitetura do processador, como é o caso das instruções MMX, SSE2 e SSSE3, além das tecnologias HyperThreading, multi-processador (SMP) e multi-core (CMP).

Fornecida a devida explicação para um melhor compreendimento dos resultados, vamos aos números! As arquitetura mais robustas do Sandy Bridge E e Bloofield "falam novamente mais alto". Assim, nenhuma surpresa: Core i7 3960X em primeiro e 980X em segundo.  25% atrÁs do 3960X e 18,7% do 980X ficou o 2600K, que por sinal, é 31% mais rÁpido que o Phenom II X6 1100T, que ocupa a quarta posição. Em penúltimo ficou o 2500K (menos de 1% atrÁs do Phenom). A lamentar foi o desempenho do FX-8150, na última posição, sendo 4% mais lento do que o Core i5 2500K, e 27,6% menos eficiente do que o 2600K.

{benchmark::2422}

O CPU ZLib é o teste de inteiro que mensura o desempenho combinado de CPU e memória do subsistema através da biblioteca de compactação de arquivos. O benchmark utiliza apenas instruções x86 bÁsicas, além de suportar as tecnologias HyperThreading, multi-processor (SMP) e multi-core (CMP).

Nas duas primeiras posições, nenhuma novidade: Core i7 3960X no posto mais alto, 20,2% a frente do 980X, que por sua vez é 19,3% mais poderoso que o 2600K. Este é apenas 2,1% mais rÁpido que o FX-8150, que ocupa a quarta colocação, 7% a frente do Phenom II X6 1100T. Em último ficou o 2500K, 18,2% e 23,5% atrÁs respectivamente do Phenom e do Bulldozer.

{benchmark::2432}

{break::PS CS5, wPrime, 3DMark 11}Photoshop CS 5
No Photoshop, fora medido o tempo para a aplicação do filtro Stylize – Extrude, que na verdade é um efeito 3D onde transforma a imagem de forma que esta pareça estar pintada sobre vÁrios blocos ou pirâmides tridimensionais de vÁrias alturas vistos por cima. Desta forma, a leitura do resultado deve ser analisada de forma invertida, ou seja, quanto menor o tempo decorrido para finalizar a tarefa, melhor.

Dois fatos inusitados chamaram a nossa atenção. Primeiro diz respeito ao fato do Core i7 3960X ter sido 5,9% mais lento que o 2600K, que por sinal, alcançou o posto mais alto do teste; e segundo, pelo acanhado desempenho do FX-8150, ficando em último lugar, 33,8% atrÁs do 2600K. Em terceiro ficou o 980X, 13,5% abaixo do 3960X, seguido do Phenom II X6, na quarta colocação.

{benchmark::2426}

wPrime
O wPrime  é um programa desenvolvido para realização de cÁlculos e funções quadrÁticas, utilizando-se do método recursivo de Newton para o calculo de funções estimadas. O benchmark utiliza o método de estimativa diversas vezes para aumentar a precisão dos resultados. Em seguida faz uma rotina de confirmação para assegurar que o cÁlculo esteja correto.

O teste foi dividido em dois modos, um com passagem mais simples (32M), e outro onde sobrecarrega o sistema (1024M).

No modo 32M, hÁ uma espécie de empate técnico entre o 3960X e o 980X na casa dos 5 segundos, com diferença de centésimos de segundos em favor do Bloomfield. Em terceiro, colado do 2600K, ficou o Phenom II X6 1100T, ambos na casa dos 8 segundos, com diferença de um décimo de segundo para a CPU da AMD. O FX-8150 ficou apenas na quinta colocação, necessitando de pouco mais de 10 segundos para finalizar o cÁlculo, um pouco mais de um segundo a frente do 2500K, em último lugar.

{benchmark::2433}

No modo mais estressante (1024M), a única mudança foi a troca de posições entre o 2600K (252 segundos) e o X6 1100T (265 segundos), com o Core i7 em terceiro, e o Phenom II em quarto. Assim, o 980X ficou em primeiro lugar, um segundo e meio a frente do 3960X, com 171 segundos. Mais uma vez o Fx-8150 não obteve uma posição de destaque, em quinto lugar, 46 segundos a frente do 2500K.

{benchmark::2425}

3DMark 11
Embora considerados testes bastante polêmicos por parte da comunidade, por serem tachados como benchs sintéticos que não refletem, muitas vezes, a condição da placa no mundo real (leia-se jogos), a série 3DMark é um dos indicadores de performance mais amplamente utilizados em todo o mundo e não poderíamos refutÁ-los.

Rodando o 3DMark 11, todos os processadores obtiveram um resultado muito semelhante, uma vez que a "grande estrela" deste teste é a GPU, e não a CPU. De toda forma, o Core i7 2600K mais uma vez se destaca ao alcançar o posto mais alto, deixando o 3960X na segunda posição, seguido pelo 980X. Os três primeiros colocados tiverem uma diferença de menos de 150 pontos, de um total de mais de 5.600. As últimas colocações foram preenchidas pelos processadores da AMD, com o FX-8150 na quarta colocação, com pouco mais de 5.300 pontos, pouco mais de 40 pontos a frente do Phenom II X6 1100T.

{benchmark::2427}

{break::Game: Crysis 2}Pensamos em fazer testes em baixa qualidade com a intenção de que o game use mais CPU ao invés de GPU, assim como alguns sites internacionais fazem. Mas acabamos que achando algo sem sentido e que não mostra a real ideia do que o processador representa ao rodar um game, podendo até mesmo mascarar ou confundir algumas pessoas. Desta forma, nossos testes foram feitos em situações normais que um usuÁrio rodaria o jogo se tivesse uma mÁquina desse porte.

Como destacamos nos dados da mÁquina utilizada, todos os sistema comparados rodam com a mesma placa de vídeo e mesma quantidade de memória, ou seja, uma XFX Radeon HD 6970 e 8GB de RAM. 

Crysis 2
Em crysis 2 foram testadas duas situações, ambas na configuração ULTRA (com efeito Edge Blur e filtro Quincunx AAem 2x): 1680x1050 pixels e em 1920x1080 pixels.

Na resolução intermediÁria, uma grata surpresa para os lados da AMD: o grande campeão foi o Bulldozer FX-8150, 2,1% a frente do Core i7 3960X e 2,5% em relação ao 2600K. A diferença em favor do Bulldozer para o quarto (980X) e quinto colocado (X6 1100T), foi respectivamente de 4,5% e 7,7%.

{benchmark::2428}

Em 1920x1080 pixels, novamente o FX-8150 "mostra sua força", ficando na primeira posição, em uma espécie de empate técnico com o 2600K, seguido pelo 3960X em terceiro, 980X em quarto e o Phenom II X6 1100T na quinta colocação. AliÁs, conforme destacado logo no início desta bateria de testes, é possível perceber que a medida que se aumenta a qualidade/resolução do jogo, mais apertada fica a diferença entre os competidores. A explicação estÁ no papel secundÁrio da CPU no processamento dos games.

{benchmark::2429}

{break::Game: GTA 4}GTA 4
Se em Crysis 2 o FX-8150 fez bonito, sendo o processador mais rÁpido no teste, em GTA IV, o Bulldozer deixa a desejar, ocupando as últimas posições.

Em 1680x1050, o novo processador da AMD é apenas o quarto colocado (penúltimo), a frente apenas de seu "compatriota" Phenom II X6 1100T por menos de meio FPS. O Bulldozer foi 7% mais lento que o primeiro colocado, o 2600K. A segunda posição foi ocupada pelo 980X, com o 3960X em terceiro.

{benchmark::2430}

Em 1920x1080, a situação do FX-8150 piora, ficando na última posição, 7% mais lento que o primeiro colocado, o 3960X, e 6,9% do segundo, o 2600K. O terceiro colocado foi o 980X, seguido pelo Phenom II X6 1100T em quarto.

Considerado um dos games que mais se beneficia de um bom processador, mais uma vez podemos notar o papel coadjuvante da CPU no procesamento de jogos.

{benchmark::2431}

{break::Overclock}Nos dias de hoje lançar um processador destinado a qualquer público e não dar algum destaque a overclock é cortar uma boa margem de compradores, dessa força tanto AMD como Intel tem dado bastante destaque a tal característica em seus novos lançamentos.

O FX-8150 é de uma linha de processadores muito bem falado quando o assunto é overclock, tanto é que detém o recorde mundial chegando a impressionantes 8.58GHz. O problema é que hoje quase toda mainboard Intel Z68 consegue overclockar facilmente um processador Sandy Bridge, infelizmente não acontece o mesmo com as mainboards 990FX e os processadores FX.

Utilizamos dois modelos para a review, uma ECS A990FXM-A e uma MSI 990FXA-GD80, ambas placas destinada ao público que procura o que existe de melhor para processadores AM3+. Em ambos os casos nossa experiência em overclockar o FX-8150 não foi fÁcil, com a placa da ECS foi bastante complicado, sua BIOS confusa e instÁvel não deu nenhum resultado significativo, jÁ com a placa da MSI conseguimos resultados um pouco melhores, colocando o processador de 3.6GHz a 4.4GHz, em TODOS os cores, se atentem a esse detalhe.

Diversas reviews internacionais overclockaram apenas alguns cores para chegar a clocks como 4.8, 5.0GHz, jÁ outras dependendo da combinação de hardware e do dia, conseguiram resultados bons mesmo com todos os cores overclockados.

Fizemos diversos testes com configurações bem distintas, tanta alterando o multiplicador como frequência, mas de jeito algum conseguimos manter ele estÁvel sequer a 4.5GHz em todos os cores. Um dos problemas é que a mainboard da MSI limita a voltagem mÁxima do processador em 1.42v, jÁ a da ECS é ainda mais complicada e instÁvel nessa situação.

Para terem noção do que foi a review do processador, tivemos inclusive problema com uma Crosshair V Formula + FX-8150, ambos "morreram" na tentativa de chegar aos 4.6GHz com 1.45v no CPU. De acordo com a Asus, era problema do modelo enviado, uma versão de engenharia e não do produto final. Em breve deveremos receber outra mainboard para review.

Vale destacar também, que mesmo desativando alguns cores para alcançar clocks mais altos, o ganho tende a ser melhor do que manter todos os cores em um clock mais baixo, ou seja, deixando todos os 8 cores a 4.4GHz possivelmente vai resultar em desempenho inferior em relação à apenas 4 cores em 5.0GHz. Um exemplo dessa situação, é que no Turbo Core de 4.2GHz, é justamente isso que acontece, apenas alguns cores são overclockados a 4.2GHz,

Um fato curioso diz respeito sobre os aplicativos que mostram a temperatura do processador, como pode ser visto abaixo. O processador estÁ overclockado e rodando o stress test wPrime, mas mesmo assim, a temperatura estÁ bem baixa. Fato semelhante aconteceu com o aplicativo da AMD, o OverDrive.


{break::Overclock: Winrar, CineBench, x264 HD}WinRAR
Estranhamente ao passar o FX-8150 de 3.6Ghz para 4.4Ghz (ganho de 22% sobre o clock padrão, ou 800Mhz), o teste com o WinRAR não apresentou nenhuma melhora efetiva (ganho de imperceptíveis 6 pontos, ou 0,15%. Em primeiro lugar estava, em primeiro permaneceu.

{benchmark::2442}

CineBENCH 11.5
No CineBench 11.5 a situação muda drasticamente em favor do Bulldozer. Antes em quarto lugar, 12% atrÁs do Core i7 2600K, o FX-8150 ganhou uma posição – terceiro lugar – com 8% de vantagem sobre o 2600K. O ganho de desempenho do processador foi de expressivos 23% - lembrando mais uma vez que o aumento de clock foi de 22%.

{benchmark::2443}

x264 HD Benchmark
Na primeira passagem do x264 HD, o overclock foi suficiente apenas para tirar o FX-8150 da última colocação, ao ultrapassar por muito pouco (1,5%), o Phenom II X6 1100T. Ainda assim, o ganho real foi de 11%. Entretanto, o Bulldozer em 4.4 Ghz sequer conseguiu se aproximar do Core i7 2600K, ficando 10% atrÁs deste.

Na segunda passagem do teste, onde se exigiu bem mais de todos os processadores, o ganho com o overclock foi bem mais expressivos, de ótimos 20%. Assim, o FX-8150 abriu uma margem de 22% de vantagem sobre o Core i7 2600k, aproximando-se do segundo colocado, o 980X (diferença de 6% em favor do Bloomfield).

{benchmark::2444}

{break::Overclock: wPrime, 3DMark 11, GTA 4}wPrime

No wPrime (1024M), o overclock trouxe um ganho real de 18% no desempenho do Bulldozer, suficiente para ultrapassar o quarto colocado, o Phenom I X6 1100T, em 3,5%, e colocar no terceiro lugar, o Core i7 2600K (vantagem mínima de 1% em favor da CPU da Intel).

{benchmark::2445}

3DMark 11
Assim como aconteceu no teste do WinRAR, no 3DMark 2011, o overclock não trouxe nenhuma evolução significativa, na medida em que os 22% no aumento do clock da GPU resultou em um ganho de apenas 3,5% no benchmark. Assim, as posições ficarem inalteradas em relação ao resultado do teste sem overclock, isto é, o 2600K em primeiro, com o FX-8150 em quarto.

{benchmark::2448}

GTA 4
Assim como ocorreu nas demais reviews de processadores, como foi o caso, por exemplo, do Core i7 3960X, aumentar a frequência de operação de uma CPU praticamente não traz qualquer benefício em termos de ganhos de FPS nos jogos eletrônicos. Mais uma vez podemos atribuir o fato de que em games, a "peça chave" para um bom desempenho chama-se Placa 3D, cabendo à CPU um papel secundÁrio.

Dito isto, não é surpresa o fato de que o Bulldozer tenha "melhorado" insignificantes 0,01FPS. Vale ressaltar que a diferença do líder (3960X) para o último colocado (FX-8150) foi de menos de 4 FPS (7,6%).

{benchmark::2449}

{break::Consumo de energia}Retiramos os testes de consumo de energia do site Anandtech.com, confiram abaixo.

Em modo ocioso (mais conhecido como idle), o desempenho do FX-8150 até que agradou, por se tratar de um processador com 8 núcleos. O consumo foi de 84,8W, 5,5W a mais do que o 3960X e 7,2W acima do 2600K. Em compensação , o Bulldozer mostrou uma expressiva melhora em relação ao Phenom II X6, na casa dos 22%, ou seja, 24,6W a menos.

Contudo, o cenÁrio muda drasticamente quando os processadores são submetidos a intensas cargas de trabalho. O FX-8150 é de longe a CPU que mais consome energia, com 229W, 18W a mais do que o 3960X, 29W acima do 980X e do X6 1100T, e 73,6W de seu rival direto, o 2600K.

Embora a dissipação térmica mÁxima seja um importante fator para o resultado do consumo, ele (TDP) não explica tudo, haja vista que as dissipações térmicas dos competidores são as seguintes: 95W para o 2500K e 2600K; 125W para o FX-8150 e X6 1100T e 130W para o 3960X e 980X.

A razão para esses resultados parece ser uma composição de fatores, como, por exemplo, tamanho da Área do die, quantidade de transistores, e as tecnologias empregadas no processo de fabricação. Ainda assim é difícil compreender como um processador com 1,2 bilhão de transistores distribuídos em 315mm2, pode consumir tão mais do que outro com 2,27 bilhões de transistores com die em 435mm2, se ambos possuem litografia em 32nm.

{benchmark::2450}

{break::Conclusão}Ao analisar os resultados do Bulldozer FX-8150, o consumidor deverÁ ficar bastante atento para não fazer um juízo de valor equivocado sobre o processador.

Analisando friamente apenas os resultados dos benchamarks, o leitor mais desatento poderÁ (e com certa razão) achar que a CPU é uma grande decepção por parte da AMD. Como explicar ou compreender, por exemplo, que um processador de 8 núcleos, consegue perder, em muitos casos, de um quad core (ainda que possua tecnologia de virtualização para 8 núcleos lógicos)?

Se por um lado, o nosso leitor tem certa razão por "desconfiar" dos resultados obtidos pelo Bulldozer, ao acrescentarmos a variÁvel "preço" nos testes, o cenÁrio certamente muda de figura. Enquanto que o todo poderoso Core i7 3960X tem preço de US$ 1.050,00 (podendo ser encontrado no Brasil acima dos R$ 2.700,00), o Bulldozer FX-8150 custa US$ 270,00 (R$ 629,76 em lojas brasileiras na modalidade à vista com desconto) e o 2600K US$ 300,00 (R$ 791,26 com desconto à vista).

Dito isto, é importante ainda perceber, conforme ficou muito bem evidenciado em nossos testes, que o FX-8150 não é a melhor escolha, se você estiver procurando montar um super computador para trabalhar com uma imensa carga de trabalho, como produção de imagens e vídeos, por exemplo. Contudo, se a sua decisão for a de montar um PC equilibrado, para uso geral, que seja necessÁrio um razoÁvel fluxo de processamento, incluindo aí os games, o Bulldozer deve ser incluído em sua lista de compras.

Sem dúvidas que os dois candidatos naturais para esta situação são o Core i7 2600K e o FX-8150. Assim, o usuÁrio deverÁ friamente fazer uma anÁlise financeira para saber qual a opção mais "racional". É bom lembrar que em alguns casos, além do processador, hÁ de levar em conta o preço da placa mãe tanto para o universo AM3+ (Bulldozer), quanto LGA1155 (Sandy Bridge).

Apesar do 2600K ter a vantagem sobre o FX-8150 de possuir GPU integrada, é bom lembrar que dificilmente o dono de um sistema com tal processador se contentarÁ em utilizar uma GPU tão acanhada quanto o Intel HD Graphics 3000. Assim, a compra de uma boa placa 3D é fundamental para o bom equilíbrio do sistema.

Provavelmente a maior desvantagem do Bulldozer para o seu rival Sandy Bridge seja o consumo de energia. 73W de diferença é um patamar extremamente expressivo em favor do Core i7 2600K, ainda mais se o usuÁrio passar muitas horas durante o dia em frente ao computador, uma vez que isso acarretarÁ em uma substancial diferença no valor da conta de energia.

Apresentados todos os prós e contras do FX-8150, caberÁ o leitor fazer o seu juízo de valor, e optar pela opção que mais for interessante para o seu bolso e gosto.

PRÓS
- Preço bastante convidativo;
- Ótima relação de custo x benefício;
- Grande quantidade de memória cache;
- Primeira CPU doméstica com 8 núcleos;
- Multiplicadores destravados (Black Edition);
- Compatibilidade com algumas placas mães da geração anterior (AMD800).
CONTRAS
- Desempenho geral baixo para uma CPU octo-core;
- Ganho de desempenho tímido em overclock;
- Dissipação térmica mÁxima (TDP) bastante elevada.
Assuntos
Tags
amd
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Adrenaline é responsável por análises e artigos de processadores, placas de vídeo, placas-mãe, ssds, memórias, coolers entre outros componentes.

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.