ANÁLISE: AMD A10-6800K

ANÁLISE: AMD A10-6800K

O laboratório de testes da Adrenaline recebeu hÁ alguns dias da AMD, o A10-6800K, "carro chefe" da geração Richland de processadores acelerados - APU (termo para designar que um chip que contempla no mesmo die, de forma completamente integrado, CPU e GPU).

Apesar da Advanced Micro Devices informar que se trata de uma nova geração, o Richland na verdade não passa de uma versão "1.5" das APUs da família Trinity (série Ax-5000), com discretos aprimoramentos. AliÁs, de acordo com a companhia, o ganho de desempenho por clock sobre a geração oscila entre 5-10%, a depender da situação.

Dito isto, os consumidores podem esquecer dos novos núcleos de processamento geral "Jaguar", presentes nos processadores acelerados nos consoles da Sony e Microsoft, o PlayStation 4 e Xbox One. Ao invés disso, a AMD utilizou os mesmos cores x86 "Piledriver" que equipam, por exemplo, os Bulldozer FX.

O grande destaque da geração Richland, continua a ser, sem dúvidas, a promessa do bom equilíbrio entre o processamento de tarefas gerais e de grÁficos, sobretudo sobre este último.

Como forma de disponibilizar maior desempenho para os seus chips, a AMD promoveu um aumento nas frequências de operações da CPU e GPU, principalmente sobre os núcleos x86. A boa notícia é que apesar disto, a dissipação térmica mÁxima (TDP) não foi alterada, permanecendo com o teto de 100W.

No tocante à GPU, apesar das APUs Richland estamparem uma Radeon HD 8000D, na realidade, o chip grÁfico não é baseado na arquitetura GCN (Graphic Core Next), mas sim no VLIW4, presente nas Radeons HD 6900. Apesar disso, o IGP promete ser a solução mais poderosa do mercado. E para quem achar pouco, o usuÁrio poderÁ utilizar algumas opções de placas 3D da AMD para aumentar o desempenho geral do sistema.

Apesar das melhorias no processamento geral x86, vale ressaltar que a intenção da AMD (ao menos no curto e médio prazo) não é o de disputar em pé de igualdade com os processadores (ou se preferirem, APUs) de alto desempenho da Intel (leia-se linha Core i7), mas sim o de botar pressão nos segmentos de entrada e intermediÁrio. Justamente onde se situam os Core i3 e Core i5. Não é por acaso que as APUs Richland se situam na faixa de preço entre US$ 77 e US$ 149.

Não fosse a constante defasagem no processo de fabricação de seus chips, a companhia certamente teria melhores condições de oferecer chips muito mais poderosos e com menor TDP e melhor consumo de energia. Para se ter ideia, enquanto que a Intel estÁ nos 22nm com tecnologia FinFET, a AMD ainda continua no 32nm SOI HKMG. Para piorar a situação, além de limitar o desempenho, o atraso no refinamento na litografia traduz em maior custo de fabricação, e consequentemente, menor lucro para a companhia.

Nas próximas seções, nossos leitores irão conferir maiores detalhes das APUs da geração Richland, como arquitetura, chipset e tecnologias, além, é claro, dos aguardados testes de desempenho do A10-6800K.

{break::As novidades da geração Richland}Conforme mencionado no tópico anterior, o Richland não passa de uma versão levemente aprimorada de seu "irmão mais velho", o Trinity – mantendo os módulos de processamento geral Piledriver e núcleo grÁfico VLIW4 – com clocks maiores. 

Ao que parece, a ideia da AMD é "distrair" o mercado até a chegada dos processadores híbridos verdadeiramente inovadores, codinome Kaveri, que trarão dentre outras novidades, microarquitetura Steamroller composto por núcleos x86 Jaguar e GPU com arquitetura GCN (padrão nas Radeons HD 7000/8000), litografia em 28nm, além de suporte à computação heterogênea com memória totalmente unificada.

- Continua após a publicidade -

Apesar de ostentar uma Radeon HD 8000D, a GPU presente na geração Richland é praticamente a mesma das APUs Trinity, ou seja, uma HD 7000D, com a mesma arquitetura encontrada nas Radeons HD 6900. As novidades ficaram por conta de um discreto aumento na frequência de operação no núcleo grÁfico; maior quantidade de memória a disposição; e encoder de vídeo aprimorado.

Em termos visuais, fica impossível distinguir o die de um processador acelerado Richland de um Trinity. E não é por menos. Ambos são fabricados em 32nm SOI HKMG, com 1,3 bilhão de transistores e Área de 246mm², na qual, 42% é dedicada à GPU. Não é por acaso as APUs da AMD terem um desempenho 3D excepcional para a categoria.


(Die da APU Richland)

Nem mesmo a quantidade de núcleos de processamento grÁfico foram alterados, oscilando entre 128 a 384 Stream Processors. Em compensação, a companhia fez mudanças na tecnologia de overclck dinâmico (TurboCore), tornando-o mais eficiente. AliÁs, de acordo com a companhia, o tempo em que o modo turbinado passa a funcionar foi elevado em 25%, graças ao aprimoramento no monitoramento do die; e flexibilidade nos controles da tensão e frequência. 

A AMD afirma que houve aprimoramento na controladora de memória – embora não tenha informado maiores detalhes. O certo é que agora o Richland aceita de forma oficial, módulos SDRAM DDR3-2133Mhz. Infelizmente esse suporte estÁ restrito ao modelo topo de linha (A10-6800K).

A ausência de grande mudanças foi bom (pelo menos em parte) ao menos em um quesito: no ecossistema socket FM2. A nova geração de APUs é compatível com qualquer placa-mãe equipada com algum dos chipsets/FCH A85X/A75/A55, bastando para tanto, uma simples atualização de BIOS.

Se não houve praticamente nenhuma grande inovação em termos de hardware, a AMD ao menos disponibilizou uma série de ferramentas de programas (exclusivos para a linha móvel/portÁtil), como é o caso de sistema de inicialização acelerado, controle por gestos, reconhecimento facial, conexão sem fio de TV-sets e processamento de vídeo em tempo real em nível de driver.

- Continua após a publicidade -

{break::As APUs da linha Richland}Embora a linha Trinity seja formada por 4 séries (A4, A6, A8 e A10), o Richland estÁ dividido em apenas 3 variantes (ao menos inicialmente). São elas: A6, A8 e 10. Apesar disso, a AMD informou que o seu portfólio de unidades de processamento acelerado continuarÁ segmentado em 4 séries, misturando APUs da nova geração com a anterior, conforme pode ser visto na imagem abaixo.

A lógica por trÁs da nomenclatura segue o padrão adotado com as APUs das gerações passadas (Llano e Trinity), ou seja, o A em maiúsculo para definir que se trata de uma APU, seguido de um ou dois dígitos para designar a qual família pertence a unidade de processamento; e finalmente a numeração (iniciada pelo numeral 6) formada por 4 dígitos, para diferenciar os diferentes modelos entre cada família. Opcionalmente poderÁ haver a letra K ao final, indicando se tratar de um chip destravado, pronto para o overclock.

Assim, resumidamente, quanto maior a família e o número associado, mais poderoso é a APU. Abaixo explicaremos um pouco mais os principais recursos de cada família:

A6-6000

A família A6 possui apenas dois núcleos x86 Piledriver, além de 1MB de cache L2, suporte a memória DDR3 de 1866Mhz e TDP em 65W. 

Pelo menos por enquanto, hÁ apenas um representante desta categoria: o A6-6400K.A APU trabalha em 3.9Ghz (chegando a 4.1Ghz via TurboCore 3.0), com GPU Radeon HD 8470D (192 Stream Processors) @ 800Mhz. Outro diferencial é a presença de multiplicadores destravados, facilitando assim a vida dos overclockers.

A8-6000

- Continua após a publicidade -

Trata-se de uma família mais interessante, uma vez que apresenta não dois, mais sim quatro núcleos de processamento (portanto, uma APU do tipo quad core), além de 4MB de memória cache L2, suporte a memória DDR3 de 1866Mhz e Radeon mais robusta. Quanto ao TDP, hÁ modelos com 65W e 100W.

HÁ dois representantes aqui: o 6500 e o 6600K. Enquanto que primeiro trabalha em 3.5Ghz (chegando a 4.1Ghz), o segundo opera em 3.9Ghz (alcançando 4.2Ghz). A dissipação térmica mÁxima respectiva é de 65W e 100W. Ambos utilizam a Radeon HD 8570D com 256 Stream Processors. Entretanto, a GPU do A8-6500 opera em 800Mhz, enquanto que a do A8-6600K trabalha em 844Mhz. Outra diferença entre os modelos estÁ no fato do 6600K possuir multiplicadores destravados. 

A10-6000

Eis a linha mais poderosa da geração Richland. Seu grande diferencial para as APUs A8 estÁ na presença de uma GPU Radeon bem mais poderosa, a 8670D com 384 Stream Processors @ 844Mhz; além de contar com núcleos x86 com clocks mais elevados. No mais, quantidade de núcleos, cache e TDP são os mesmos que a linha anterior, ou seja, respectivamente quad core, 4MB de L2 e 65W/100W.

HÁ dois modelos disponíveis: o 6700 e o 6800K. Além de possuir multiplicadores destravados, o A8-6800K tem ainda como vantagem sobre o seu "irmão menor", clock maior (4.1Ghz, chegando a 4.4Ghz - contra 3.7Ghz, chegando a 4.3Ghz) e suporte para memória DDR3 de 2133Mhz (contra 1866Mhz do 6700).

{break::A arquitetura do Richland}Conforme mencionado exaustivamente nas seções anteriores, o Richland possui os mesmos núcleos de processamento x86 Piledriver do Trinity, que por sua vez derivam da arquitetura modular (baseada no compartilhamento de recursos dentro do die da CPU) presente na linha Bulldozer FX. 

Embora a AMD tenha feito alguns aprimoramentos, a estrutura bÁsica geral permanece basicamente a mesma. Cada módulo Piledriver possui a mesma combinação 2+1 de ponteiros de inteiro/ponto flutuante existente no Trinity. HÁ dois núcleos inteiros, cada um com seus próprios schedulers (responsÁveis por selecionar um dos processos/threads disponíveis na memória e alocÁ-lo na CPU), caches L1 e unidades de execução. Entre os dois núcleos hÁ um de ponto flutuante, que pode lidar com instruções de uma das duas threads de cada vez. O núcleo de ponto flutuante único compartilha os dados da memória cache dos núcleos de inteiros duplos.

Uma das importantes novidades presentes na arquitetura Piledriver, é a troca do tipo de flip-flops. Para quem não sabe, tratam-se de simples pedaços de lógica, que armazenam algum tipo de dado ou estado [de processamento]. Tais flip-flops são muito comuns em diversas partes do processador, incluindo o início e fim do estÁgio de pipeline (técnica inicialmente usada em processadores RISC, que consiste em dividir o processador em vÁrios estÁgios distintos).

O fluxo do processamento se dÁ mais ou menos da seguinte forma: o trabalho é realizado antes de um flip-flop e então entregue a este, ou a uma matriz de flip-flops. A saída deste processo torna-se a entrada para a matriz seguinte de lógica. Normalmente os flips-flops são elementos que trabalham de forma bem "certinha": o dado permanece no sinal crescente do clock.

Em modelos de alta frequência, no entanto, pode haver uma quantidade considerÁvel de variabilidade ou instabilidade no clock. Para tanto, deve-se gastar um bom tempo de desenvolvimento para garantir que o seu projeto possa lidar com essa instabilidade, ou se incorpora uma lógica mais tolerante à instabilidade no clock. Na primeira opção, é necessÁrio mais esforço, enquanto que na segunda, mais energia.


(Funcionamento do módulo Piledriver)

Enquanto que a AMD optou pela última opção (de forma a ganhar tempo), o Pilerdriver é o resultado de um esforço sistemÁtico para o desenvolvimento de flip flops menores e sem desvios de padrão. Isso só foi possível, graças à existência de tempo disponível. O resultado é uma considerÁvel redução no consumo de energia do processador por clock em relação à arquitetura anterior, o Llano.

Na parte principal do processamento, os engenheiros da AMD "queimaram a pestana" para aprimorar o funcionamento do IPC (quantidade de instruções que um processador pode processar por pulso, a cada hertz gerado), que agora processa mais instruções por clock em relação ao Bulldozer, além de reduzir vazamento de energia, e possibilitar se atingir frequências de operação maiores. Outro benefício é que os schedulers estão agora mais eficientes em relação aos sinais livres.

Um interessante aprimoramento diz respeito às unidades de execução, que estão agora um pouco mais robustas. A AMD afirma que houve melhorias significativas na divisão de ponto flutuante e inteiro.

Os sistemas de prefetching (antecipação de dados) e previsão de desvios foram outras importantes melhorias empregadas nos núcleos de processamento Piledriver. Enquanto que as CPUs da geração Bulldozer fazem uma pré-busca seqüencial simples, as APUs da geração Trinity podem fazer a antecipação de dados (prefetching) de comprimentos variÁveis, e através dos limites da pÁgina da memória cache L1. 

Nos Bulldozers, se os dados antecipados não forem usados (incorretamente antecipados), eles "entupirão" o cache com os dados mais recentemente acessados. No entanto, se os dados antecipados não forem imediatamente usados, é provÁvel que eles nunca sejam utilizados. 

JÁ os núcleos Piledrivers imediatamente identificam os dados antecipados inutilizados como os menos recentemente utilizados, permitindo que o controlador de cache rapidamente evite-os, caso o prefetch esteja incorreto.


(Melhorias no módulo Piledriver em relação ao Bulldozer)

Uma importante mudança é a inclusão de um "perceptron branch predictor" (algoritmo de classificação supervisionada de uma entrada para uma de duas saídas possíveis - espécie de classificador linear - para o circuito digital de aprimoramento do fluxo de dados no pipeline de instrução) que complementa o preditor de ramo primÁrio no Bulldozer. A ideia da utilização de um "perceptron branch predictor" é melhorar a precisão da previsão de ramo, necessÁrio em estruturas altamente encadeadas. Esses tipos de ramificadores secundÁrios são uma obrigação, uma vez que não hÁ tamanho único quando se trata de ramificador de previsão.

Vale mencionar ainda que cada núcleo de processamento conta com 128KB de cache L1 (64KB para instrução + 64KB de dados), além de 1MB de L2 por core. Assim como na geração Trinity, a AMD aboliu o L3 compartilhado.

Outra boa notícia foi a inclusão de novas instruções, como é o caso da AVX, AVX 1.1, FMA3, F16C e AES, além da melhoria no sistema de overclock automÁtico, chamado pela AMD de Turbo Core 3.0.

{break::A GPU Radeon 8000D}Assim como ocorreu com as demais APUs da AMD, o grande destaque da geração Richland fica por conta do desempenho grÁfico. Para tanto, a AMD equipou as os novos processadores híbridos com GPUs Radeons HD 8000D.

Apesar do nome, tais chips grÁficos não são baseados na arquitetura Graphic Core Next (GCN), presentes nas placas externas da série Radeons HD 7000. Ao invés disso, a GPU do Richland é uma versão levemente aprimorada do IGP do Trinity, utilizando a arquitetura VLIW4, encontrada nas Radeons HD 6900.

O VLIW4 (Very Long Instruction Word, 4:1 ratio) é formado por 4 unidades de Stream Processors, sendo que todas preparadas para lidar com shaders de média complexidade.

Uma das grandes motivações para a mudança na época das Radeons HD 6900, deveu-se pela necessidade de se adequar à conjuntura daquele momento. É que a AMD havia observado que cada vez mais os games estavam exigindo GPUs com VLIW com taxas na casa de 3,4. 


(Arquitetura VLIW4)

Outro importante benefício advindo na época da introdução das primeiras GPUs com o VLIW4 foi a redução na Área do die do chip grÁfico na ordem de 10%, aumentando assim o nível de performance por mm2 sobre o antigo modelo VLIW5 vigente no período.

Vale ressaltar que apesar da AMD possuir o domínio da litografia em 28nm (via TSMC), as APUs Trinity (assim como o Llano) continua a utilizar o processo de fabricação SOI de 32nm da GlobalFoundries.


(Bloco de diagrama da GPU Radeon HD 8000D presente nas APUs Richland)


Conforme visto acima, as GPUs da geração Richland possuem 6 clusters SIMD Engines, sendo cada um formado por 16 thread processors e 4 unidades de texturas (TMUs). Por ser baseada na configuração VLIW4, conforme explicado, cada thread processor conta com 4 stream cores. Desta forma, as Radeons HD 8000D possuem um mÁximo de 384 Stream Processors (6 SIMD Engines x 16 thread processors x 4 stream cores) e 24 TMUs (6x4). 

Para segmentar as linhas (A10, A8 e A6), a AMD inativou alguns clusters SIMD Engines, como forma de diferenciar os modelos das GPUs Radeons HD 8000D. Assim tem-se:

- Radeon HD 8470D – linha A6 – com 192 Stream Processors (3 SIMD Engines x 16 thread processors x 4 stream cores) e 12 TMUs (3x4);

- Radeon HD 8570D – linha A8 – com 256 Stream Processors (4 SIMD Engines x 16 thread processors x 4 stream cores) e 16 TMUs (4x4);

- Radeon HD 8670D – linha A10 – com 384 Stream Processors (6 SIMD Engines x 16 thread processors x 4 stream cores) e 24 TMUs (6x4).

Apesar das GPUs serem basicamente as mesmas da geração anterior Trinity, as Radeons da Richland possuem 3 aprimoramentos: 

- Suporte para até 768MB de memória (retirado da RAM do sistema), contra 512MB da geração anterior;

- Clocks mais elevados (800/844Mhz, contra 723/760/800Mhz); e

- Atualização na engine de encoder de vídeo UVD, passando a contar com suporte integral a conteúdo Full HD, inclusive com o recurso Blu-Ray 3D.

Assim como ocorreu com as gerações anteriores, as APUs Richland suportam algumas Radeons externas (off boards), caso o usuÁrio deseje agregar mais "poder de fogo". Assim, as linha A10 e A8 podem utilizar em paralelo (ou CrossFire híbrido), uma Radeon HD 6670 ou um 6570, enquanto que para o A6, as opções são as Radeons 6570 e 6450.

O suporte a múltiplos monitores estÁ garantido através da tecnologia Eyefinity.

{break::A plataforma AMD A85X (socket FM2)}Antes da chegada da primeira geração da APU Llano, a AMD utilizava uma solução composta por Northbridge e Southbridge em suas placas mães, onde o Northbridge era responsÁvel por tarefas como fornecimento das vias principais do PCI Express, facilitar a comunicação entre o Southbridge e a CPU e fornecer uma plataforma para grÁficos onboard em alguns chipsets.

JÁ o Southbridge era utilizado primeiramente como um hub para as funções de entrada e saída, SATA, Áudio e conexões de rede, enquanto fornece algumas camadas adicionais do PCI / PCI-E para conectividade de propósito geral.

Com a introdução do conceito de integração das macro estruturas das unidades de processamento acelerado da AMD, a companhia mudou significativamente a abordagem de construção do chipset, uma vez que todas as funções do Northbridge foram transferidas para o die da CPU, assim como a controladora de memória DDR3, saídas de vídeo para o controlador de grÁfico e o PCI-Express x16 para placas grÁficas.

AMD transferiu as funções típicas do Southbridge para uma solução tudo-em-um chamado de Fusion Controller Hub (FCH). Na época, duas versões de chipsets ou FCH foram disponibilizadas: o A55 e o A75. Ambas no novo padrão de pinagem, o socket FM1.

O A55 é a versão mais simples, suportando 6 portas SATA de 3Gbps, 14 portas USB 2.0 e 4 PCI Exprees x1. JÁ o A75 é bem mais robusto, com 6 portas SATA de 6Gbps (suportando RAID 0,1 e 10), 4 portas USB 3.0, porta eSATA multiplier (permitindo instalar mais de um HD em uma única porta SATA), 3 slots PCI de 32 bits, além das demais funções presentes no A55.

Na época do lançamento do Trinity, uma nova plataforma foi disponibilizada: o A85X. A principal mudança em relação aos seus dois "irmãos mais velhos" é a utilização de uma nova pinagem. Ao invés de 905 pinos do FM1, o A85X tem 904 pinos. Mais do que suficiente para a criação de um novo chipset: o FM2 (micro-PGA). Vale ressaltar, que além do A85X, tanto o A75 quanto o A55 ganharam versões no novo socket.


(Diagrama da plataforma A85X)


A plataforma A85X tem pequenas mudanças em relação à A75, como é o caso da quantidade de portas SATA de 6 Gbps nativamente suportadas. São respectivamente 8 portas no novo FCH contra 6 no A75.

Outro recurso interessante é a possibilidade de utilizar duas GPUs em paralelo, através da divisão do PCI Express x16 em 2 vias x8.


(Diagrama de comunicação CPU/GPU e FCH na plataforma Richland)

É importante ainda esclarecer, que o FCH comunica-se com a APU através de um link, chamado Unified Media Interface (UMI), que consiste de quatro PCI-E x1 para as transferências de entrada e saída, e para o gerenciamento do sistema. Isso resulta em uma largura de banda de interconexão de 2 GB/s, bem aquém, portanto, dos 4,16 GB/s (5.2 GT / s) encontrados no AM3. Contudo, a alta largura de banda do HyperTransport 3.0 entre o Southbridge e a APU não é mais necessÁria, uma vez que a FCH não contém nenhuma demanda do PCI Express do Northbridge.

Vale frisar mais uma vez que é possível utilizar a nova geração Richland em qualquer  placa mãe socket FM2 da geração Trinity, desde que seja feita uma atualização de BIOS. Apesar de serem APUs paticamente idênticas, a AMD informa que isto é necessÁrio em virtude de uma série de aprimoramentos via firmware. 

{break::Demais Tecnologias}

Dual Graphics

As APUs AMD apresentam a tecnologia Dual Graphics, permitindo a usuÁrios que aumentem sua performance em grÁficos 3D ao adicionar uma placa de vídeo dedicada AMD Radeon da série HD 6000, dependendo também se a placa-mãe utilizada oferece suporte à tecnologia (como as linhas de chipsets A85X/A75/A55 da própria AMD).

TurboCore 3.0

Uma das grandes novidades advindas com as APUs Trinity foi o suporte ao TurboCore 3.0, versão aprimorada do recurso que turbina automaticamente a CPU. Além de estar mais "esperto" no que se refere ao overclock dos núcleos do processador, o TurboCore 3.0 trouxe como diferencial, o aumento automÁtico na frequência de operação da GPU integrada.

De forma simples, o TurboCore 3.0 funciona da seguinte forma: ao perceber que um aplicativo necessita de mais processamento geral (x86), o novo recurso reduz o clock da GPU (abrindo margem no TDP) e então aumenta a frequência de operação da CPU. Caso um programa exija de mais poder grÁfico (como jogos), o TurboCore 3.0 faz o oposto, ou seja, reduz o clock da CPU para possibilitar o incremento na velocidade do chip grÁfico.

Com a geração Richland, a AMD tornou o TurboCore 3.0 ainda melhor, através de alguns importantes aprimoramentos. 

O primeiro foi a adição de mais níveis (pontos de operação) de frequência e tensão, de forma que o microcontrolador integrado pode agora escolher melhor o desempenho mais condizente com o tipo de fluxo de trabalho, e assim, aumentar a eficiência do processamento. 

Outro aprimoramento ocorreu nos algoritmos, que agora são capazes de detectar quando partes da APU hÁ  algum gargalo e estabelecer se o fornecimento de força extra serÁ capaz de resolver o problema.

Por fim, as informações colhidas dos novos sensores de temperatura presentes no die em volta dos núcleos da CPU e GPU também são utilizados para aprimorar a precisão de energia dos cÁlculos de temperatura.

Assim, a AMD garante que o tempo em que o Richland funciona em modo turbinado é 20% maior em relação ao Trinity, aumentando, portanto, o desempenho sobre a geração anterior.

Eyefinity

Embora a tecnologia de múltiplos monitores jÁ seja bem conhecida dos proprietÁrios de produtos da AMD, o Eyefinity nas novas APUs da companhia possibilitam a utilização de uma configuração de telas do tipo 1+1. Assim, é possível conectar até 2 monitores.

RAMDisk

Junto com o TurboCore 3.0, o AMD Radeon RAMDisk é outra tecnologia bem interessante.

A premissa da RAMDisk é muito simples: instalar o mÁximo de memória no sistema quanto for possível; em seguida, utilizar um software para criar uma partição; para então usar essa partição para rodar aplicações sensíveis a carga/carregamento.

Embora a AMD tenha dito que a RAMDisk é capaz de gerar uma partição (espécie de memória cache) de até 64GB, de fato, a tecnologia ficarÁ limitada a 32GB, visto que o socket FM2 conta com 4 DIMMs.

Memory Profile

A AMD introduziu ainda o recurso chamado Memory Profile, que automaticamente seleciona os tempos das memórias (memory timings) das DIMMs selecionadas. Trata-se de algo semelhante ao XMP Profile da Intel.

Utilizar a configuração do computador via BIOS para "turbinar" as memórias agora é coisa do passado para as novas APUs, com o Memory Profile.

Novas Instruções

Conforme adiantado no início desta anÁlise, a geração Trinity traz um conjunto de novas instruções que junto com as jÁ existentes, otimizam o processamento de uma série de fluxos de trabalho. São elas: MMX, SSE até a versão 4a, AES, Advanced Bit Manipulation (Manipulação de Bit Avançado), Advanced Vector Extensions (Extensões de Vetor Avançado), FMA3, AVX 1.1, AMD64, tecnologia de virtualização e Enhanced Virus Protection (Proteção de Vírus Avançado).

DDR3 mais veloz e eficiente

Um dos avanços advindos com as novas APUs é o suporte a memórias mais velozes, com clock de até 2133Mhz. Isto é fundamental não apenas para melhorar o desempenho geral da CPU, mas como também da GPU, visto que a RAM é utilizada também no chip grÁfico.

Além de suportar memórias mais robustas, a controladora estÁ mais inteligente. De forma a otimizar o consumo de energia, o clock da DRAM é automaticamente reduzido sempre que o sistema requisita uma pequena quantidade de dados.

Por último mas não por menos, as novas unidades de processamento acelerado suportam DIMMs de baixa voltagem (1.25V).

UVD 3

Introduzido inicialmente em 2007 nas Radeons HD 2000, o UVD (Unified Video Decoder, ou Decodificador de Vídeo Unificado) teve como principal objetivo, desafogar o processamento de certos tipos de vídeos Full HD do processador, transferindo a sua execução para a GPU.

Trata-se, portanto, de um bloco/engine de hardware dedicado a decodificação de vídeos VC-1 e H.264/AVC-encoded, de forma completa e com precisão de bit.

O Richland utiliza a terceira geração da engine, conhecida por UVD3. Disponibilizada nas Radeons HD 6000, o recurso amplia a compatibilidade e uma vasta gama de formatos, como é o caso do MPEG-2 bitstream, MPEG-4 part 2 ASP (DivX/Xvid) e o Codec Multi-View (MVC/Blu-ray 3D).

AMD Elite Experience Program! 

Embora não seja compatível com as APUs para desktops (ficando restrito aos modelos para dispositivos móveis/portÁteis), o AMD Elite Experience Program! É um conjunto (suíte) de programas/aplicativos (Gesture Control, Screen Mirror, Quick Stream Technology, Face Login, Steady Video e Perfect Picture HD) com o intuito de facilitar e aprimorar a experiência do usuÁrio. Abaixo segue o detalhamento dos programas:

- AMD Face Login – Utiliza o reconhecimento facial via webcam para facilitar o acesso ao Windows e a serviços na web que utilizem log-in, como é o caso de mídias sociais e correios;

- AMD Gesture Control – "Entende" os gestos de mãos do usuÁrio, navegadores, e-readers, programas de webcam, dentre outros;

- AMD Screen Mirror – Compartilha remotamente conteúdo, como fotos, vídeos, streams de mídia HD e pÁginas web do notebook/tablet para qualquer TV/tela compatível ou receivers DLNA;

- AMD Steady Video – Tem como objetivo melhorar a qualidade de vídeos, ao estabilizar as imagens tremidas;

- AMD Quick Stream – Suaviza o fluxo do vídeo, além de praticamente garantir o fim de interrupções; e

- AMD Picture Perfect HD – Cria cores ricas e realistas em vídeos.

{break::Fotos, MÁquinas/Softwares utilizados}Abaixo temos algumas fotos do A10-6800K, algumas ao lado da APU 5800K, até o lançamento do 6800K o topo de linha da série.

A placa-mãe que utilizamos é o modelo F2A85V- PRO da Asus, topo de linha da empresa para processadores socket FM2. Abaixo uma foto da mesma:

Fizemos testes com alguns clocks diferente nas memórias do sistema, onde o ganho deverÁ ser bastante visível quando a aplicação exigir do vídeo onboard, ou seja, games. Além dos testes de overclock, fizemos testes com memórias em 1866MHz e 2400MHz, mostrando que nessas situações o sistema pode ter um belo "UP" no desempenho.

MÁquinas utilizadas nos testes:
- AMD A10-6800K (4.1GHz) + ASUS F2A85-V PRO

- AMD FX-8150 (3.6GHz) + MSI 990FXA-GD80
- AMD A10-5800K (3.8GHz) + ASUS F2A85-V PRO

- Intel Core i5 3570K (3.4GHz) + Intel DZ77SLK50K
- Intel Pentium G870 (3.1GHz) + Gigabyte B75M-D3H

Todas placas-mãe e processadores utilizaram os mesmos hardwares abaixo para os testes:
- Placa de vídeo: NVIDIA GeForce GTX 680 referência
- Memórias: 8 GB G.Skill ARES @ 1600MHz (2x4GB)
- SSD: Corsair Force GT 240GB Sata III
- HD: Seagate ST31000528AS 1TB SATA II 7200RPM
- Fonte de energia (PSU): XFX ProSeries 850W PSU

Sistema Operacional e Drivers:
- Windows 7 64 Bits com Updates
- Intel INF 9.4.0.1017
- Intel HD Graphics Drivers 15.31.9.3165
- AMD Catalyst 13.6
- NVIDIA GeForce 320.18

Aplicativos/Games:
- Adobe Photoshop CS5
- CineBENCH 11.5
- PCMark 8
- MaxxMEM
- x264 FHD Benchmark 1.0.1
- wPrime 2.09

- 3DMark 11 (DX11)
- Aliens vs Predator (DX11)
- BioShock Infinite (DX11)
- GRID 2 (DX11)
- Tomb Raider (DX11)

{break::CPU-Z, GPU-Z}Abaixo algumas telas do CPU-Z e GPU-Z mostrando detalhes d APU e sistema utilizado, sendo as telas do CPU-Z relacionadas ao processador, placa-mãe e memórias, e do GPU-Z relacionada ao vídeo integrado do A10-6800K. 



Para base de comparação, segue abaixo a tela principal do CPU-Z e do GPU-Z da APU A10-5800K.

{break::Temperatura}Nos testes de temperatura, todos os modelos comparados utilizam o "cooler box" que acompanha o processador. Testamos cada processador de duas maneiras, uma com o sistema em modo ocioso(idle) sem estar executando nenhuma aplicação, e outro rodando o 3DMark 11, aplicativo que exige processamento do CPU e especialmente do GPU.

Sistema Ocioso

Rodando o 3DMark 11

{break::Consumo de energia}Criamos duas situações de testes de consumo com o sistema sendo exigido, uma apenas dos modelos com vídeo integrado rodando o 3DMark 11 e outra com todos os sistema rodando com uma NVIDIA GeForce GTX 680 referência. Sendo duas situações, uma com o sistema em modo ocioso e outra rodando o aplicativo 3DMark 11.

IDLE (Sistema ocioso)

Rodando o 3DMark 11

+ GTX 680 rodando 3DMark 11

{break::CineBench, x264 FullHD}CineBENCH 11.5
Começamos os testes de desempenho em aplicações com o CineBench, que testa o processador convertendo uma imagem e utilizando o metodo multicore, onde o aplicativo utiliza todos os núcleos do processador para acelerar a conversão da imagem.

x264 Full HD Benchmark
O teste x264 Full HD Benchmark faz a conversão de vídeo em Full HD, dando a real noção de como os processadores se comportam nesse tipo de ação.

{break::wPrime, Adobe Photoshop}wPrime
O aplicativo wPrime é um dos que mais exige dos processadores por consistir apenas em estressar todos os núcleos disponíveis, se tornando uma boa opção para testes de estabilidade. No final do teste o aplicativo informa o tempo necessÁrio para executar as instruções enviadas ao processador.

Photoshop CS5
Nosso teste com o Photoshop CS 5 consiste na aplicação do filtro extrude em uma imagem em alta resolução. O teste faz uso apenas do CPU e não do GPU.

{break::Conversão de vídeo, PCMark 8}Conversão de vídeo
Através do software CyberLink MediaEspresso é possível fazer conversão de vídeos com o uso do GPU para auxiliar o CPU, dessa forma acelerando o processo de conversão. O hardware tem que ter suporte a aceleração por GPU para usufruir da aceleração.

PCMark 8
O recém anunciado PCMark 8 possui uma grande suite de testes, testando diversos hardwares do sistema, entre eles processador e vídeo.

{break::Testes com o vídeo integrado}Também fizemos uma bateria de testes para ver o comportamento do vídeo integrado do processador, no caso do A10-6800K, uma Radeon HD 8670D.

3DMark 11
Começamos nossos testes com o 3DMark 11, aplicativo que exige bastante do GPU, mas que também utiliza processamento do CPU.

Aliens vs Predator
Nossos testes em games começam com o Aliens vs Predator, um dos primeiros games com suporte a DirectX 11 do mercado.


BioShock Infinite
Outro bom teste é em cima do BioShock Infinite, premiado game lançado no primeiro semestre de 2013 e desenvolvido sobre a Unreal Engine.


GRID 2
Para mudar um pouco de estilo fizemos testes com o GRID 2, segunda versão do simulador de corridas urbanas da Codemasters.


Tomb Raider
Para finalizar testamos o desempenho dos vídeos integrados sobre o remake do Tomb Raider, outro bom game lançado em 2013.

{break::Testes com uma GeForce GTX 680}Além dos testes com o vídeo integrado, fizemos uma série de testes com os sistemas rodando em conjunto com uma NVIDIA GeForce GTX 680 referência, confiram abaixo os resultados:

3DMark 11
Novamente começamos os testes com o 3DMark 11, aplicativo que exige bastante do GPU.

Aliens vs Predator
Dando sequência com o Aliens vs Predator, agora em alta qualidade grÁfica e resolução FULL HD


Metro Last Light
O Metro Last Light lançado no final de março de 2013 se tornou referência quando o assunto é grÁfico, se tornando um dos games com a melhor qualidade grÁfica jÁ vista.

Tomb Raider
Para finalizar, novamente teste com o Tomb Raider, agora com grÁficos em 1920x1080 e alta qualidade com filtros ativados.

{break::Overclock}As APUs da AMD tem como diferencial seu custo/benefício, especialmente porque trazem integrado um bom vídeo on-board. Por outro lado, pela busca do preço baixo, o cooler box praticamente foi deixado de lado, acompanhando um modelo bastante simples.

Como vimos nos testes de temperatura, o 6800K junto com seu irmão mais velho, o 5800K, estão entre os processadores que mais esquentam do mercado, tanto em modo ocioso como em uso. EstÁ certo que eles possuem clocks altos de fÁbrica, mas isso não é problema do usuÁrio. A empresa que adotou essa estratégia deveria colocar junto, uma solução de resfriamento que obtivesse melhor resultado, como acontece com os modelos topo de linha da série FX, e não os coolers que acompanham as APUs atualmente, os mesmos de processadores de baixo desempenho da linha Sempron.

Dessa forma, o overclock foi limitado com o uso do cooler box, não especificamente porque a mÁquina ficou instÁvel, mas se por padrão ela jÁ chegou a 93º graus, imagina quando overclockado. Assim, aumentamos o clock para "apenas" 4.5GHz (pelo Turbo Core, o processador jÁ chega a 4.4GHz), ou seja, somente 100MHz acima da frequência turbinada. Com esse clock e o cooler box, a temperatura ao rodar o wPrime atingiu 101º graus! O sistema até que ficou 100% estÁvel, mas definitivamente é uma temperatura bastante alta, e por isso, o risco não compensa o benefício.

Sem contar que a grande maioria de usuÁrios que optam por essa plataforma, não devem pensar em overclock, afinal a linha de APUs da AMD é voltado para o baixo custo, mordendo o intermediÁrio, mesmo o A10-6800K sendo o modelo topo de linha e oferecendo características de overclock. Por outro lado, esse processador acelerado tem um bom potencial para overclock, especialmente porque a voltagem pode chegar a "números" incomuns para vÁrias plataformas. O 6800K jÁ foi overclockado para 8GHz com 1.992v.

Para ir um pouco além, instalamos sobre o 6800K o cooler que vem junto com o FX-8350, dessa forma overclockamos o processador para 4.7GHz, a temperatura ainda ficou alta, mas mesmo assim fizemos os testes para ter uma noção do ganho de desempenho. Vale destacar que para chegar a 4.7GHz estÁvel, tivemos que aumentar a voltagem para 1.45 volt. Abaixo disso, o sistema não estabilizava. Contudo, a APU aguenta voltagem bem superior. Abaixo uma foto da mÁquina com o cooler que acompanha o FX-8350, desenvolvido pela Cooler Master.

Destacamos também que não é recomendado deixar o sistema em overclock contínuo dessa forma, sendo que tende a diminuir o tempo de vida útil dos componentes overclockados.

Confiram abaixo a tela do CPU-Z e GPU-Z quando overclockamos para 4.5GHz com o cooler BOX: 


Nas telas abaixo vemos o processador overclockado para 4.7GHz com um kit de memória de 2.4GHz trabalhando em 2133MHz, que deve melhorar consideravelmente o desempenho em algumas situações pelo overclock do processador em conjunto com um kit de memórias mais rÁpido, que por tabela se aplica ao overclock do vídeo integrado.


Temperatura
Um característica bastante importante quando se faz overclock é a temperatura do hardware overclockado, especialmente durante a execução de aplicações ou games. Abaixo o comportamento dos processadores quando rodando o 3DMark 11.

Consumo de Energia
Quando se overclocka grande parte dos componentes de um sistema, dependendo o nível do overclock e a forma que ele é feito, o consumo de energia pdoe aumentar consideravelmente. Abaixo a tabela com grÁficos demonstrando o comportamento do processador no overclock que fizemos.

CineBENCH 11.5
O CineBench é uma boa forma de ver o ganho prÁtico de um overclock, no caso executando a conversão de uma imagem.

wPrime
Overclock sem estabilidade não é um overclock 100%, dessa forma nada melhor do que testar o sistema com um aplicativo que estressa todos os núcleos do processador.

3DMark 11
Se não é um teste prÁtico, ao menos o 3DMark 11 é um dos aplicativos mais utilizados para que pretende buscar quebra de recordes.

Aliens vs Predator
Por fim, novamente um teste em game para mostrar o comportamento do overclock nesse tipo de situação.

{break::Conclusão}Conforme explicado exaustivamente no decorrer de nossa anÁlise, a "nova" geração de APUs Richland não passa de uma versão levemente aprimorada da Trinity. Diante disso, não é de se surpreender que o comportamento do A10-6800K tenha sido tão "tímido" em relação ao 5800K. O aumento de 300Mhz nos núcleos x86 Piledriver não foi  suficiente para manter uma margem significativa sobre sua "irmã mais velha". 

Em se tratando do desempenho 3D, embora o incremento sobre o 5800K tenha sido pequeno, o A10-6800K é, de longe, a APU com o maior poder de processamento grÁfico atualmente no mercado, oferecendo condições suficientemente satisfatórias para rodar a grande maioria dos jogos em ótimas condições para a categoria, podendo até ariscar games em resolução de 1680x1050 ou mesmo de 1920x1050 dependendo o nível da qualidade grÁfica, algo impensÁvel para um vídeo integrado a pouco tempo atrÁs.

Um ponto importante em se tratando desse tipo de "processador" com vídeo integrado, como demonstramos em nossos testes, utilizar kits de memória com clocks mais alto influenciarÁ diretamente no desempenho. No Aliens vs Predator a diferença de desempenho em memórias de 1600mhz para memórias de 2133mhz foi de nada menos que 23%, ou seja, se você pretende utilizar o processador para jogar, opte por um kit de memória de alto clock que poderÁ ter um bom ganho comparado a um kit genérico de 1333mhz ou 1600mhz. 

A grande crítica que se faz em relação ao Richland, é, sem dúvidas, a elevada temperatura em que o processador acelerado trabalha. Culpa da litografia - ainda presa aos 32nm, e responsÁvel pelo alto TDP/consumo de energia - além do péssimo cooler que acompanha o produto.

Em compensação, conforme evidenciado em nossos testes, um processador de baixo custo (US$ 142) se saiu muito bem junto com uma placa 3D off-board, do calibre da GeForce GTX 680, ficando "colado" das CPUs mais caras. 

Assim, resumidamente, as APUs da AMD, em especial a nova geração Richland, são especialmente interessantes para os consumidores do segmento de entrada e intermediÁrios de baixo custo, visto que poderão se beneficiar não apenas da ótima GPU integrada, mas principalmente, utilizar uma Radeon off board (externa) – como é o caso da HD 6570 – e obter poder de processamento suficiente para rodar a grande maioria dos games em condições satisfatórias de qualidade e jogabilidade, sem, no entanto, necessitar gastar uma grande soma de dinheiro.

PRÓS
Excelente desempenho 3D
Ótimo custo x benefício
Compatibilidade com as atuais placas mãe socket FM2
Bom overclock
CONTRAS
Litografia ainda em 32nm
Ganho ínfimo no desempenho geral em relação ao Trinity
Temperatura muito elevada
Assuntos
Tags
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Adrenaline é responsável por análises e artigos de processadores, placas de vídeo, placas-mãe, ssds, memórias, coolers entre outros componentes.

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.