ANÁLISE: XFX Radeon HD 6790

ANÁLISE: XFX Radeon HD 6790

Com a chegada da GeForce GTX 550 Ti, a AMD ficou bastante pressionada, uma vez que a companhia não dispunha qualquer solução baseada na geração Northern Islands competitiva em termos de performance x preço. Quem desejasse uma Radeon mais em conta, deveria necessariamente optar por uma 6850 (entre US$149-175) ou então pelas Radeons 5830/5770 (US$109/129), placas, que apesar de serem "boas guerreiras", não tinham a "sedução" da linha 6000.

Para "tapar" este buraco existente, e como forma de dar mais opção ao mercado – colocando de quebra, pressão na GTX 550 Ti – foi que a AMD resolveu lançar mais uma Radeon "Northern Islands" voltada para o segmento intermediÁrio/intermediÁrio de alto desempenho.

Intitulada de Radeon HD 6790, a VGA chegou no dia 5 de abril trazendo uma certa "celeuma" em torno de si. É que apesar da nomenclatura, a placa é baseada no chip Barts (linha 6800) ao invés do Juniper (linha 5700 e 6770/6750).


Talvez muitos estejam se perguntando o porquê da AMD não ter batizado a placa de Radeon HD 6830, passo mais natural a ser adotado, como aconteceu na época com a 5830 e 4830. Embora não tenha dado qualquer explicação, comenta-se pelos bastidores que a AMD resolveu mudar de estratégia, uma vez que as placas x830 eram sinônimos de VGAs sem uma boa relação entre desempenho x consumo de energia x preço. Muitos na época optavam pela compra de uma x770 - em virtude do menor preço e melhor consumo - ou iam direto para uma x850, caso desejassem um maior desempenho.

Ao que parece, a estratégia da AMD estÁ funcionando em virtude da boa aceitação da placa no mercado, além do fator psicológico, o seja, o usuÁrio não estÁ comprando a placa mais simples da série 6800, mas sim a mais poderosa da linha 6700!

Além de trazer mais performance à categoria, a nova Radeon 6790 contam ainda com vÁrias novidades tecnológicas, como é o caso da interface DisplayPort 1.2, HD3D, UVD3 e HDMI 1.4a. Contudo, os grandes trunfos dizem respeitos à nova estruturação das unidades de processamento para o tessellation, bem como do novo modo de anti-aliasing, o Morphological AA (MAA).

A placa foi mais uma cortesia da XFX, empresa que vem investindo pesado em nosso país, lançando placas que atendem a todos os tipos de públicos, desde os jogadores casuais e cinéfilos, passando por profissionais liberais e de artes grÁficas, até aos hardgamers e entusiastas de plantão. Vale ressaltar que o modelo em questão possui um projeto diferenciado, com sistema de refrigeração especial, nos mesmos moldes das placas da série especial Black Edition.

- Continua após a publicidade -

{break::A Arquitetura Barts}Conforme jÁ antecipado no início desta review, a Radeon HD 6790 é baseada no chip Barts (linha 6800) e não no Juniper (5700/6770/6750), que por sua vez é uma versão atualizada da Cypress (Radeon série 5800).

Ao nível de Unidades de Stream Processors (SPU), a linha Barts – assim com a geração Evergreen (Radeon 5000) – continua a utilizar o design VLIW5 (Very Long Instruction Word, 5:1 ratio). Ou seja, cada thread processor conta com 5 stream cores – w, x, y, z e t – que trabalham juntas com uma unidade de ramificação (branch unit) e um conjunto de GPRs para processar as instruções. Destas 5 unidades de SPs, 4 são do tipo simples, que unidas são capazes de processar 4 FP32 MADs por ciclo de operação (clock). JÁ a quinta (unidade t) é do tipo complexa, podendo tanto fazer cÁlculos matemÁticos FP32 – como as 4 unidades simples – quanto lidar com funções especiais e complexas, como uma transcendental.


(Detalhe do design VLIW5)

Segue um resumo do que uma única SPU da Barts pode fazer em um único ciclo de clock:

  * 4 FP MAD de 32bits;
  * 4 Int MUL ou ADD de 24bits;
  * SFU: 1 FP MAD de 32bits.

Comparada à Cypress (5800), o processamento de FP MAD de 64bits na Barts não fora mencionada. Como a linha Radeon HD 6800 (assim como a 6790) não se destina a ser um produto voltado para o segmento intermediÁrio de alto desempenho (high-end) – como é o caso da série 6900 – a AMD extirpou o modo FP64, a fim de reduzir a Área do die da {termo::GPU}.

Na verdade, como forma de conciliar performance com consumo de energia, os engenheiros da AMD mantiveram todo o "esqueleto" central do chip Cypress, para então montar a estrutura da Barts. Em outras palavras, os estÁgios de função fixa, o cache L2, os arranjos dos ROPs e a controladora de memória são praticamente os mesmos da geração passada.

Desta forma, a Barts possui o mesmo arranjo de 80 Stream Processors e 4 unidades de texturas por clusters SIMD Engines que na Cypress, assim como 32KB de cache para compartilhamento de dados locais e 16KB de cache L1 para texturas por cluster, além de 32 ROPs.


(Detalhe do cluster SIMD Engine)

É bom deixar claro que este "encolhimento" nas especificações da Barts em relação à Cypress deveu-se sobre tudo como forma de reduzir tanto o consumo de energia, quanto o tamanho do die da GPU, resultando assim em menor custo de produção para a AMD, que consequentemente consegue disponibilizar VGAs com uma ótima relação de custo x benefício para o consumidor.

- Continua após a publicidade -

Assim como na Cypress, a Barts possui dois grandes blocos de unidades de processamento. Contudo, enquanto que a 5800 possui 10 clusters SIMD Engines por bloco, a 6790 (assim como as 6870 e 6850) é composta por 7 clusters. Por sua vez, cada cluster SIMD possui 16 thread processors, 4 unidades de texturas (TMUs), 32KB de espaço para armazenamento local de dados e 8KB de cache L1 para texturas. Por ser baseada na configuração VLIW5, conforme jÁ adiantado, cada thread processor conta com 5 stream cores. Desta forma, a GPU Barts possui um total de 1.120 Stream Processors (14 SIMD Engines x 16 thread processors x 5 stream cores) e 56 TMUs (14x4) – versão 6870.

Seguindo o tradicional modelo de diferenciação de versões, a AMD desabilitou 2 clusters SIMD Engines na Radeon HD 6850. Desta forma, a placa possui não 1.120 Stream Processors e 56 TMUs como na 6870, mas sim um total de 960 SPs (12 SIMD Engines x 16 thread processors x 5 stream cores) e 48 TMUs (12x4).

JÁ na Radeon HD 6790, a AMD desabilitou mais 2 clusters SIMD Engines. Assim, a VGA possui ao invés de 960 Stream Processors e 48 TMUs como na 6850, um total de 800 SPs (10 SIMD Engines x 16 thread processors x 5 stream cores) e 40 TMUs (10x4).


(Detalhe da arquitetura da Barts - versão 6790)

Apesar de nativamente o chip Barts possuir 32 ROPs, como forma de distanciar o desempenho para a 6850, a AMD reduziu a metade, a quantidade de unidades de rasterização na 6790. Desta forma, a VGA conta com um total de 16 ROPs.

Atrelado aos render back ends estÁ o cache L2 e as controladoras de memórias. Ao todo são 4 blocos de 128KB de L2 (totalizando assim 512KB de cache L2) e 4 controladoras de 64 bits, perfazendo assim um bus de 256 bits.

Embora a estrutura central da Cypress tenha sido mantida na Barts, a nova geração Northern Islands trouxe uma importante novidade: uma unidade tessellator mais avançada em relação às Evergreens.

Trata-se de uma iniciativa fundamental para as pretensões da AMD, uma vez que esta era o maior ponto fraco das Radeons da série 5000, que simplesmente "engasgavam" quando submetidas a tarefas com uso massivo de tessallation.

Com as novas Radeons, o problema foi ao menos em parte, resolvido, graças à utilização de um gerenciamento de thread aprimorado nas engines de shaders e de um buffering reforçado para o processamento do tessellation. De acordo com a AMD, o ganho no processamento do tessellation atingiu pico de 100% em relação às Radeons 5000.

Ainda como forma de melhorar ainda mais a eficiência da renderização, a AMD dividiu o Ultra Threaded Dispatch Processor em dois blocos, cada um possuindo sua própria memória cache de instrução e de constante, aumentando assim o nível de paralelismo das VGAs.

- Continua após a publicidade -

Para quem não sabe, o Threaded Dispatch Processor atua de forma simples e grosseira, como um policial de trânsito gerenciando o trÁfego, ou seja, direcionando as chamadas de processamento dos dados para os clusters de SIMD Engines, mantendo o fluxo das cargas de trabalho contínuo para os Streams Processors, otimizando assim o funcionamento da GPU.

Com a presença de um segundo Threaded Dispatch Processor, o fluxo de dados passa a ser processado de forma mais eficiente e rÁpida nos clusters de SIMD Engines.

Embora a interface de memória continue com uma conexão de 256 bits, a Barts utiliza uma controladora mais simples se comparada à Cypress. Na verdade a Radeon 6790 (assim como as 6800) utiliza o mesmo tipo de controladora da 5700 (Redwood). O motivo estÁ na redução da Área do die do chip. Ao reduzir o clock de 4.8Ghz (Cypress) para 4.0-4.2Ghz – o que resultou em uma baixa de 20% na largura de banda entre a Radeon 5800 e a 6800 – a AMD conseguiu reduzir o tamanho da controladora de memória em 50%! Trata-se de uma otimização de espaço muito importante para o segmento da placa, uma vez que resulta em menor custo de produção e menor consumo/dissipação de energia.


{break::A briga pelo Tessellation}Embora detalhemos mais adiante sobre o que vem a ser o Tessellation, para que os leitos possam acompanhar com mais propriedade as linhas a seguir, limitemo-nos a informar que trata-se de um dos principais recursos presentes no DirectX 11 no qual acrescenta uma imensa quantidade de detalhes geométricos às imagens, gerando contudo, um grande custo computacional às GPUs.

Apesar da AMD ter feito avanços significativos no que diz respeito ao processamento do Tessellation na nova geração Northern Islands, é fato quase que unânime pela comunidade que as novas Radeons ainda não são pÁreas para brigar em pé de igualdade nesse quesito com as GeForces da geração Fermi.


Enquanto que as novas Radeons 6000 continuam com apenas uma unidade de processamento especializado para o Tessellation (ainda que tenha tido um ganho de até 100%), as Fermi têm uma abundância de unidades. Uma por SM, com 3 ou 4 SMs por GPC, sendo que cada VGA tem de um a 4 GPCs, fazendo com que placas TOPs tenham até 16 unidades especializadas para o Tesselation.

Contudo, a coisa não é tão simples quanto parece. A AMD afirma que o atual modo de se implementar o Tessellation em alguns jogos é pura perda de tempo e desperdício de recurso. De acordo com documento publicado durante a SIGGRAPH 2010, o uso excessivo do Tessellation pode levar a uma subutilização dos rasterizadores.

Desta forma, a AMD escolheu focar a performance no Tessellation em baixos fatores (quantidade de subdivisão de triângulos), uma vez que ela entende que estas são as condições ideais para os jogos. De acordo com testes internos divulgados pela companhia, a Barts é cerca de 2 vezes mais eficiente do que a Cypress entre os fatores 6 e 10, com desempenho médio de 50% sobre a Radeon 5800 com fatores abaixo de 6 e entre 11 e 13. Acima disso o ganho da nova geração sobre a antiga é praticamente inexistente.

Além da subutilização no âmbito dos rasterizadores de uma GPU, os problemas com a baixa quantidade de pixels para os índices de triângulo têm sido amplos. Devido ao enorme número de arestas do polígono (efeito serrilhado), a implementação de filtros MSAA podem causar um grande impacto na performance em jogos DX11. Para completar, o uso excessivo de sombras causa um impacto no desempenho e também reduz o realismo global de uma determinada cena.

À medida que aumenta-se o tamanho do triângulo para que se possa abranger mais pixels, o número total de passagens dos shaders por pixel também diminui. Entretanto, a um custo-benefício em termos de qualidade de imagem e detalhes. Para superar isso, os desenvolvedores têm que encontrar um equilíbrio entre desempenho de shader/tessellation e a fidelidade da malha global.

A AMD não ficou apenas "esperando" que os estúdios se adequassem ao que ela entende como "correto" (até porque não hÁ certo ou errado nessa questão, mas sim entendimentos diferentes). A companhia partiu para o ataque, com a disponibilização de um método chamado Tessellation Adaptativo, que envolve a aplicação de níveis mais elevados de tessellation para os objetos que estão mais próximos do campo de visão do usuÁrio, enquanto que os objetos mais distantes serão processados usando níveis mais baixos. Com este tipo de método poderia também haver uma redução no impacto do desempenho de certos tipos de filtros de anti-aliasing em cenas com o uso do tessellation.

Portanto, AMD e NVIDIA possuem abordagens completamente distintas neste assunto. Ao que parece em uma rÁpida anÁlise, enquanto que a primeira disponibiliza uma VGA mais "enxuta", capaz de lidar com 90% dos jogos atuais de forma bastante satisfatória em se tratando de Tessellation, temos uma outra companhia que entende ser importante fornecer uma placa com alto poder de processamento no Tessellation, ainda que esta não conte com a mesma eficiência em termos de desempenho x consumo x preço.

{break::Os recursos da Radeon 6790}Confiram os principais recursos presentes na Radeon HD 6790:

• 1,7 bilhão de transistores;
• Litografia em 40nm;
• 800 Stream Processors;
• 16 ROPs;
• 40 TMUs;
• 1GB de memória GDDR5;
• Bus de 256 bits;
• Suporte às tecnologias: DirectX 11; Eyefinity; ATI Stream Technology; Accelerated Video Transcoding (AVT); AMD Accelerated Parallel Processing (APP) para DirectCompute 5.0 e OpenCL; CrossFireX; HD3D; Unified Video Decoder 3 (UVD3); Morphological Anti-Aliasing; HDMI 1.4a; Dolby TrueHD e DTSHD Master Audio;
• Compatível com o DirectX 11 e Windows 7;
• Suporte ao OpenGL 3.1;
• Suporte ao CrossFireX;
• ATI Avivo HD vídeo; e
• Gerenciamento dinâmico de energia ATI PowerPlay technology
•3a. Geração do TeraScale Engine

Com base nas especificações, a comparação com a Radeon 5770/6770 é inevitÁvel. Enquanto que ambas compartilham a mesma litografia em 40nm, a Radeon HD 6790 tem 1,7 bilhão de transistores distribuidos em uma Área de 255mm2, contra 1,04 bilhão em 170mm2 da 5770. Se ambas possuem as mesmas quantidades de ROPs e TMUs (respectivamente em 16 e 40), a Radeon 5770 leva uma discreta vantagem em se tratando de clock (850Mhz vs. 840Mhz) de GPU e poder computacional (1,36 TFLOP vs. 1,34 TFLOP). Apesar da 5770 possui memória em 4.8Ghz, contra 4.2Ghz da 6790, a Barts LE tem como grande benefício, o fato de utilizar um bus de 256 bits contra 128 de sua rival. Deste modo, a placa tem uma largura de banda de memória de 134.4 GB/s, contra 76.8 GB/s da 5770.

Por ser baseada em um chip de segmento superior, é natural que a Radeon 6790 tenha um TDP médio maior que o da 5770 (150W contra 108W). Em compensação, em modo ocioso, as placas necessitam basicamente da mesma quantidade de energia (19W vs. 16W).


(Chip Barts)

Maiores detalhes das especificações da Radeon 6790 e de suas "irmãs" mais próximas podem ser conferidos abaixo:

{break::O Sistema de Refrigeração}A XFX trouxe para o Brasil um modelo especial da Radeon HD 6790, chamado internamente de HD679XZDFC.

O grande destaque da placa é sem dúvidas a presença de um robusto sistema de refrigeração, composto de duas ventoinhas de 80mm e um grande bloco dissipador de calor formado por 3 heatpipes de cobre que saem da base (contato direto) e se ligam à inúmeras aletas de alumínio.


Somado ao fato da VGA contar com o mesmo circuito elétrico da 6870, ou seja, VRM de 4+2 fases, a Radeon HD 6790 (HD679XZDFC) vem de fÁbrica com todas as condições para atingir um desempenho ainda maior, graças a utilização de um overclock moderado.

{break::Novos filtros de AA e AF}Além de refinar a arquitetura, trazendo, assim, mais performance, as Radeons da geração Northern Islands trazem ainda avanços no que diz respeito à qualidade das imagens, graças ao suporte de novos tipos de filtros de Anti-Aliasing e Anisotropic.

Morphological AA

Uma das grandes apostas da AMD para a geração Radeon HD 6000 estÁ no Morphological Anti-Aliasing (MAA), que basicamente é um anti-aliasing de tela cheia (fullscreen) que proporciona uma qualidade de imagem comparÁvel ao filtro Super Sample AA, sem limitações de bordas de polígonos ou superfícies alfas, trazendo ainda, como vantagem, o fato de necessitar de apenas uma fração dos recursos do SSAA.

O segredo estÁ no algoritmo utilizado no processo, que faz os cÁlculos do AA de forma mais eficiente através do aproveitamento da capacidade de computação GPGPU das Radeon atuais e do poder do DirectCompute. Uma vez que o filtro de pós-processamento é utilizado pelo DirectCompute, toda a cena pode ser rapidamente analisada, de modo que este método de AA não é limitado a apenas certos aspectos de uma determinada imagem.

O novo filtro procura por bordas de altos contrastes com padrões de pixels que são comuns quando hÁ serrilhamento, e em seguida calcula o comprimento e o ângulo da borda ideal, para então misturar as cores para cada pixel circunjacente para a criação de uma imagem mais suave. Por necessitar de amostragem e re-amostragem de dados semelhantes, AMD usa os compartilhamentos de dados locais da GPU para melhorar o desempenho do processo.

A diferença bÁsica em termos de processamento do MAA para os tradicionais métodos de anti-aliasing é que enquanto no Morphological Anti-Aliasing o filtro ocorre depois que o frame é totalmente renderizado pela GPU, nas outras técnicas o filtro ocorre durante a renderização. Assim, essencialmente a placa essencialmente necessita de uma passagem de shader extra na imagem antes de "mostrÁ-la" na tela.


Um dos benefícios mais interessantes do filtro MAA ser utilizado através de uma API independente é o fato de que ele pode ser aplicado tanto às cenas 2D quanto 3D. O filtro pode ser aplicado, por exemplo, em vídeos, aplicativos Flash e muito mais. Além disso, uma vez que o Morphological Anti-Aliasing é controlado diretamente pelo Catalyst Control Center (CCC) do driver da AMD.

Outro destaque é que o filtro de anti-aliasing morfológico não estÁ limitado aos jogos produzidos apenas com o DirectX 11, podendo ainda ser implementado com games em DX10 e mesmo DX9!

Melhorias no filtro de Anisotropic

Além do Morphological Anti-Aliasing, a AMD fez otimizações nos algoritmos do filtro de Anisotropic, com o intuito de aumentar ainda mais a precisão do ângulo AF dependente na maior parte das situações.

Apesar de que em muitos dos casos, no "calor do jogo", o usuÁrio praticamente nem nota o uso do filtro de Anisotropic ativado, em certas situações, o uso de algoritmos de baixa qualidade degradam a qualidade das imagens. Um caso real acontece com as calçadas/paralelepípedos de "Dragon Age: Origins", onde às vezes hÁ uma verdadeira confusão visual para o jogador.

O que a AMD fez foi uma melhoria no desempenho de seu filtro de AF a fim de resolver a descontinuidade, por vezes visto em texturas muito vistosas. Para implementar essa melhoria, transições mais suaves entre níveis de filtragem foram utilizadas de modo a "omitir" algumas mudanças radicais entre texturas vistas à distância. A melhoria na qualidade da imagem resultante deve ser relativamente menor, mas supostamente essa nova implementação não irÁ causar qualquer tipo de impacto no desempenho quando comparado com outros métodos de AF.

{break::HD3D: Radeon adere ao 3D}Trata-se de uma das novidades mais "quentes" da nova geração Northern Islands. A tecnologia estereoscópica 3D é uma das tecnologias mais badaladas dos últimos tempos na indústria do entretenimento, seja em cinemas/TVs, quanto no mundo dos games.

Apesar de ter ficado "inerte" por algum tempo, a AMD entra agora no "jogo" com força total com o HD3D, prometendo assim bater de frente com o 3D VISION da NVIDIA, que até então reinava absoluta no segmento.

Enquanto que a NVIDIA utiliza um padrão proprietÁrio e bem definido, a AMD por outro lado, utilizou uma abordagem totalmente diferente, com um padrão aberto, em que definiu algumas normas, deixando, contudo a cargo de empresas terceiras, a criação de outras, como é o caso dos monitores/TVs e óculos 3D.

Desta forma, como meio de construir uma estrutura padrão mínima em que os jogos 3D estéreos possam ser desenvolvidos e os filmes em 3D assistidos nas Radeons, a AMD recrutou uma série de empresas.

Sendo os óculos 3D estereoscópicos um dos principais recursos de sucesso da tecnologia HD3D, a AMD aliou-se aos principais nomes do mercado, como é o caso da XpanD e da Bit Cauldron.

Na verdade o HD3D é compatível com a tecnologia HeartBeat da Bit Cauldron, que promete virtualmente eliminar o incômodo problema de sincronismo que algumas vezes ocorrem com os óculos ativos.

Uma vez que não hÁ drivers nativos da AMD para o 3D estéreo, os parceiros da AMD irão disponibilizar drivers terceiros que disponibilizem suporte através de programas que "peguem carona" do Catalyst. Atualmente a DDD e a iZ3D jÁ contam com interfaces compatíveis que juntas, suportem cerca de 400 games. Ambas permitem o uso do 3D estéreo em jogos e filmes que não são nativamente suportados pela percepção de profundidade.

Se por um lado, uma tecnologia aberta favorece a ampla adesão por parte dos consumidores, por outro, cria-se um certo risco em termos de qualidade, uma vez que AMD detém um controle muito pequeno sobre como as empresas implementam suas soluções. Ao menos por enquanto, os drivers de terceiros contam com baixo índice de adesão à certificação WHQL, podendo assim eventualmente causar algum problema de conflito com o Windows.

Pode ser que a AMD mude de planos, mas até o momento a companhia não mostrou interesse em disponibilizar seus próprios drivers com suporte ao 3D estéreo.

{break::AMD EyeSpeed}Na verdade o EyeSpeed não é uma tecnologia, mas sim um "selo" que abrange todos os recursos que melhoram a experiência multimídia, como é o caso do pré/pós-processamento, transcodificação e reprodução de vídeos em alta definição, tudo em um ambiente unificado.

O EyeSpeed é dividido em duas principais esferas de influência: a alavancagem no processamento paralelo para a melhoria no desempenho global do PC e a decodificação de vídeo através da tecnologia UVD3.

UVD3
Para quem ainda não sabe, a tecnologia Decodificação de Vídeo Universal (UVD) da AMD jÁ estÁ no mercado hÁ bastante tempo, sendo consideradas uma das plataformas mais eficientes no processamento de vídeos, e que tempos em tempos recebe melhorias por parte da companhia.
Com a chegada da geração Northern Islands, a AMD disponibiliza uma série de novidades À tecnologia, expandindo inclusive a lista de codes que passam a ser suportados.

Um dos recursos chaves do UVD3 é a habilidade de decodificar vídeos usando a codificação MVC. Fazendo parte do codec H264 / MPEG-4 AVC, o MVC é responsÁvel pela criação do fluxo de bits de vídeo duplo que são essenciais para saída do 3D estereoscópico. Com isso, as novas Radeons são capazes de processar filmes em Blu-Ray 3D através de um conector HDMI 1.4a.

Embora não tenha havido nenhuma menção ao codec Nero Digital, as Radeons 6000 contam agora com aceleração via hardware do MPEG-4 Part 2.

Áudio Bitstreaming
Atrelado à engine UVD3 estÁ o Áudio. Graças ao uso da conexão HDMI, as Radeons das séries 3000 em diante podem transmitir som sem perda de qualidade. Contudo, com as Radeons 6000, é possível agora distribuir o som no sistema de 7.1 canais, sem perdas, a 192kHz / 24-bits.

Isso só foi possível graças ao uso da versão 1.4a do HDMI, que suporta ainda as tecnologias Dolby True HD e DTS-HD. As demais tecnologias, tais como PCM, AC-3 e DTS se mantêm compatíveis com o novo padrão. Finalmente, o HDMI 1.4a permite transferência de bits a taxa de até 65Mbps, além do suporte a TV 3D nos formatos (Side-by-Side Horizontal & Top-and-Bottom).

{break::AMD APP Technology}

Conhecida até então por ATI Stream – tecnologia para designar a arquitetura de computação paralela (general-purpose computing on graphics processing units ou simplesmente GPGPU) – passa a se chamar AMD Accelerated Parallel Processing (APP) Technology.

Sem maiores complicações ou termos técnicos, trata-se da tecnologia na qual se utiliza uma GPU (chip grÁfico) para realizar uma tarefa comumente executada por um processador (CPU). Isso só é possível graças à adição de estÁgios programÁveis e da aritmética de maior precisão contidas nos canais de processamento da GPU, que permite que os desenvolvedores de programas utilizem o processamento de fluxo de dados para dados não grÁficos.

A AMD APP Technology pode ser considerada como um canal de ligação entre o ambiente OpenCL e softwares, permitindo que os desenvolvedores criem programas para "conversar" com a GPU, utilizando-a para executar determinadas tarefas até então exclusivas aos processadores.

Trata-se de um recurso cada vez mais utilizado em nosso dia a dia, ainda que muitas vezes passe despercebido pelos usuÁrios. Seguem alguns programas que se beneficiam da GPU para o processamento de algumas tarefas: Cyberlink MediaShow e Power Director, ArcSoft MediaConverter 4, SimHD, Total Media Theatre, Roxio Creator 2010, Adobe Photoshop CS4, dentre outros.

Uma outra aplicação bastante difundida que se beneficia do GPGPU das placas 3D é o [email protected] Trata-se de uma bela iniciativa que utilize os recursos inativos (ou subutilizados) das GPUs e CPUs para ajudar cientistas e demais pesquisadores e solucionar algumas questões globais, como é o caso da cura de algumas doenças.

{break::Eyefinity}Embora a tecnologia de uso simultâneo de múltiplos monitores seja algo para poucos, é inegÁvel que o Eyefinity trouxe uma verdadeira revolução para o mercado ao permitir o uso de até 6 telas por VGA, formando um gigantesco painel com resolução teórica mÁxima de 8192x8192. 

Conforme pode ser visto abaixo, as possibilidades para a tecnologia são inúmeras, permitindo o uso de imagens independentes, simultâneas ou um misto das duas. É possível, por exemplo, o uso de três monitores para formar uma única imagem panorâmica, com o quarto independente, quatro telas simultâneas formando um grande painel e mais duas independes da primeira e entre si. E por aí vai.

As novas Radeons prometem facilitar ainda mais o uso vÁrios monitores, graças a presença de uma vasta quantidade de conexões, incluindo a nova versão do Displayport. Os modelos de referência contam com dois conectores mini Displayport (v1.2), um HDMI 1.4a e dois conectores DVI, sendo um do tipo link simples, e outra do tipo link duplo.

A revisão v1.2 dobrou a largura de banda dos atuais 10.8Gbps (8.64Gbps para vídeo) para 21.6Gbps (17.28Gbps para vídeo), possibilitando a conexão de até 3 monitores por saída mini Displayport, permitindo assim um total de 6 LCDs com o uso da segunda conexão. Contudo, a utilização de 6 monitores irÁ necessitar um equipamento extra, chamado pela AMD de MST HUB (Multi Stream Transport).

Para quem não se convenceu do poder do Eyefinity, a ATi demonstrou durante o lançamento da tecnologia no mês passado, uma configuração composta por quatro placas Radeons de nova geração, em que estavam conectados 24 monitores de LCD!

Os benefícios da tecnologia não serão apenas no campo dos jogos. Profissionais de artes grÁficas, designers, arquitetos, analistas financeiros, dentre uma imensa gama de Áreas poderão tirar proveito do Eyefinity como forma de aumentar a sua produtividade no trabalho.


{break::DirectX 11}Como foi dito no início deste review, um dos grandes trunfos da nova geração de GPUs da ATi, é o suporte a nova API grÁfica da Microsoft, o DirectX 11, que promete facilitar e agilizar no processo de desenvolvimento dos jogos, além de trazer novas tecnologias ou mesmo melhorias nas atuais, aprimorando assim ainda mais a qualidade nos grÁficos.

As principais novidades presentes no DX11 são:

- DirectCompute 11
- Hardware Tessellation
- High Definition Ambient Occlusion
- Shader Model 5.0
- Depth of Field
- Renderização Multi-threaded (Multi-threading)

DirectCompute 11

O DirectCompute é um dos grandes trunfos do DX11, pois possibilita que os desenvolvedores utilizem a GPU para o processamento de outras tarefas alheias à renderização 3D. Trata-se do conceito por trÁs do termo GPGPU (onde transforma a placa de vídeo em um processador).

Os benefícios não ficam restritos às aplicações gerais. Nos games, por exemplo, é possível programar para que a GPU cuide de tarefas como o processamento e filtro das imagens (conceito de post processing); Order Independent Transparency - OIT (técnica de sobreposição de objetos, aperfeiçoando o efeito de semitransparência – como, por exemplo, na criação de efeito de fogo, fumaça, cabelo, vidro); renderização de sombras, da física e da inteligência artificial.


Order Independent Transparency - OIT


Hardware Tessellation


Trata-se de um dos benefícios mais aguardados pela indústria dos jogos eletrônicos.Embora a ATi tenha implementado a tecnologia Tessellation jÁ nas Radeons HD série 2000, somente agora tal funcionalidade serÁ utilizada em sua plenitude.

De forma simplista, trata-se da tecnologia que adiciona em tempo real mais detalhes aos objetos 3D. Para tanto, subdividi-se um objeto/supefície em pedaços menores, acrescentando-se polígonos mais simples (de fÁcil execução).

Em outras palavras, ao invés da GPU gastar um grande tempo para o processamento de um objeto único (ou parte de um grande objeto) e complexo de uma única vez, o Tessellation "quebra" o mesmo em partes menores de forma a tornar a tarefa mais simples e rÁpida.

Assim, os desenvolvedores estão "impedidos" de acrescentarem mais objetos e detalhes aos games. Com o Tessellation, o processamento dos terrenos/solos, serÁ muito mais simples e rÁpido, sem contar que permitirÁ que os programadores criem texturas e maiores detalhes aos mesmos (como a deformação dinâmica), resultando em um maior realismo ao jogo.

Confiram abaixo um vídeo em que mostra o poder da tecnologia:


High Definition Ambient Occlusion


Trata-se de outra técnica de efeito de pós-processamento de imagem que melhora as sombras e luzes, além de aumentar a sensação de profundidade dos objetos (3D). Para isso, a Microsoft disponibilizou dois novos métodos de compressão de texturas: os filtros BC6 e BC7. O primeiro oferece uma taxa de compressão de 6:1 com 16 bits por canal e sem perdas, sendo uma texturização eficiente e de alta qualidade para a iluminação HDR. JÁ a BC7 oferece compressões de 3:1 com o padrão de cores RGB ou ou 4:1 para Alpha.


Shader model 5.0

O DX11 introduz a versão 5.0 do Shader Model para a linguagem de programação HLSL, na qual adiciona precisão dupla para o processo e permite o uso específico dos shaders com polimorfismo, objetos e interfaces.

Na verdade, diferentemente das versões anteriores, o SM 5.0 não traz grandes avanços em termos de capacidades, mas promete facilitar o trabalho dos desenvolvedores ao introduzir certos conceitos de programação orientada a objetos.

Depth of Field

O método adiciona efeitos bem interessantes envolvendo o foco da imagem (primeiro plano) e o plano de fundo para dar um aspecto cinemÁtico às imagens.

O Depth of Field utiliza um filtro de núcleo nos pixels da imagem processada como um efeito de pós-processamento, que usa os dados dos pixels adjacentes para criar efeitos como borrado de movimentos, mapeamento de tom, detecção de bordas, suavização e nitidez.


Renderização Multi-threaded

É a técnica pela qual as GPUs processam os dados de forma simultânea, e não mais em sequência como em uma fila. O ganho, claro, estÁ na eficiência no processamento, resultando em uma melhor performance.

{break::Fotos}Abaixo, uma série de fotos da XFX Radeon HD 6790. O destaque fica para o sistema de cooler com dois fans, além da necessidade de dois conectores de energia de 6 pinos.


Abaixo temos algumas fotos comparando a placa com os dois modelos da série Radeon 6800. O curioso é que o PCB da 6790 é maior do que o da 6850.


{break::MÁquina/Softwares utilizados}Utilizamos uma mÁquina TOP de linha, baseada em uma mainboard X58 com processador Intel Core i7 980X, evitando, assim, qualquer dúvida sobre gargalo do processador.

As placas utilizadas nos comparativos foram, por parte da AMD (ATI), a XFX Radeon HD 6790, 6870, 6850 e 5850. JÁ as da Nvidia foram os modelos GeForce GTX 560 Ti, GTX 550 Ti e GTX 460 1GB.

A seguir, os detalhes da mÁquina, sistema operacional, drivers, configurações de drivers e softwares/games utilizados nos testes.

MÁquina utilizada nos testes:
- Mainboard Gigabyte G1.Assassin
- Processador Intel Core i7 980X @ 4.2GHz
- Memórias 4 GB DDR3-1600MHz G.Skill Trident
- HD 1TB Sata2 Wester Digital Black
- Fonte XFX 850W Black Edition
- Cooler Venomous X

Sistema Operacional e Drivers:
- Windows 7 64 Bits
- Intel INF 9.1.1.1025
- NVIDIA ForceWare 263.99/266.66 WHQL: Placas Nvidia
- ATI Catalyst 11.4 Preview: XFX Radeon HD 6790
- ATI Catalyst 11.2: Demais placas ATI

Configurações de Drivers:
3DMark
- Anisotropic filtering: OFF
- Antialiasing - mode: OFF
- Vertical sync: OFF
- Demais opções em Default

Games:
- Anisotropic filtering: Variado através do game testado
- Antialiasing – mode: Variado através do game testado
- Texture filtering: High-Quality
- Vertical sync: OFF
- Demais opções em Default

* Todos os filtros foram aplicados via game testado. Apenas o Starcraft II, que não possui configuração interna de filtros, nos obrigou a configurar via drivers.

Aplicativos/Games:
- 3DMark Vantage build 1.1.0 (DX10)
- 3DMark 11 build 1.0.1 (DX11)
- Unigine HEAVEN Benchmark 2.1 (DX11)

- Aliens vs Predator (DX11)
- Crysis Warhead (DX10)
- DiRT 2 (DX11)
- F1 2010 (DX11)
- Just Cause 2 (DX10/10.1)
- Mafia II (DX9)
- Metro 2033 (DX11)
- StarCraft II (DX10)

{break::GPU-Z, Temperatura, Ruído}Abaixo temos a tela principal do aplicativo GPU-Z com detalhes técnicos da XFX Radeon HD 6790.


Temperatura
Começamos os testes pela temperatura em modo ocioso, onde a 6790 se destaca ficando com a menor temperatura entre as placas da AMD, entre os motivos o fato dela utilizar dois fans.

{benchmark::1722}

Se o resultado foi bom em modo ocioso, em uso foi ainda melhor, e surpreendente. A 6790 da XFX cravou 56º graus, 7º graus abaixo da 6850, segunda placa na tabela. Na comparação com as placas da Nvidia, a nova placa da AMD ficou nada menos que 10º graus abaixo da GTX 550 Ti, melhor colocada da empresa "verde".

{benchmark::1723}

{break::3DMark Vantage, 3DMark 11}3DMark Vantage
Considerados testes bastante polêmicos por parte da comunidade, por serem tachados como benchs sintéticos que não refletem muitas vezes a condição da placa no mundo real (leia-se jogos), a série 3DMark é um dos indicadores de performance mais amplamente utilizados em todo o mundo e não poderíamos refutÁ-los dos testes.

Neste teste, a 6790 alcançou um desempenho intermediÁrio entre o alcançado pela 6850 e a GTX 550 Ti. A 6850 levou a vantagem, com um desempenho 9% superior.

{benchmark::1724}

3DMark 11
Neste outro benchmark da 3DMark, novamente temos a 6790 se posicionando entre os resultados alcançados pela 6850 da XFX e a GTX 550 Ti. A placa foi 14% mais lenta que a 6850, e 24% mais rÁpida que a GTX 550 Ti.

{benchmark::1725}

{break::Unigine Heaven 2.1}Unigine HEAVEN 2.1 - DirectX 11
Trata-se de um dos testes sintéticos mais "descolados" do momento, pois tem como objetivo mensurar a capacidade das placas 3D em suportar os principais recursos da API grÁfica DirectX 11, como é o caso do Tessellation.

O teste foi dividido em duas partes: uma sem e outra com o uso do Tessellation, ambas a 1920x1080 com o filtro de anti-aliasing em 8x e anisotropic em 16X.

Com tessellation desativado houve uma mudança de posições, com a 6790 sendo ultrapassada pela 550 Ti, ainda que por uma margem pequena. JÁ em relação a 6850 a diferença aumentou, com a placa sendo 22% mais lenta.

{benchmark::1726}

Com tessellation em modo normal o comportamento também é muito bom, o que jÁ era esperado devido a AMD ter melhorado o desempenho da geração 6000 sobre essa tecnologia. A placa se manteve atrÁs da 550 Ti, com uma diferença praticamente nula, enquanto a vantagem da 6950 tem uma leve queda para 18% em relação a 6790.

{benchmark::1727}

{break::Aliens vs Predator}Chegamos finalmente ao ponto alto da review: os testes em jogos!

Nada melhor do que começar por Aliens vs Predator, game que traz o suporte ao DX11 e que foi muito bem recebido pelo público e crítica.

Aqui temos um resultado do comparativo bastante semelhante ao alcançado nos testes do 3DMark, com o desempenho da 6790 se situando entre os da 550 Ti e a GTX 460. Com o aumento da resolução, e mudanças na configuração, a relação de performance entre elas se manteve constante. Em relação a 6850, foi 16% mais lenta.

{benchmark::1728}

{benchmark::1729}

{benchmark::1730}

{break::Crysis Warhead}O FPS futurístico da Crytek fez muito barulho por trazer uma qualidade grÁfica bem superior aos concorrentes e por ser considerado por muito tempo como um dos games que mais exigia recursos do computador, principalmente das placas 3D. Assim, nada melhor do que submeter as VGAs da review pelo crivo de "Crysis Warhead".

Nestes benchmarks a placa apresentou um desempenho entre os alcançados pela 550 Ti e a GTX 460, ao longo das diversas configurações testadas. Em relação a 6850, foi em média 27% mais lenta.

{benchmark::1731}

{benchmark::1732}

{benchmark::1733}

{break::DiRT 2}"Colin McRae: Dirt 2", mais conhecido simplesmente como DiRT 2, é uma das séries de corrida off-road de maior sucesso da história da indústria dos jogos eletrônicos. Lançado em setembro de 2009, o game foi um dos primeiros a ser desenvolvido com o DirectX 11.

Neste game, novamente os benchmarks da 550 Ti e 6790 ficam bastante próximos, com a placa 550 Ti levando vantagem ao longo dos testes, mas com uma melhora da 6790 a medida que a resolução é aumentada, chegando a ultrapassar a 550 Ti em FullHD (1920x1080). Em relação a 6850, foi em média 21% mais lenta.

{benchmark::1734}

{benchmark::1735}

{benchmark::1736}

{break::F1 2010}Adicionamos em nossas reviews o F1 2010, jogo baseado na engine EGO 1.5 da Codemasters (mesma de DiRT2). Mas, conforme jÁ comentamos no artigo de benchmarks do game, diferente do DiRT2, F1 2010 apresenta resultados distintos, com a AMD pouco à frente.

Neste teste temos uma aproximação entre a 6850 e a 6790, com vantagem de 12% para a primeira. JÁ em relação as placas da Nvidia, a 6790 ultrapassa a 550 Ti e inclusive a GTX 460, com 37% de vantagem no desempenho no comparativo com a 550 Ti.

{benchmark::1737}

{benchmark::1738}

{benchmark::1739}

{break::Just Cause 2}Se tem um game no qual as placas da série Radeon dominam em todos os segmentos é o Just Cause 2, curiosamente apoiado pela Nvidia.

Neste teste novamente a 6790 entra no embalo das Radeons e ultrapassa a GTX 460, abrindo vantagem de 23% se comparada ao desempenho da 550 Ti. A placa ficou logo abaixo da performance da GTX 560 Ti, e foi 31% inferior comparado ao da 6850.

{benchmark::1740}

{benchmark::1741}

{benchmark::1742}

{break::Mafia II}Mafia II é um game que trouxe a continuação do aclamado título de ação em terceira pessoa ambientado no obscuro mundo da mÁfia italiana dos anos 40 e 50 nos EUA.

Aqui temos resultados bem próximos entre a 550 Ti e a 6790 novamente, com a placa alcançando uma performance 20% mais lenta que a GTX 460, e 23% mais lenta que a 6850.

{benchmark::1743}

{benchmark::1744}

{benchmark::1745}

{break::Metro 2033}Trata-se de um FPS da 4A Games baseado em um romance homônimo russo, que conta a saga dos sobreviventes de uma guerra nuclear ocorrida em 2013 que se refugiam nas estações de metrô. O game, que faz uso intensivo da técnica de Tessellation e demais recursos do DirectX 11, desbancou de Crysis o título de jogo mais pesado. Sendo assim, nada melhor do que observar como se comportam as VGAs sob este intenso teste.

Assim como nos primeiros testes, a placa se posicionou entre a 550 Ti e a 5850, com as três placas alcançando um desempenho semelhante e inclusive a 6790 empatando com a 5850 no teste com a maior resolução.

{benchmark::1746}

{benchmark::1747}

{benchmark::1748}

{break::StarCraft II}Em nosso último teste utilizamos o game de estratégia StarCraft II que, quando lançado, gerou bastante polêmica pelo fato de os drivers da ATI não suportarem filtros corretamente, problema jÁ resolvido e que agora nos permite uma comparação justa entre as duas empresas. Dessa forma, rodamos o jogo com 8xAA e 16xAF, configurações setadas via drivers, diferentemente de todos os demais testes, afinal StarCraft II não possui esse tipo de configuração interna.

Aqui a placa fica para trÁs da 550 Ti, que é 37% mais rÁpida que a 6790. JÁ em relação a 6850, a diferença foi de 32%, uma das maiores ao longo dos testes com os jogos.

{benchmark::1749}

{benchmark::1750}

{benchmark::1751}

{break::Overclock}A Radeon HD 6790 estÁ entre as melhores placa da geração 6000 da AMD para se overclockar, como podemos ver abaixo na tela principal do GPU-Z, o clock subiu de 840MHz para 950MHz no core e de 1050MHz para 1250MHz nas memórias sem aumento na voltagem, e sem nenhum problema de instabilidade. Alterando a voltagem(utilizamos o Afterburner 2.2.0 Beta 3, ainda sem suporte a alterar a voltagem na 6790), serÁ possível subir ainda mais os clocks.


Temperatura
No modo ocioso, o aumento do clock não trouxe nenhuma diferença perceptível na temperatura de operação da 6790.

{benchmark::1752}

JÁ em uso mais intenso, a placa operou 3 graus mais quente que em clock padrão. A diferença, porém, não chega a ser grande, ficando abaixo da temperatura medida na 6850, por exemplo.

{benchmark::1753}

3DMark 11
No teste do 3DMark podemos ver um ganho de 12% na performance da 6790, com o overclock. Este aumento de desempenho possibilitou que a placa ultrapassasse o resultado alcançado pelas placas 6850 e a GTX 460.

{benchmark::1754}

{break::Overclock: AvsP, Mafia II e Metro 2033}Além do 3DMark 11, fizemos testes com a placa overclockada na resolução de 1920x1080 em alguns games. Vamos acompanhar abaixo como a placa se comportou.

Aliens vs Predator
O ganho de performance com o aumento do clock de operação fez com que a 6790 ganhasse algumas posições, ultrapassando as placas GTX 460 e também a 6850. A placa se saiu 11% mais rÁpida com a diferença no clock.

{benchmark::1755}

Mafia II
A placa obteve um desempenho 13% superior com o overclock, porém não se alteraram as posições das placas, com a 6790 se mantendo atrÁs da GTX 460, agora com uma diferença menor.

{benchmark::1756}

Metro 2033
Novamente a placa alcançou um aumento de performance na casa dos 12%, ultrapassando com isto o desempenho da GTX 460 e, neste caso, a 5850.

{benchmark::1757}

{break::Conclusão}Conforme mencionado logo no inicio desta review, a Radeon HD 6790 chegou trazendo a polêmica de ser equipada com o chip (Barts LE) utilizado na linha 6800, apesar de comercialmente fazer parte de uma série inferior.

Olhando os resultados obtidos pela Radeon, podemos agora compreender a decisão da AMD em marcar a placa como pertencente à linha 6700, uma vez que o seu desempenho mostrou-se bem aquém da 6850.

Por falar em "poder de fogo", excetuando-se os resultados obtidos em F1 2010 e Just Cause 2, a Radeon HD 6790 não obteve um desempenho que pudesse "encher os olhos" de nossa equipe, e muito provavelmente de quem leu atentamente o nosso review. Ainda assim, a placa teve fôlego o suficiente para rodar todos os jogos com uma boa fluidez, principalmente em resoluções intermediÁrias, como em 1680x1050 mesmo com os filtros de anti-aliasing e anisotropic ativados.

O que mais chama a atenção é a receptividade ao overclock, graças, sobretudo, ao belo e eficiente sistema de refrigeração utilizado pela XFX. Em OC, o ganho chegou na casa dos 20%, conferindo assim uma boa atratividade à placa. O melhor de tudo é que graças ao cooler diferenciado, o aumento na temperatura é desprezível, de apenas 3oC.

O grande problema da Radeon HD 6790 (US$ 149) talvez seja a sua relação entre preço e desempenho. Com um desempenho médio bem próximo à Barts LE, mas custando cerca de US$ 25 a menos, o usuÁrio poderÁ levar para casa a GeForce GTX 550 Ti. JÁ quem deseja mais potência, a Radeon 6850 é uma opção extremamente interessante, ainda mais que é possível encontrar a placa pela a web, por até US$ 155.

Não podemos esquecer que a VGA conta ainda com uma série de novos recursos como forma de melhorar a qualidade da experiência visual, como é o caso do novo filtro de anti-aliasing (anti-serrilhamento) MAA e do aprimoramento do filtros de anisotropic. Contudo, um dos "carros chefes" das novas Radeons estÁ sem dúvidas no suporte ao 3D estereoscópico, que sem dúvidas darÁ um novo alento às pretensões da AMD, servindo ainda para tirar um grande trunfo até então exclusivo das placas da NVIDIA.

Para quem não limita-se apenas aos jogos, a Radeon HD 6790 (assim como toda a geração Northern Islands) ampliou o suporte a codificação/decodificação de vídeos com o novo UVD3. Outra evolução bem vinda foi a flexibilização da tecnologia multimonitor Eyefinity.

PRÓS
Suporte ao 3D estereoscópico;
Eyefinity mais flexível;
Novos filtros MAA e EQAA;
Circuito de energia (VRM) de 4+2 fases;
Sistema de refrigeração especial de alta performance;
Bastante receptiva ao overclock.
CONTRAS
Padrão aberto ao 3D pode prejudicar a qualidade do resultado final;
Poderia ser uns US$20-30 mais barata para fugir da pressão da GTX 550 Ti e da Radeon 6850.
Assuntos
Tags
amd
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Adrenaline é responsável por análises e artigos de processadores, placas de vídeo, placas-mãe, ssds, memórias, coolers entre outros componentes.

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.