ANÁLISE: Nvidia GeForce GTX 680

ANÁLISE: Nvidia GeForce GTX 680
Os infindÁveis rumores e especulações que circularam pela web nos últimos meses em torno da geração de GPUs Kepler da NVIDIA finalmente chega ao fim hoje, com o lançamento oficial da GeForce GTX 680.

Vale ressaltar que muitos dos rumores se mostraram infundados, como foi o caso, por exemplo, de uma notícia veiculada nos principais canais de informação, que mostrava as supostas especificações da linha Kepler, com expressivo ganho de performance frente a Radeon 7970. Entretanto, outras especulações acabaram por se comprovar, como a notícia de que as novas GeForces teriam clocks dinamicamente ajustÁveis, e outra que estimava o tamanho do die da GK104.

Se, por um lado, os rumores ajudam no sentido de se tentar montar o "quebra-cabeças" de um lançamento, por outro, podem prejudicar na medida em que se cria uma grande expectativa por parte da comunidade, que em muitos casos, acaba por não se comprovar na realidade. Foi assim no passado e certamente o serÁ no futuro. Os rumores e especulações fazem parte do jogo da indústria e da mídia.

A GTX 680 – como o próprio nome sugere – é a placa single-GPU mais poderosa da NVIDIA desta nova geração, e é com imensa satisfação que apresentamos em primeiríssima mão, em carÁter super exclusivo à comunidade brasileira, a sua anÁlise completa.

Decididamente a NVIDIA "recheou" a GeForce GTX 680 com muitos predicados. O primeiro deles, sem dúvidas, é a imensa quantidade de CUDA Cores (processadores grÁficos, também conhecidos como Sream Processors ou Shader Cores). São nada mais nada menos do que três vezes mais núcleos de processamento em relação à GTX 580! Além disso, os elevados clocks da GPU e memória – respectivamente em 1006Mhz e 6000Mhz – são outros pontos que saltam aos olhos do mercado.

Contudo, a placa apresenta outros destaques bem interessantes, como é o caso do GPU Boost – que turbina dinamicamente os clocks da placa – dos filtros proprietÁrios FXAA (Fast Approximate Anti-Aliasing) e TXAA (Temporal Anti-aliasing), além do recurso adptive VSync (sincronismo vertical adaptativo) e do 3D Vision Surround.

Por último, mas não por menos, um ponto que, no início dos rumores, foi taxado pela comunidade como infundado, mas que acabou se confirmando, é o TDP em impressionantes 195W! Isso representa expressivos 55W a menos do que a sua rival HD 7970. AliÁs, fazia um bom tempo que a NVIDIA não tinha uma GeForce com consumo nominal menor que uma Radeon. Isso só foi possível graças à mudança empregada na arquitetura, além, é claro, do refinamento no processo de fabricação dos chips grÁficos, ao utilizar a litografia em 28nm.

Com toda a expectativa gerada em torno da linha Kepler, a pergunta que não quer calar é: serÁ a GeForce GTX 680 "tudo isso" em relação à Radeon HD 7970? Bem, para responder a essa pergunta, nada melhor do que acompanhar na íntegra a nossa anÁlise da nova "queridinha" da NVIDIA.

{break::Arquitetura GK104}A linha Fermi (que deu origem as GeForces da série 400 e 500) foi, sem dúvida para a NVIDIA, o passo à frente mais significativo em termos de avanço na macro-arquitetura das GPUs desde o lançamento da primeira G80 (8800 GTX) lançada no final de 2006, inaugurando o que se conhece muito bem hoje do conceito de grÁficos unificados e computação paralela conjugada MIMD (Múltiplas Instruções, Múltiplos Dados).

Com a Fermi, os engenheiros da NVIDIA empregaram todo o seu conhecimento adquirido ao longo das duas últimas gerações, bem como todos os aplicativos, e desenvolveram uma abordagem totalmente nova de design para criar a primeira GPU computacional do mundo. A arquitetura era baseada em pipelines de geometria paralela otimizadas para o Tessellation e para o mapeamento de deslocamento, bem como para uma nova arquitetura computacional que oferecia mais velocidade na troca de contexto e aprimoramento no desempenho para operações atômicas.

JÁ a Kepler, encabeçada pelo GK104 (presente na GTX 680) – embora construída a partir dos alicerces da Fermi – parece dar um passo adiante na evolução dos chips grÁficos da NVIDIA, ao focar na otimização e eficiência de recursos.

A nova geração de GPUs é composta de inúmeros blocos de hardware distintos, cada um especializado em tarefas específicas. Entretanto, o GPC (Graphics Processing Clusters) continua a ser o bloco de hardware de alto nível dominante na arquitetura Kepler, com recursos dedicados para a computação geral, rasterização, sombreamento e texturização. Em outras palavras, quase todas a funções de processamento grÁfico de um núcleo da GPU estão contidas no GPC.


Como pode ser visto acima na estrutura de processamento da Kepler, hÁ um grande bloco chamado pela NVIDIA de "Gigathread Engine", composto de quatro GPCs, quatro controladores de memória, partições ROPs e cache L2. Vale ressaltar que cada GPC, que são na realidade grandes unidades de processamento e se comportam como mini GPUs independentes, possui duas unidades da nova geração de Streaming Multiprocessors, chamados agora pela companhia de SMX (até então a companhia havia batizado os multiprocessadores de Streaming de SM). Diferentemente das duas gerações passadas (GF10x e GF11x), em que cada SM continha 32 CUDA Cores, os SMX da GK104 (assim como suas variantes) possuem nada menos do que impressionantes 192 CUDA Cores! Desta forma, a NVIDIA chega ao número "mÁgico" de 1536 CUDA Cores (4 GPCs x 2 SMXs x 192 CUDA Cores).

Outra mudança visível na comparação entre as arquiteturas da Fermi e Kepler, estÁ na quantidade mÁxima de controladores de memória. Ao invés de seis blocos de 64 bits, hÁ "apenas" quatro, totalizando assim um bus de 256 bits (4 blocos x 64 bits) para a GK104 contra 384 bits das GF100 e GF110.

Em relação à quantidade de unidades de rasterização, a GK104 possui um total de 32 ROPs, contra 48 ROPs das GF100 e GF110. Essa diferenciação só foi possível em virtude dessas unidades estarem arranjadas em um bloco funcional separado do SMX. Assim, enquanto a linha Fermi possui seis blocos rasterizadores, cada um composto por oito ROPs – totalizando 48 ROPs (6 blocos x 8 ROPs), a GK104 possui "apenas" quatro blocos, explicando-se assim a quantidade de 32 ROPs (4 blocos x 8 ROPs).

Quanto às unidades de texturização, cada SMX é composto por 16 TMUs, o dobro do número de TMUs presentes no Streaming Multiprocessor da geração Fermi. Com um total de oito SMX (4 GPCs x 2 SMXs), a GK104 tem, portanto, um total de 128 unidades de texturização (8 SMXs x 16 TMUs), contra 64 TMUs da GF110 (16 SM x 4 TMUs).

Por dentro do SMX
Talvez a grande novidade presente na arquitetura Kepler seja a nova geração dos Streaming Multiprocessors, batizado pela NVIDIA de SMX. Além de disponibilizar um desempenho muito maior que o antigo SM da linha Fermi, cada multiprocessador de Streaming consome agora significativamente menos energia em relação à arquitetura anterior.

As principais unidades de hardware responsÁveis pelo processamento do GK104 estão inseridas dentro da estrutura do SMX, como é o caso dos CUDA Cores, que lidam, entre outros pontos, com o processamento dos vértices, pixels e da geometria, bem como os cÁlculos computacionais e de física.

Além disso, é aí que se encontram as unidades de texturização que lidam com a filtragem das texturas, com o carregamento/armazenamento das unidades de busca (units fetch) e pelo salvamento dos dados na memória.


Olhando para a imagem acima, podemos ver que os 192 CUDA Cores foram "empacotados" juntos com 64KB de memória cache dedicada que alterna entre os modos 48KB/16KB ou 16KB/48KB para toda a memória compartilhada e cache L1. Essa comutação dinâmica auxilia os desenvolvedores de jogos a otimizar a performance de seus games, em virtude da arquitetura ser bastante flexível. A GPU tem ainda à disposição 512KB de cache L2.

Além disso, hÁ ainda as unidades Warp Scheduler e Master Dispatch que se alimentam de arquivos de registros (Register Files) imensos (65.536 entradas de 32-bits – o arquivo de registro pode aceitar formatos diferentes ou seja, 8-bit, 16-bit, etc). O cluster SMX possui ainda oito TMUs, cache de textura e o mais importante de tudo: PolyMorph Engine 2.0.

As unidades de Polymorph Engine foram introduzidas na Fermi para lidar com uma enorme carga de trabalho advinda das novas tecnologias, como é o caso da API grÁfica DirectX 11. Talvez, a principal delas seja a badalada técnica de aprimoramento da qualidade das imagens, conhecida como Tessellation (Tess), que aumenta de forma quase exponencial a quantidade de triângulos em uma cena, exigindo assim o mÁximo da GPU.

Com a geração Kepler, a NVIDIA aprimorou a Polymorph Engine, ao introduzir a Polymorph Engine 2.0 que, de acordo com a companhia, possibilita o dobro de desempenho do processamento primitivo e de Tessellation por SMX, em relação à Fermi.

A PolyMorph Engine 2.0 lida com os buscadores de vértices, com o tessellation, transformador viewport, configurador de atributo e saída de streaming.

Finalmente, as Unidades de Função Especial, mais conhecidas pela sigla em inglês SFU (Special Function Units) controlam instruções transcendentais e de interpolação grÁfica.

{break::Os recursos da GTX 680}Abaixo, um resumo das principais especificações da GeForce GTX 680.

• 3,54 bilhões de transistores;
• Nova litografia em 28 nm;
• Área do die (estimado): 294mm2;
• Frequência de operação das texturas e ROPs (GPU): 1006MHz;
• 1536 CUDA Cores/shader processors;
• Frequência de operação das memórias: 6008MHz (GDDR5);
• Quantidade de memória: 2GB;
• Interface de memória: 256bits;
• TDP: mÁximo de 195 watts;
• Limiar térmico da GPU em 98° C;
• Suporte às tecnologias: CUDA, DirectX 11.1, GeForce 3D Vision, NVIDIA 3D Vision Surround, Filtros FXAA/TXAA, GPU Boost, Adptive VSync, NVIDIA PhysX,  PureVideo HD Technology, Badaboom, HDMI 1.4a, OpenGL 4.2, OpenCL, DirectCompute, Windows 7.

E ainda:

• Nova Geração do Streaming Multiprocessor (SMX);
• 192 CUDA cores por SMX, 6x mais que a GF110 (GTX 580);
• 8 PolyMorph Engine 2.0;

Conforme jÁ mencionado no tópico anterior, os engenheiros da NVIDIA se superaram no que diz respeito à imensa quantidade de CUDA Cores presentes no GK104. Triplicar o número de núcleos de processamento foi algo tão surreal, que os primeiros rumores que apontavam esse fato foram prontamente taxados por grande parte da comunidade como "fake", por ser algo supostamente impossível de acontecer.

- Continua após a publicidade -

Isso foi possível, em grande parte, pela mudança na arquitetura da geração Kepler. Ao reduzir a quantidade de Streaming Multiprocessor pela metade em relação à Fermi, a NVIDIA conseguiu aumentar a eficiência dos SMXs, na medida em que multiplicou por 6 (de 32 para 192) a quantidade de CUDA Cores em cada cluster de processamento.

AliÁs, a GTX 680 tem vÁrios números que surpreendem até mesmo aos fãs mais apaixonados pela linha GeForce. A frequência de operação é um destes casos. Trata-se da primeira GeForce que sai de fÁbrica, por padrão, com GPU trabalhando na casa dos gigahertz, mais precisamente 1,006Ghz, ou 1006Mhz (30% acima dos 772Mhz da GTX 580). O clock da memória é outro exemplo da força dos números da VGA. Com 6008Mhz (50% mais veloz que a GTX 580), é a primeira vez, desde a introdução das ultra rÁpidas GDDR5, que uma GeForce tem VRAM mais rÁpida que uma Radeon.

Outro número taxado como "algo sem fundamento" – e que se mostrou verdadeiro, foi a dissipação térmica (TDP). Apesar dos 3,54 bilhões de transistores (18% a mais que a GTX 580), 1536 CUDA Cores (200% a mais que a GTX 580) e clocks extremamente elevados para o segmento, a GeForce GTX 680 possui TDP mÁximo de 195W! Trata-se de um valor extremamente surpreendente, ainda mais em comparação aos 244W da GTX 580. De quebra, é a primeira vez em muitos anos que uma GeForce de alto desempenho apresenta uma dissipação térmica nominal menor que uma Radeon concorrente. Ou seja, a GTX 680 enterra de vez qualquer resquício de que as placas da NVIDIA são "beberronas" em termos de consumo de energia.

Vale mencionar que, para suprir os 195W, a companhia disponibilizou uma configuração inédita na indústria, ao disponibilizar dois conectores de energia de seis pinos (suprindo assim 150W, além dos 75W adicionais do PCI Express), ao invés do tradicional modelo 6+8 pinos. Com isso, reduz-se a necessidade da utilização de adaptadores (o que não é recomendÁvel), além de aumentar o espectro de fontes (PSUs) compatíveis com a placa. De acordo com a NVIDIA, é recomendado o uso de uma fonte real de 550W.

Fechando os "números mÁgicos" da GTX 680 – e que mais uma vez foi alvo de ceticismo por grande parte do mercado – temos a Área do die do chip grÁfico GK104. Com 294 mm² (contra 520mm² da GTX 580), trata-se de algo surpreendente – mais uma vez – se levarmos em conta sobretudo a quantidade de CUDA Cores e transistores.

É bom que se diga que grande parte destes "números mÁgicos" se devem à reengenharia por que passou a arquitetura Fermi – dando origem à Kepler, além, é claro, do refinamento no processo de fabricação em 28nm.

{break::As novidades da Kepler}Conforme jÁ mencionado no decorrer desta anÁlise, a nova geração Kepler trouxe gratas surpresas para os usuÁrios. Algumas, exclusivas, como é o caso dos novos filtros FXAA e TXAA, do GPU Boost, Adptive VSync e 3D Vision Surround com apenas uma VGA. Outras são comuns às demais placas de nova geração, com o é o caso do suporte ao DirectX 11.1 e do PCI Express 3.0. Detalharemos a seguir tais novidades.

DirectX 11.1
Apesar do suporte à mais recente API GrÁfica da Microsoft ter sempre sido motivo de destaque no marketing das companhias, ao que parece, a NVIDIA não estÁ tão empolgada com tal fato. Tanto que, apesar de a arquitetura Kepler suportar o  DirectX 11.1, John Danskin, vice-presidente de arquitetura de GPU da NVIDIA, soltou a seguinte frase durante o NVIDIA Editor's Day em São Francisco (evento super seleto, fechado a um restrito grupo de jornalistas de vÁrias partes do mundo – e coberto pelo Adrenaline): "Sim, [a GeForce GTX 680] serÁ compatível com DirectX 11.1, mas... quem se importa?"

Provavelmente o que o executivo quis dizer foi que a atualização da API GrÁfica da Microsoft não trarÁ tantas melhorias grÁficas; e mais ainda: deverÁ demorar até que o DX11.1 seja adotado amplamente pelos games – assim como o próprio DX11. Até que isso ocorra, é provÁvel que as GeForces da série 700 ou mesmo 800 jÁ tenha sido lançadas.

Outro ponto é que, até o Windows 8 chegar, tal recurso ficarÁ apenas no papel. Ainda assim, as principais novidades do DX11.1 serão:

• Rasterização independente de objeto;
• Interoperabilidade flexível entre computação grÁfica e vídeo;
• Suporte nativo ao Stereo 3D.

PCIe Gen 3
Na medida em que novas gerações de placas chegavam ao mercado, foi gerado um temor nos analistas de que o padrão de interface de comunicação PCI Express chegaria a um ponto em que não conseguiria dar mais vazão ao fluxo de dados com a intensidade necessÁria, criando assim um verdadeiro gargalo para o desempenho da VGA.

Este temor, contudo, se diluiu, com o recente anúncio da geração 3 do PCIe, que dobrou a taxa de transferência em relação ao PCIe Gen 2, garantindo tranquilidade para as futuras placas 3D.

Com o novo patamar de desempenho advindo da geração Kepler, a NVIDIA garantiu o suporte ao PCI Express 3.0 nas GeForces série 600, encerrando qualquer tipo de temor em relação a gargalo de desempenho.

Com o PCIe Gen 3, a largura de banda saltou de 16GB/s para 32GB/. JÁ nas placas acessórias instaladas, o ganho saiu de 500MB/s para 1GB/s por pista/linha. Assim, os dispositivos que utilizam a configuração x16 podem utilizar de 16GB/s, ou 128Gbps. Vale ressaltar, contudo, que para se beneficiar do PCI Express 3.0 o usuÁrio deverÁ ter um sistema totalmente preparado e compatível com tal recurso. Assim, além de uma VGA PCIe Gen 3.0, tanto a placa-mãe quanto o processador deverão suportar a novidade.

GPU Boost

Exclusivo das GeForces, trata-se da tecnologia combinada de harware com software de ajuste dinâmico nos clocks.

Semelhante ao Turbo Boost da Intel e ao TurboCore da AMD, o GPU Boost tem como objetivo disponibilizar a quantidade de megahertz necessÁria para o bom funcionamento das tarefas, a depender, claro, de certas condições, como consumo de energia e temperatura da GPU.

Com a Kepler, hÁ agora os conceitos de clocks base (base clock) e clock de impulso (boost clock). Dessa forma, a placa opera por padrão em 1006Mhz, podendo ir a 1058Mhz (overclock de 5%) quando for preciso um maior poder de processamento (como a renderização de grÁficos complexos), desde, claro, que haja condições para isso (TDP e temperatura abaixo do mÁximo permitido). Em outras palavras, a tecnologia utiliza a diferença entre o consumo atual (varia de acordo com o software executado) e o TDP mÁximo da placa, para alavancar o clock base e aumentar a performance, chegando assim ao patamar que a NVIDIA denominou de "boost clock".

- Continua após a publicidade -


(Algoritmo de execução do GPU Boost)


Em alguns casos, esse upgrade dinâmico pode superar em até 10% o clock base da GeForce, ou seja, ultrapassar 1,1Ghz, desde, novamente, que haja condições para isso. O mais bacana é que, se você for um overclocker por natureza e quiser elevar ainda mais o desempenho via overclock tradicional, o GPU Boost continuarÁ funcionando mesmo com a placa overclockada, variando os clocks para cima e para baixo da mesma forma que em VGAs com clocks default.


(Cada jogo utiliza uma quantidade específica de energia da VGA.
O GPU Boost monitora o consumo de energia em tempo real e aumenta o clock da GPU quando hÁ condições disponíveis.)


Entretanto, caso o usuÁrio esteja realizando tarefas triviais, como, por exemplo, surfando na web, ou utilizando uma suíte de escritório, o GPU Boost reduz automaticamente a frequência de operação do chip grÁfico para economizar energia. Além de dar uma "ajudinha" no bolso do usuÁrio no final do mês com a conta de energia, a tecnologia é particularmente interessante para o mundo dos portÁteis, onde qualquer otimização na autonomia da bateria é bem vinda.

FXAA

Embora não seja um filtro de Anti-Aliasing (antisserrilhado) inédito, a NVIDIA aprimorou o FXAA (Fast Approximate Anti-Aliasing) na nova geração Kepler.

Semelhante ao MLAA (Morphological Anti-Aliasing, ou Antisserrilhamento Morfológico) empregado pela AMD nas novas Radeons, o FXAA é uma técnica de pós-processamento, isto é, que aplica o filtro de anti-aliasing na imagem após esta ter sido gerada pela GPU. Isso é bastante vantajoso, haja vista que alivia a carga de trabalho da unidade de processamento grÁfico. Vale destacar que o FXAA é aplicado junto com outras técnicas de pós-processamento, como é o caso do motion blur e do bloom.

Com a chegada da Kepler, a NVIDIA passou a adotar o FXAA via driver (geração R300), possibilitando a utilização do filtro em centenas de jogos. Outro destaque do Fast Approximate Anti-Aliasing sobre o Morphological Anti-Aliasing estÁ no ganho de desempenho, chegando a ser 60% mais veloz que o MSAA em 4X.

Um fato que chamou bastante a atenção da comunidade foi a apresentação do Samaritan Demo (demonstração de um vídeo da Epic que ressalta o poderio grÁfico do DirectX da Unreal Engine) na Game Devolpers Conference – GDC 2011. Na ocasião, a Epic necessitou de três GeForces GTX 580 para rodar o demo a contento. Passado um ano, ou seja, na GDC 2012, a Epic fez uma nova apresentação do Samaritan Demo. Contudo, para a surpresa de todos, foi necessÁrio apenas uma GeForce GTX 680 e a utilização do FXAA para "dar conta do recado".



Para ver um comparativo mais apurado dos benefícios do filtro, clique aqui.

TXAA
Considerado pela NVIDIA como a próxima geração de filtros de antisserilhamento (responsÁvel pela geração do próximo nível em termos de qualidade de imagem), o TXAA (Temporal Anti-aliasing) promete disponibilizar muito mais qualidade e performance se comparado com o MSAA.

Segundo a companhia, o antisserilhamento temporal foi criado com o objeto de explorar toda a capacidade de processamento de texturas da geração Kepler (mais especificamente da GTX 680).

O TXAA é um misto de anti-aliasing de hardware com filme GC estilo AA, e para o caso do filtro em 2X, um componente temporal opcional é empregado, para melhorar a qualidade da imagem.

O filtro de Temporal Anti-aliasing estÁ disponível em dois modos: TXAA1 e TXAA2. De acordo com a NVIDIA, o TXAA1 oferece uma qualidade grÁfica superior ao MSAA em 8X, com gasto de processamento semelhante ao MSAA em 2X. JÁ o TXAA2 permite uma qualidade das imagens superior ao TXAA1, com performance comparÁvel ao MSAA em 4X.

Inicialmente o filtro antisserilhamento temporal serÁ implementado diretamente na engine de alguns dos principais jogos da futura geração. Até o momento, a Epic Games, com a sua badalada Unreal Engine Technology 4, e a Crytek, são dois dos principais estúdios que jÁ estão desenvolvendo games com o novo filtro da NVIDIA.


Adptive VSync

O sincronismo vertical – V-Sync foi projetado para lidar com os chamados artefatos fora de sincronismo ou artefatos trepidantes (tearing artifacts ), que podem ocorrer quando a quantidade de FPS é bem superior à taxa de atualização (refresh rate) do monitor, e que além de causarem um desconforto visual, prejudicam a jogabilidade do usuÁrio. Embora seja raro, é possível ainda que o fenômeno aconteça na situação inversa ao mencionado acima, ou seja, quando os FPS são bem menores que a taxa de atualização da tela.

- Continua após a publicidade -

(Tearing artifacts)

Apesar de criado com o intuito de acabar (ou amenizar) com os tearing artifacts, o V-Sync gerou outro problema: a perda de frames (stuttering), também conhecido como "lag". Isso ocorre quando os FPS caem para menos de 60 quadros por segundo, ocasionando a redução do V-Sync para 30Hz (e demais quocientes de 60, como 20Hz ou 15Hz).


(Problema de sincronismo vertical - VSync)


Como forma de enfrentar esse desafio, os engenheiros de software da NVIDIA criaram o Adptive V-Sync. Presente na geração de drivers R300 da companhia, a tecnologia dinamicamente liga e desliga o sincronismo vertical, de forma a gerar FPS mais regulares e cadenciados, o que minimiza os lags nos games e previne a mÁ sincronização das imagens.

Mais especificamente, quando a taxa de quadros por segundo cai para menos de 60 FPS, o Adptive V-Sync entra em cena e desliga o sincronismo vertical, possibilitando que os frame rates funcionem em sua taxa natural, o que reduz as chances de ocorrer lag. Quando os FPS voltam para 60 quadros por segundo, o Adptive V-Sync atua novamente ao ligar o sincronismo vertical, reduzindo a possibilidade de ocorrerem artefatos fora de sincronismo.


(Adptive V-Sync em funcionamento)

NVENC
A NVIDIA introduziu em todas das VGAs da linha Kepler o NVENC, novo vídeo encoder para o padrão H.264.

Antes do NVENC, as GeForces utilizavam o Badaboom (mais detalhes na próxima seção), que utiliza do poder dos CUDA Cores para a conversão de diferentes formatos de streaming multimídia. Se, por um lado, esse recurso tem a grande vantagem de desafogar o processador e acelerar o processo, por outro, tem o ponto fraco de aumentar o consumo de energia da placa durante a conversão.

Para resolver essa questão, a NVIDIA criou o NVENC, que utiliza um circuito especializado para o "encodamento" H.264. Vale destacar que tal circuito é quase quatro vezes mais veloz que o encoder via CUDA Cores, além de consumir consideravelmente menos energia que o Badaboom.

O NVENC é capaz de lidar com as seguintes situações:

- Encodar vídeos em fullHD (1080p) com velocidade até oito vezes maior que em tempo real. De acordo com a companhia, em modo de alta performance, o NVENC é capaz de encodar um vídeo de 16 minutos em 1080p @ 30 FPS em apenas dois minutos;

- Suporte ao padrão H.264 nos níveis de profile 4.1 Base, Main e High (mesmo que o padrão Blu-Ray);

- Suporte ao MVC (Multiview Video Coding) para vídeos estereoscópicos – extensão do H.264 para o padrão Blu-Ray 3D;

- "Encodamento" para resolução de até 4096x4096 pixels.

É bom que se diga que, além da transcodificação, o NVENC é útil para edição de vídeos, telas do tipo wireless (sem fio) e aplicações de vídeo conferência.

{break::Outras tecnologias}CUDA
Trata-se da abreviação para Compute Unified Device Architecture (em tradução livre: Arquitetura de Dispositivo Unificado de Computação). Em outras palavras, CUDA é o nome dado pela NVIDIA para designar a arquitetura de computação paralela mais conhecida como GPGPU (general-purpose computing on graphics processing units).

Sem maiores complicações ou termos técnicos, trata-se da tecnologia na qual se utiliza uma GPU (chip grÁfico) para realizar uma tarefa comumente executada por um processador (CPU). Isso só é possível graças à adição de estÁgios programÁveis e da aritmética de maior precisão contidas nos canais de processamento da GPU, que permite que os desenvolvedores de programas utilizem o processamento de fluxo de dados para dados não grÁficos.

Apresentada inicialmente em 2007, a tecnologia CUDA estÁ presente em uma vasta gama de chips da NVIDIA, tais como nas GPUs de classe científica Tesla, nas profissionais Quadro, além, é claro, das GeForces desde a geração G8x.

De acordo com vÁrios experts no assunto, a grande vantagem de utilizar uma GPU ao invés de uma CPU para realizar tarefas do cotidiano estÁ na arquitetura por trÁs do chip grÁfico, massivamente focado na computação paralela, graças à imensa quantidade de cores/núcleos. Eles são, portanto, capazes de rodar milhares de threads simultaneamente. Dessa forma, aplicações voltadas para a biologia, física, simulações, criptografia, entre outras, terão um benefício muito maior com a tecnologia GPGPU/CUDA.

No campo dos games, a renderização dos grÁficos torna-se muito mais eficiente com a Compute Unified Device Architecture, como por exemplo, nos cÁlculos dos efeitos da física (como é o caso da fumaça, fogo, fluidos...)

Atualmente, é o processo de GPGPU mais difundido no mercado, com mais de 100 milhões de placas compatíveis.

PhysX
Embora seja uma das grandes "vedetes" dos games modernos, a tecnologia de processamento da física é uma tecnologia que jÁ vem de alguns anos.

Lançada inicialmente em 2005 pela então AGEIA, com a sua famigerada PPU (Physics Processing Unit – um tipo de chip exclusivo para o processamento da física), a iniciativa nunca chegou a decolar em virtude de seu alto custo para a época, apesar de toda a promessa por trÁs da tecnologia.

Contudo, a NVIDIA enxergou na PPU da AGEIA uma imensa oportunidade pela frente. Tanto foi que, em 2008, anunciou para o mercado a compra da companhia, bem como de seu bem mais precioso: a tecnologia PhysX. Assim, a NVIDIA passou a incorporar os benefícios da PPU dentro de suas GPUs.

Muito bem, mas o que vem a ser exatamente o tal cÁlculo da física presente no PhysX? Trata-se da técnica na qual o chip grÁfico realiza uma série de tarefas específicas em um game, tornando-o mais realista para o jogador ao adicionar ambientes físicos vibrantes, de imersão total.

A física é o próximo passo na evolução dos jogos. Diz respeito à forma como os objetos se movimentam, interagem e reagem ao ambiente que os cerca. Em muitos dos jogos atuais, sem física, os objetos não parecem se mover da forma desejada ou esperada na vida real. Hoje em dia, a maior parte da ação se limita a animações pré-fabricadas, que são acionadas por eventos do próprio jogo, como um tiro que acerta a parede. Até as armas mais pesadas produzem pouco mais que uma pequena marca nas paredes mais finas, e todos os inimigos atingidos caem da mesma forma jÁ programada. Para os praticantes, os jogos são bons, mas falta o realismo necessÁrio para produzir a verdadeira sensação de imersão.

Em conjunto com as GPUs GeForce habilitadas para a CUDA, o PhysX oferece a potência computacional necessÁria para produzir a física avançada e realista nos jogos de próxima geração, deixando para trÁs os efeitos de animação pré-fabricados.

É através do cÁlculo da física que, por exemplo, uma explosão parece mais real para o usuÁrio, uma vez que se pode gerar um verdadeiro "efeito dominó" por trÁs desse evento. Assim, é possível adicionar uma série de elementos para a cena, como é o caso de estilhaços, e não mais apenas o fogo e a fumaça.

O PhysX é responsÁvel, entre outras funções, por processar as seguintes tarefas em um game:

• Explosões com efeitos de poeira e destroços;
• Personagens com geometrias complexas e articuladas para permitir movimentação e interação mais realistas;
• Novos e incríveis efeitos nos efeitos dos disparos de armas;
• Tecidos que se enrugam e rasgam naturalmente;
• Fumaça e névoa formadas em torno de objetos em movimento.

(Vídeo de Batman Arkham Asylum, que compara o game com e sem o PhysX)

3D Vision Surround
Lançado no início de 2009 durante a Consumer Electronic Show (CES) em Las Vegas, Estados Unidos, o 3D Vision foi de início motivo de certa desconfiança por parte da comunidade. A razão nada teve a ver com a tecnologia em si (muito boa por sinal), mas sim por experiências nada bem sucedidas de outras empresas no passado.

Antes do 3D Vision, basicamente a sensação de imagens tridimensionais era (e na maioria dos casos ainda é) feita por óculos anaglíficos (famosos por suas lentes na cor azul e vermelha), ou por lentes mais elaboradas com LCD (aos moldes dos óculos presentes no Master System), mas que pecavam por suas limitações técnicas. Era esse o caso das televisões e monitores de CRT (tubo) que causavam dores de cabeça com o uso prolongado ou de LCDs com baixa taxa de atualização (refresh rate).

Contudo, a NVIDIA lançou um produto sem impedimentos técnicos, aproveitando-se da nova geração das telas de cristal líquido, com nada mais nada menos do que 120Hz (60Hz para cada olho humano).

Não basta apenas comprar o kit e um monitor especial e sair usufruindo da tecnologia. É preciso que o jogo tenha suporte a imagens em três dimensões. Dessa forma, o driver ForceWare reconhece a compatibilidade e entra em ação, acionando o 3D Vision e alternando os frames para o lado esquerdo e direito do óculos a cada atualização de imagem (técnica conhecida como multiplexação sequencial de tempo). Utilizando-se dos dados contidos na engine Z-buffer, o programa é capaz de criar uma representação 3D do game, ao invés de apenas duplicar e compensar a imagem para criar o efeito, como faz, por exemplo, o monitor Triton da Zalman, dinamicamente alternando a profundidade e então a distância dos objetos no game.

Foi uma ação extremamente ambiciosa e ousada da NVIDIA, jÁ que ela teve que contar com o apoio das produtoras para disponibilizar cada vez mais títulos compatíveis com a tecnologia. Porém, para a felicidade da gigante das GPUs, a companhia dispõe do programa "The Way It's Meant To Be Played", em que atua em conjunto com diversos estúdios dando o suporte para o desenvolvimento de novos jogos.

Vale ressaltar que a tecnologia não estÁ limitada apenas aos games. É possível, por exemplo, desfrutar de imagens e vídeos em três dimensões.

Utilizado em conjunto com as GPUs GeForce, o 3D Vision consiste nos seguintes componentes:

• Óculos Sem Fio 3D Estereoscópico Ativo - Projetado com lentes especiais, oferece o dobro de resolução por olho e ângulo de visão superior, em comparação com os óculos passivos. Parecidos com os óculos de sol, são uma alternativa aos tradicionais óculos 3D de papel e plÁstico.

• Emissor Infravermelho de alta potência (porta USB) - Transmite dados diretamente para os óculos 3D, a uma distância de até seis metros, além de possuir um controle de ajuste em tempo real.

• Monitores Ultra-Flexíveis - Projetado para os monitores LCD de 120Hz, o 3D Vision produz imagens 3D estereoscópicas nítidas em soluções de todos os tipos. 

• Softwares de Compatibilidade - Softwares da NVIDIA convertem automaticamente mais de 300 jogos para o formato 3D Stereo, sem a necessidade de patches ou atualizações. O 3D Vision também é a única solução 3D a suportar as tecnologias SLI e PhysX.

• Visualizador 3D - Inclui também um visualizador 3D Vision gratuito que permite a captura de screenshots e sua posterior visualização em 3D. Também é possível importar fotos e vídeos 3D de diversas outras fontes, como galerias de fotos da Internet.


(Kris Rey da NVIDIA jogando Skyrim em 3 monitores,
enquanto acessa o portal GeForce.com para acessar o guia de otimização do jogo para a VGA)


O passo seguinte no avanço da tecnologia 3D foi o lançamento do 3D Vision Surround (imagem acima), que possibilitou utilizar até três monitores simultâneos, formando assim uma ampla Área de visualização em três dimensões.

Com a chegada da linha Kepler (mais especificamente da GeForce GTX 680), a NVIDIA aprimora ainda mais o 3D Vision Surround, ao permitir o uso da tecnologia com o uso de apenas uma GPU da nova geração, barateando consideravelmente o investimento necessÁrio para se jogar em 3D com múltiplos monitores.

SLI
Antes de iniciarmos a falar da tecnologia SLI, é preciso voltar no tempo. Em 1998, em uma época em que Radeons e GeForces eram meras coadjuvantes, havia uma Rainha das Placas 3D: a Voodoo 2 da então 3Dfx. A placa tinha como destaque o suporte ao SLI (Scan Line Interleaving), que possibilitou colocar duas VGAs PCI (não confundir com o atual PCIe) Voodoo 2 para renderizar os grÁficos em regime de cooperação, dividindo as linhas de varredura em pares e ímpares, sendo que cada uma das placas ficava encarregada de processar um tipo de linha. Como resultado, o ganho de performance foi imenso para a época.

Sendo assim, o objetivo da tecbnologia SLI presente tanto na antiga Voodoo 2 quanto nas modernas GeForces é o mesmo: unir duas ou mais placas de vídeo em conjunto para produzir uma única saída. Trata-se, portanto, de uma aplicação de processamento paralelo para computação grÁfica, destinada a aumentar o poder de processamento disponível nas placas 3D.

Depois de comprar a 3Dfx em 2001, a NVIDIA adquiriu a tecnologia, mas deixou-a "engavetada" até 2004, quando a reintroduziu com o nome de Scalable Link Interface. Contudo, a tecnologia por trÁs do nome SLI mudou dramaticamente.

Enquanto o modo SLI original dividia as linhas da tela (scan-lines) entre as placas — uma renderizava as linhas horizontais pares, enquanto a outra renderizava as ímpares — o modo SLI adotado pela NVIDIA (e também no CrossFire da ATI) separa o processamento por partes da tela (split frame rendering) ou em quadros alternados (alternate frame rendering). Abaixo, maiores detalhes dos métodos:

• SFR (Split Frame Rendering ou Renderização por Divisão de Quadros)

Trata-se do método em que se analisa a imagem processada a fim de dividir a carga de trabalho em duas partes iguais entre as GPUs. Para isso, o frame/quadro é dividido horizontalmente em vÁrias proporções, dependendo da geometria. Vale destacar que o SFR não escalona a geometria ou trabalho tão bem como no AFR. Esse é o modo padrão usado pela configuração SLI usando duas placas de vídeo.

• AFR (Alternate Frame Rendering ou Renderização Alternada de Quadros)

Aqui, cada GPU renderiza frames/quadros inteiros em sequência - uma trabalhando com os frames ímpares e outra responsÁvel pelos pares, um após o outro. Quando a placa escrava/secundÁria finaliza o processo de um quadro (ou parte dele), os resultados são enviados através da ponte SLI para a VGA principal, que então mostra o frame por completo. Esse é o modo utilizado normalmente pelo Tri-SLI.

• AFR de SFR

Como o próprio nome sugere, trata-se do método híbrido, no qual os dois processos descritos acima são utilizados. Dessa forma, duas GPUs processam o primeiro quadro via SFR, enquanto as outras duas renderizam o frame seguinte também em SFR. Como é possível perceber, é necessÁrio, portanto, de quatro placas 3D, em um conjunto chamado Quad-SLI.

• SLI Antialiasing

Esse é um modo de renderização independente voltado para a melhoria da imagem, que oferece até o dobro do desempenho com o filtro antialiasing (para retirar o efeito serrilhado) ativado, através da divisão da carga de trabalho entre as duas placas de vídeo. Enquanto com uma placa é possível normalmente utilizar até 8X de filtro antialiasing, com esse método ativado pode-se chegar a 16X, 32X ou mesmo a 64X via Quad-SLI.

Assim como com o CrossFire, é preciso possuir uma placa mãe com slot PCI Express x16. Na verdade, pelo menos dois, ou ainda com três ou quatro, para Tri-SLI ou Quad-SLI. Como a comunicação entre as placas é realizada via ponte SLI (conector dedicado que ligas as VGAs) e não pelo slot PCIe, não hÁ grandes problemas em utilizar o PCI Express na configuração x8.

Atualmente, não hÁ restrição quando aos tipos de placas a serem utilizadas no SLI, bastando apenas que elas possuam o mesmo chip grÁfico. No início, a tecnologia restringia o uso a VGAs idênticas, do mesmo fabricante e, em alguns casos, com a mesma versão da BIOS! Felizmente, hoje isso é coisa do passado.

PureVideo

Trata-se do recurso de otimização de imagem e decodificação por hardware de vídeos nos formatos WMV, WMV-HD, MPEG4, DVD e HD-DVD, tendo ainda como vantagem o fato de desafogar a CPU do oneroso trabalho, transferindo a tarefa para a GPU. Dessa forma, o usuÁrio poderÁ ainda utilizar o computador para executar outras tarefas, como por exemplo, navegar pela web.

O PureVideo possui os seguintes recursos:

• Aceleração MPEG-2 de alta definição por hardware: Um processador dedicado de 16 vias proporciona fluência na reprodução de vídeo de alta definição (HD) com o mínimo uso da CPU;
• Aceleração WMV de Alta Definição por hardware: Suporte programÁvel ao novo formato disponível no Windows Media Player e no Windows XP MCE 2005, proporcionando fluidez na reprodução de vídeos WMV e WMV-HD;
• Gravação de vídeos em tempo real de alta qualidade: Uma avançada engine de compensação possibilita gravação em tempo real sem perda de qualidade;
• Desentrelaçamento temporal/espacial adaptÁvel: Permite assistir a conteúdo entrelaçado provindo de satélite, cabo e DVD nos mínimos detalhes sem serrilhados ou artefatos;
• 3:2 Correção "Pull-down" e Correção "Bad Edit": Restaura o filme ao seu formato original de 24 fps, evitando "fantasmas" e "trepidações" durante a reprodução;
• Flicker-free Multi-Steam Scaling: Mantém a qualidade de imagem aumentando ou diminuindo a Área da tela de reprodução;
• Display Gamma Correction: Detecção automÁtica de formato que ajusta a qualidade de cor na reprodução para que não seja muito escuro ou claro demais, independentemente da tela.

Badaboom

Trata-se da tecnologia utilizada para a conversão de diferentes formatos de streaming multimídia para utilização em outros meios. A grande diferença do Badaboom para a grande maioria dos outros programas existentes no mercado é que, enquanto seus concorrentes utilizam o processador para executar a tarefa, a solução da NVIDIA faz uso de outra tecnologia, a CUDA, ou seja, da GPU. Desta forma, o processo é realizado de forma muito mais rÁpida e eficiente.

Outro benefício é que, ao deixar a CPU livre, o usuÁrio poderÁ realizar outras atividades, como por exemplo, navegar pela a web. Na conversão tradicional via processador, a mÁquina fica praticamente inoperante para outras tarefas.

{break::Fotos}Como podemos ver, o layout da GeForce GTX 680 não muda muito em relação à geração passada, com design bem parecido. O FAN continua posicionado no lado direito.

A maior mudança estÁ nos conectores de energia, que agora passam a ficar sobrepostos. Para evitar que um trave o outro, a NVIDIA deixou um espaço entre eles, possibilitando pressionar a presilha que faz o encaixe de segurança.

Abaixo temos algumas fotos da placa sem a base protetora do cooler, que pode ser removida facilmente visando tornar mais simples a limpeza interna.

O sistema usado no modelo de referência é o mesmo empregado na GTX 580, no qual a GPU é resfriada através da tecnologia Vapor Chamber (VCT). O príncipio do VCT é relativamente simples: o calor emanado pela GPU aquece o fluido dentro da zona de vaporização, fazendo-o evaporar. O vapor do fluido se move através do vÁcuo até que se choque com a zona de condensação. Nesse estÁgio, o vapor se condensa, voltando ao seu estÁgio inicial líquido (liberando o calor no processo). O fluido é então absorvido pela zona de transporte (por meio do processo de capilaridade), onde é então levado de volta para o ponto inicial do processo, a zona de vaporização, fechando o ciclo para então ser repetido.

Para finalizar, algumas fotos com as placas GTX 590, GTX 680 e GTX 580, todas modelos referência da NVIDIA. Reparem que a GTX 680 (a menor) teve PCB reduzido frente à GTX 580.

Em se tratando de conexões, são duas DVI, uma HDMI e uma DisplayPort. 

{break::MÁquina/Softwares utilizados}Como de constume, utilizamos uma mÁquina TOP de linha baseada em um processador Intel Core i7 3960X overclockado para 4.6GHz.

As placas utilizadas nos comparativos foram - além da VGA analisada - por parte da NVIDIA, GeForce GTX 590, GTX 580, MSI 580GTX Lightning e GTX 570. JÁ os modelos com chip AMD foram a ASUS HD 7970, XFX HD 7950 BE DD, HiS Radeon HD 6990, XFX Radeon HD 6970 e XFX Radeon HD 6950.

Abaixo, fotos do sistema montado com a GTX 680.

A seguir, os detalhes da mÁquina, sistema operacional, drivers, configurações de drivers e softwares/games utilizados nos testes.

MÁquina utilizada nos testes:
- Mainboard MSI Big Bang XPower II
- Processador Intel Core i7 3960X @ 4.6GHz
- Memórias 16 GB DDR3-1600MHz Corsair
- HD 1TB Sata2 Western Digital Black
- Fonte XFX ProSeries 1000W
- Cooler Master Hyper 212 EVO

Sistema Operacional e Drivers
- Windows 7 64 Bits 
- Intel INF 9.2.0.1030
- Catalyst 12.2 WHQL: Placas AMD 
- GeForce 296.10 WHQL: Placas Nvidia, exceto GTX 680
- GeForce 300.99 BETA: GTX 680
- GeForce 301.10 WHQL - GTX 680 (adicionado em 23/03)

Configurações de Drivers
3DMark 
- Anisotropic filtering: OFF 
- Antialiasing - mode: OFF 
- Vertical sync: OFF 
- Demais opções em Default

Games: 
- Anisotropic filtering: Variado através do game testado 
- Antialiasing - mode: Variado através do game testado 
- Texture filtering: High-Quality 
- Vertical sync: OFF 
- Demais opções em Default 

Aplicativos/Games
- 3DMark 11 1.0.3 (DX11) 
- Unigine HEAVEN Benchmark 3.0 (DX11)

- Aliens vs Predator (DX11) 
- Batman Arkham City (DX11)
- Crysis Warhead (DX10) 
- Crysis 2 (DX11)
- DiRT 3 (DX11) 
- HAWK 2 (DX11)
- Just Cause 2 (DX10.1) 
- Mafia II (DX9) 
- Metro 2033 (DX11) 

{break::GPU-Z, Temperatura e Consumo de energia}Abaixo temos a tela principal do GPU-Z, mostrando algumas das principais características técnicas da GTX 680.



Tela do eVGA PrecisionX

GPU Boost
Antes dos testes, vejam um vídeo que fizemos demonstrando a tecnologia GPU Boost em ação, reparem na mudança constante do clock e voltagem da placa.

Temperatura
Iniciamos nossa bateria de testes com um bench bastante importante: a temperatura do chip, tanto em modo ocioso como em uso contínuo.

Em modo ocioso (idle), o comportamento da placa é muito bom, ficando com a menor temperatura entre os modelos comparados: 13°C abaixo da GTX 580 referência. O motivo da diferença tão grande estÁ associado ao fato de a GTX 680 ter seu clock reduzido nessa situação, o que gera menos calor.

{benchmark::2702}

Medimos o pico de temperatura durante os testes do 3DMark 11 rodando em modo contínuo. Como podemos ver, a temperatura sobe consideravelmente, mas ainda deixa a placa 4°C abaixo da GTX 580 referência. Isso mostra que, mesmo com os clocks elevados quando a placa estÁ em uso, houve melhora nesse sentido, assim como nas placas da geração 7000 da AMD.

{benchmark::2703}

Consumo de Energia
Também fizemos testes de consumo de energia com todas as placas comparadas. Os testes foram feitos todos em cima da mÁquina utilizada na review, o que da a noção exata do que cada VGA consome.

Em modo ocioso (também conhecido como idle), o consumo de energia da GTX 680 ficou entre os mais baixos com 147 Watts, empatado com a 7970da XFX, mostrando um bom avanço neste quesito fazendo a nova placa da NVIDIA ter o mesmo elogiado consumo da série HD 7000 da AMD.

{benchmark::2737} 

No teste de carga, rodando o 3DMark 11, a GTX 680 ficou 12 Watts acima da HD 7950 e 11Watts abaixo da HD 7970. Em comparação a GTX 580 o consumo ficou 40 Watts mais baixo.

{benchmark::2736}

{break::3DMark 11, Heaven 3.0}Com o 3DMark 11, versão mais recente do aplicativo para testes de desempenho de placas de vídeo mais famoso do mundo. A GTX 680 consegue um score impressionante, ficando muito próxima das duas placas TOP dual-chip da geração anterior.

Podemos ver que a placa tem um ganho considerÁvel sobre a 7970, mais de 1.500 pontos. 

 

Unigine HEAVEN 3.0 - DirectX 11
Trata-se de um dos testes sintéticos mais "descolados" do momento, pois tem como objetivo mensurar a capacidade das placas 3D em suportar os principais recursos da API grÁfica DirectX 11, como é o caso do Tessellation.

O teste foi dividido em duas partes: uma sem e outra com o uso do Tessellation, ambas a 1920x1080 com o filtro de antialiasing em 8x e anisotropic em 16X.

No primeiro teste, com o tessellation desativado, diferente do que aconteceu com o 3DMark 11, a GTX 680 não conseguiu um resultado tão bom. Mesmo com quase 400 pontos à frente da GTX 580, a nova placa da NVIDIA ficou atrÁs das novas placas da AMD, até mesmo da 7950.

{benchmark::2705}

Usando o tessellation ativado em modo normal, a GTX 680 conseguiu uma pequena melhora frente os modelos da série Radeon HD 7000, na verdade sobre a 7950, jÁ que a nova placa da NVIDIA superou a concorrente na tabela dos scores. A diferença em relação à GTX 580 manteve a média do teste sem tessellation ativado.

{benchmark::2706}

{break::Aliens vs Predator}Chegamos finalmente ao ponto alto da review: os testes em jogos!

Nada melhor do que começar por Aliens vs Predator, game que traz o suporte ao DX11 e que foi muito bem recebido pelo público e crítica.

Mesmo com quase 20% de ganho sobre a GTX 580, a GTX 680 deixou um pouco a desejar nesse game quando comparada com as placas da série 7900 da AMD. A 7970 consegue mais de 10% de vantagem sobre a placa da NVIDIA em ambas as resoluções.

{benchmark::2707}

{benchmark::2708}

{break::Batman Arkham City}Lançado no final de 2011, a sequência Batman Arkham City é um dos games mais elogiados de 2011, mesmo com alguns problemas relativos à API DirectX 11 na versão para PC. Utilizamos a versão atualizada que corrige o problema.

No entanto, se no AvP a diferença em comparação às novas placas de vídeo da AMD não foi a esperada, ao rodar o Batman Arkham City a GeForce GTX 680 teve um desempenho impressionante. Na comparação com a GTX 580, a placa tem performance superior a 30% em 1680x1050 e 25% em 1920x1080.

Na comparação com as placas da AMD, o ganho é considerÁvel em 1680x1050, caindo bastante na resolução mais alta testada, mas ainda com vantagem pra GTX 680. 

{benchmark::2709}

{benchmark::2710}

{break::Crysis Warhead}O FPS futurístico da Crytek fez muito barulho por trazer uma qualidade grÁfica bem superior a dos concorrentes e por ser considerado por muito tempo como um dos games que mais exigia recursos do computador, principalmente das placas 3D. Assim, nada melhor do que submeter as VGAs da review pelo crivo de "Crysis Warhead".

Novamente, ótimos resultados da GTX 680, quase 30% de ganho sobre a GTX 580 em 1680x1050 e novamente 25% em média superior na resolução de 1920x1080.

Na comparação com a 7970, a placa da NVIDIA também se sai melhor, apesar de que a diferença não é tão grande como aconteceu no Batman. 

{benchmark::2711}

{benchmark::2712}

{break::Crysis 2}Para os testes com o Crysis 2, utilizamos a ferramenta Adrenaline Crysis 2 Benchmark Tool, que lançamos no ano passado e é utilizada por praticamente todos os websites internacionais para benchmarks com o Crysis 2. O game, como todos sabem, é referência em qualidade de imagem, e no mês de junho 2011 finalmente ganhou seu patch com suporte ao DirectX 11, jÁ que originalmente o game vinha apenas em DX9.

Na briga mais acirrada até agora, rodando Crysis 2 a GTX 680 compete de igual pra igual com as novas placas série 7900 da AMD, em especial com a 7970. Podemos ver nos grÁficos que elas ficam empatadas tecnicamente.

O ganho sobre a GTX 580, novamente, é muito bom, mostrando a boa evolução da nova geração no quesito desempenho. 

{benchmark::2713}

{benchmark::2714}

{break::DiRT 3}DiRT 3 é o game mais recente de uma das séries de corrida off-road de maior sucesso da história da indústria dos jogos eletrônicos. Lançado em junho de 2011, o game traz o que existe de melhor em tecnologia da API DirectX 11. Os testes com o game foram feitos utilizando a ferramenta Adrenaline Racing Benchmark Tool.

Aqui temos mais um resultado impressionante, com a GTX 680 superando a Radeon HD 6990 na resolução de 1680x1050, 25FPS à frente da 7970 e mais de 30 FPS à frente da GTX 580.

Mesmo perdendo uma posição na tabela quando rodando em 1920x1080, o resultado da GTX 680 ainda é muito bom na comparação com as demais placas single chip comparadas. 

{benchmark::2715}

{benchmark::2716}

{break::HAWX 2}Agora é a vez da NVIDIA. Em HAWX 2, simulador aéreo da Ubisoft, a empresa tem grande vantagem sobre os modelos da AMD.

Este benchmark causou polêmica desde antes de seu lançamento, quando a AMD lançou nota à imprensa alegando que a Ubisoft (desenvolvedora do HAWX 2) deixou de usar código otimizado para todas as GPUs em benefício de um código que prejudicaria a performance das placas Radeon ao utilizar técnicas de renderização que têm melhor desempenho no Fermi da NVIDIA. Este, é sabido, tem maior poder de processamento de geometria ao renderizar até quatro triângulos por ciclo de clock, enquanto a HD 6800 (placa lançada na mesma época em que o benchmark foi disponibilizado) renderiza apenas um triângulo por ciclo de clock.

Bug ou baixo rendimento mesmo? Isso ainda não sabemos, mas tudo indica que seja algum problema relacionado aos drivers, afinal não tem sentido algum a GTX 680 ficar empatada com a GTX 580 no HAWK 2 diante do resultado dos demais testes. A placa chega a ficar 1FPS atrÁs da GTX 580 na resolução mais alta, indicando que existe mesmo algum problema, seja no game ou nos drivers.

{benchmark::2717}

{benchmark::2718}

{break::Just Cause 2}Para fazer o "contra peso", as placas da série Radeon dominam em todos os segmentos rodando o Just Cause 2, curiosamente apoiado pela NVIDIA.

Aqui não hÁ grandes surpresas, e isso quer dizer que a AMD continua dominando. Como podemos ver, apesar da melhora de quase 15% sobre o resultado da GTX 580, a nova GTX 680 ainda não consegue fazer frente aos modelos TOP da AMD. Usando a 7970 como comparação, a placa da NVIDIA ficou 15fps atrÁs.

{benchmark::2719}

{benchmark::2720}

{break::Mafia II}Mafia II trouxe a continuação do aclamado game de ação em terceira pessoa ambientado no obscuro mundo da mÁfia italiana dos anos 40 e 50, nos EUA.

Mais um game com belo comportamento da GTX 680, com a placa superando a atual solução TOP da AMD com dois chips. O ganho sobre a 7970 fica na casa de 10%, jÁ sobre a GTX 580 fica acima dos 20%.

{benchmark::2721}

{benchmark::2722}

{break::Metro 2033}Trata-se de um FPS da 4A Games baseado em um romance homônimo russo, que conta a saga dos sobreviventes de uma guerra nuclear ocorrida em 2013 que se refugiam nas estações de metrô. O game, que faz uso intensivo da técnica de Tessellation e demais recursos do DirectX 11, desbancou de Crysis o título de jogo mais pesado. Sendo assim, nada melhor do que observar como se comportam as VGAs sob este intenso teste.

Por fim, rodando o Metro 2033 o ganho foi abaixo do esperado, na casa de 10 a 15% sobre a GTX 580, menos do que que vimos na grande maioria dos testes anteriores. Não foi  suficiente sequer para passar a 7950.

{benchmark::2723}

{benchmark::2724}

{break::PhysX}Quando se trata de uma placa de vídeo da Nvidia, não temos como não testar a tecnologia de física PhysX, presente em alguns games e que promete maior realismo, adicionando efeitos não encontrados em placas que não sejam da empresa.

Para os testes, utilizamos o Batman Arkham City, sequência da série que traz efeitos muito bons dessa tecnologia. Abaixo, um exemplo da diferença do game rodando com e sem PhysX.

Como a tecnologia adiciona mais efeitos, ela exige mais da placa de vídeo e consequentemente afeta diretamente o desempenho. Abaixo, os testes com a tecnologia ativada, nos quais podemos ver que houve melhora de 10% em média sobre o resultado alcançado pela GTX 580. A GTX 680 ficou, inclusive, na frente da GTX 590, ao menos na resolução de 1680x1050.

{benchmark::2734}

{benchmark::2735}

{break::Overclock: Temperatura, 3DMark 11}Além do que jÁ mostramos no decorrer da review, outro atrativo da GeForce GTX 680 estÁ em seu potencial de overclock. Com destaque para a tecnologia GPU Boost, como jÁ falamos, que faz overclock automÁtico da placa de vídeo quando o sistema detecta que existe essa possibilidade/necessidade.

Independente do GPU Boost, assim como qualquer outra placa de vídeo, também podemos aumentar os clocks padrões da placa. O pulo do gato da NVIDIA, porém, estÁ relacionado novamente ao GPU Boost, jÁ ,que após definirmos um clock, a tecnologia exclusiva da NVIDIA ainda farÁ sua atuação sobre ele. Para ficar claro, enquanto a placa com clock padrão sobe de 1006MHz para 1059MHz+, com o overclock que fizemos deixando o core a 1156MHz a placa chega a 1209MHz+, resultado considerÁvel em se tratando de uma placa referência. Não fizemos nenhuma mudança na voltagem, a placa estÁ rodando com voltagem padrão.

Confiram abaixo as telas do GPU-Z e os testes da placa quando overclockada, nos dois overclocks que fizemos.



Tela do eVGA PrecisionX, aplicativo utilizado para o overclock

Temperatura
A temperatura praticamente não mudou quando a placa foi overclockada, subindo apenas 1°C.

{benchmark::2725}

3DMark 11
Temos um resultado impressionante no 3DMark 11, a GTX 680 pula para o topo da tabela, ultrapassando a Radeon 6990 e a GeForce GTX 590, ambas com dois chips.

{benchmark::2726}

{break::Overclock: AvP, Crysis 2, Metro 2033}Além do 3DMark 11, fizemos testes com a placa overclockada na resolução de 1920x1080 em alguns games. Vamos acompanhar abaixo como a placa se comportou.

Aliens vs Predator
No AvP o overclock foi suficiente para colocar a GTX 680 à frente da 7950 overclockada da XFX, mas ainda assim não consegue chegar ao resultado de uma 7970 com características de modelo referência como a da ASUS.

{benchmark::2727}

Crysis 2
Rodando Crysis 2 a GTX 680, quando overclockada, novamente sobe uma posição na tabela, agora superando a 7970, novamente destacando, placa com clocks no modelo referência.

{benchmark::2728}

Metro 2033
Por fim, quando overclockada e rodando o Metro 2033, mais uma vez a GTX 680 ganha uma posição na tabela na comparação com seu score com clocks normais, ultrapassando a 7950 overclockada da XFX.

{benchmark::2729} 

{break::Conclusão}Embora tenha passado mais de 16 meses após o lançamento da GTX 580, a GeForce GTX 680 chega em um momento importante para a NVIDIA, a tempo de não perder mercado para a AMD.

Durante o seu Editor's Day em São Francisco, a NVIDIA foi exaustiva ao enfatizar o trinômio: mais veloz, mais suave e mais rica, para a Kepler. Conforme pudemos verificar em nossa anÁlise, foi possível perceber as três pilastras presentes na GeForce GTX 680.

Das três bases de sustentação da nova geração de GPUs da companhia, duas estão bastante evidenciadas: mais suave (FXAA/TXAA e Adptive VSync) e mais rica (3D Vision Surround com apenas 1 VGA/GPU, e PhysX mais poderoso). JÁ o mais veloz... bem, nem tanto assim.

Não resta dúvida de que a equipe de engenharia e design da NVIDIA se superou em termos de macro-especificações. Contudo, se por um lado todos esses números expressivos geram uma grande expectativa em torno do imenso desempenho da GTX 680, por outro, podem causar certa decepção, na medida em que a placa não deixe a sua rival "comendo poeira" como esperado (ou imaginado). Conforme pode-se verificar nas seções dos benchmarks, a nova GeForce é sim uma placa imponente e de imenso respeito. Entretanto, não é absoluta (como aconteceu com a GTX 580 vs. Radeon 6970), perdendo em alguns testes para a Radeon HD 7970 (e em alguns caso ficando no empate técnico com as versões mais poderosas e caras da 7950).

Trata-se de um fato curioso e que merece um aprofundamento maior em um momento futuro, uma vez que a GK104 possui três vezes mais CUDA Cores que a GF110. SerÁ que a mudança na arquitetura não foi algo tão benéfico assim para as GeForces? Ou a NVIDIA chegou em um patamar tal que o aumento dos núcleos de processamento por si só não resulta mais em tanto ganho de performance?

Assim, nesta geração, não se pode dar o título de "Rainha das Placas 3D" para nenhuma das competidoras.

É preciso esclarecer, no entanto, que a GTX 680 é cerca de US$ 50 mais barata que a sua rival direta, compensando em parte o fato de não ser soberana nos testes.

Entretanto, um dos feitos mais surpreendentes da GTX 680 estÁ na sua relação entre desempenho e dissipação térmica. Com uma ótima performance no processamento 3D e um TDP excepcional para a categoria, a placa prova que não tem concorrentes neste quesito.

Especula-se nos bastidores que a GK104 não seria na realidade o chip top da companhia, e sim o GK100/110, que teria 2304 CUDA Cores. Ainda no campo dos rumores, tal chip não teria chegado a tempo, devido a problemas na produção por parte da TSMC com a litografia em 28nm. Especulações à parte, o fato de concreto é que a NVIDIA desenvolveu uma placa suficientemente poderosa para disputar com unhas e dentes o posto mais alto do segmento de alto desempenho com a sua rival.

Finalizando, a partir desta matéria, introduzimos nosso novo sistema de benchmarks que mostra os percentuais relativos de um item em relação aos demais ao se passar o mouse sobre as barras do grÁfico, facilitando assim a comparação entre as diversas placas usadas nos testes. O novo sistema terÁ também uma seção dedicada para comparação entre os hardwares analisados pelo Adrenaline, com vÁrias opções de filtros e outras possibilidades. Aguardem novidades!




PRÓS
Melhora do sistema de cooler em comparação com a GTX 580;
Menor ruído em relação à GTX 580;
Excelente TDP para a categoria;
Roda com folga todos os games em condições extremas;
US$ 50 mais barata que a sua rival direta;
Recheada de recursos e tecnologias, como os filtros FXAA e TXAA, Adptive VSync, GPU Boost...;
Ótima possibilidade para overclock.
CONTRAS
A imensa quantidade extra de CUDA Cores em relação à GTX 580 não se traduziu em um expressivo ganho de performance;
Em alguns casos é mais lenta que os modelos turbinados da Radeon 7950, serão os drivers?
Assuntos
Tags
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Adrenaline é responsável por análises e artigos de processadores, placas de vídeo, placas-mãe, ssds, memórias, coolers entre outros componentes.

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.