ANÁLISE: Nvidia GeForce GTS 450

ANÁLISE: Nvidia GeForce GTS 450

A NVIDIA deu um importante passo hoje na história da geração Fermi com o lançamento da GeForce GTS 450. A placa é voltada para um dos segmentos de maior rentabilidade do mundo dos chips grÁficos: o intermediÁrio/intermediÁrio de baixo custo, uma vez que é neste nicho onde as companhias conseguem maximizar seus ganhos de escala.

Outro destaque é que a VGA é a primeira baseada no chip GF106, lembrando que a GTX 460 possui em seu cérebro, o GF104. De acordo com alguns rumores que circularam pela a web nas últimas semanas, o GF106 serviria ainda de base para mais 3 placas: a GTS 455, 445 e 440! Destas 3, falou-se até que a GTS 455 contaria com 256 CUDA Cores. Bem, falaremos um pouco mais sobre isso na seção seguinte que trata da arquitetura do chip.

As atenções da mídia e do público como um todo estiveram bastante concentradas na GeForce GTS 450, uma vez que trata-se da primeira placa 3D voltada para o segmento intermediÁrio/intermediÁrio de baixo custo desde o lançamento das célebre G80 (8800 GTS), que depois ganhou uma nova litografia e passou a se chamar G92 (9800 GTX) e mais recentemente ganhou outro nome, atendendo pelo nome de GTS 250. Vale ressaltar que na época a 8800 GTS e 9800 GTX pertenciam a outro segmento, o intermediÁrio de alta performance e que foi "perdendo prestígio" com o passar das gerações.

Apesar de não possuir números tão impactantes aos olhos em suas especificações, a GTS 450 tem como grande apelo a sua relação de custo x benefício, pois trata-se de uma VGA com preço estimado na casa dos US$135, prometendo uma boa performance para rodar a grande maioria dos jogos TOPs com resolução de 1680x1050 e filtro de antialiasing em 4X na casa dos 40 FPS.

Inicialmente projetada para competir com a Radeon HD 5750 (embora em alguns casos até ensaie uma concorrência com a 5770, a GeForce GTS 450 poderÁ ainda ter como concorrente, sua irmã maior, a GTX 460 de 768MB, uma vez que a mesma sofreu uma redução de cerca de US$20, caindo para um patamar por volta dos US$169-179.



GeForce GTS 450 - Modelo de referência da NVIDIA

Uma grata surpresa que a Adrenaline reservou para os seus leitores é que além do modelo de referência cedido pela NVIDIA, recebemos ainda uma versão super especial da ASUS, a ENGTS450 DirectCU TOP, que como o nome jÁ sugere, trata-se de um modelo top de linha da companhia, com GPU turbinada a 925Mhz, CUDA Cores a 1850Mhz e memória a 4.0Ghz! Além disso, a placa conta com um sistema de refrigeração especial que promete maior eficiência térmica e sonora.

Assim como no GF100 e GF104, o GF106 estÁ amparado em duas pilastras: alto poder de processamento e suporte às novas tecnologias, como é o caso do DirectX 11, NVIDIA 3D Vision Surround, CUDA, Tesselation, Ray Tracing e o novo modo de filtro 32xCSAA (Coverage Sampling Antialiasing), sendo 8 do tipo "multisamples" e 24 "coverage samples".

{break::Arquitetura da GF106}A GF100 foi para a NVIDIA o passo à frente mais significativo em termos de avanço na macro-arquitetura das GPUs desde o lançamento da primeira G80, inaugurando o que se conhece muito bem hoje como o conceito de grÁficos unificados e computação paralela

Com a geração Fermi, os engenheiros da NVIDIA empregaram todo o seu conhecimento adquirido ao longo das duas últimas gerações, bem como todos os aplicativos, e desenvolveram uma abordagem totalmente nova de design para criar a primeira GPU computacional do mundo a utilizar estrutura conjugada MIMD (Múltiplas Instruções, Múltiplos Dados).

- Continua após a publicidade -

Abaixo, alguns pontos-chaves da nova arquitetura.

• Otimização na Performance de Precisão Dupla: Enquanto a performance de ponto flutuante de precisão única foi da ordem de dez vezes o desempenho dos processadores, algumas aplicações de computação por GPU necessitam de mais desempenho de precisão dupla;

• Suporte à ECC: O chamado ECC (Error-Correcting Code memory em tradução livre, código de correção de erro de memória) se encarrega de fazer os devidos testes e correções de erros de forma automÁtica, muitas vezes de forma transparente e imperceptível ao sistema operacional. Assim, abre-se espaço para a utilização, de forma segura, de uma grande quantidade de GPUs em Datacenters, garantindo uma maior confiabilidade em sistemas críticos, tais como aplicações médicas, financeiras e militares;

• Hierarquia de Memória Cache Real: Alguns algoritmos paralelos eram incapazes de usar a memória compartilhada da GPU, de forma que os usuÁrios solicitaram uma arquitetura real para ajudÁ-los nos desenvolvimentos das tarefas e programas;

• Mais Memória Compartilhada: Muitos programadores do ambiente CUDA solicitaram mais de 16 KB de memória compartilhada para os Streaming Multiprocessors como forma de acelerar as aplicações;

• Alternância de Contexto Mais RÁpida: Muitos usuÁrios desejavam uma alternância de contexto mais veloz entre aplicações e interoperações de computação e grÁficos;

• Operações Atômicas mais Velozes: Os programadores necessitavam de operações atômicas de leitura-modificação-escrita mais velozes para se adequarem aos algoritmos paralelos.

Como resultado dos preceitos acima, a equipe de desenvolvimento da Fermi projetou uma linha de chips com significativo "poder de fogo", trazendo ainda muitas inovações tecnológicas com um alto grau de programação e eficiência computacional.

- Continua após a publicidade -

Embora não se tenha o número exato da Área do die, fala-se que o GF106 tenha aproximadamente 45% dos 530mm² do GF100 ou 75% dos 318mm² do GF104, ou seja, algo em torno de 240mm². Trata-se de uma expressiva redução em relação às "suas irmãs maiores". Na prÁtica, a diminuição trouxe para a NVIDIA uma grande queda no custo de produção da GPU, na medida em que mais chips podem ser alocados no waffer de 300mm.

Essa diminuição na Área do die só foi possível, graças à redução na quantidade de transistores. Enquanto o GF100 conta com cerca de 3 bilhões de transistores e o GF104 possui 1,95 bilhão, o GF106 conta com 1,17 bilhão, isto é, 60% do total da GTX 460. Não é por acaso que a NVIDIA conseguiu reduzir o TDP de 160W do GF104 para 106W da GTS 450.


(Arquitetura da GF106 - versão GTS 450)

Seguindo o projeto da geração Fermi, o GF106 conta com uma estrutura de processamento "host interface", no qual hÁ um grande bloco chamado pela NVIDIA de "Gigathread Engine" composto de 1 GPC (Graphic Processing Cluster), duas controladoras de memória , duas partições ROPs e cache L2 com 256KB. Em outras palavras e a grosso modo, o GF106 é uma versão "simplificada" da GF104, com praticamente a metade das especificações da GPU da GTX 460.

Vale ressaltar que o GPC (que são, na realidade, grandes unidades de processamento e se comportam como mini GPUs independentes) possui 4 unidades de Streaming Multiprocessor (SMs), cada uma composta por 48 CUDA Cores. Dessa forma, a GF106 suporta até 192 Shaders Processors (1 GPC x 4 SMs x 48 CUDA Cores).

Desta forma, o rumor de que a NVIDIA lançaria uma GeForce GTS 455 com 256 CUDA Cores é impossível! Pelo menos em se tratando de uma GPU com o chip GF106. A saída seria que a tal GTS 455 fosse derivada do GF104 (GTX 460). Contudo, essa hipótese estÁ praticamente descartada pelo fato da improvÁvel relação entre o elevado custo de fabricação de uma VGA com o GF104 e o relativo baixo preço que a placa teria no mercado.

Entretanto, parece que os engenheiros da NVIDIA guardaram uma "carta na manga" na arquitetura da GF106. De acordo com os materiais para review enviados pela companhia, hÁ uma nota de esclarecimento sobre a estrutura do chip. Em tese, o GF106 suporta não duas, mas 3 partições ROPs. O mesmo vale para a quantidade de controladoras de memória. Desta forma, abrir-se-ia uma possibilidade para que a NVIDIA venha a lançar a tal GTS 455 trazendo mais ROPs (24 ao invés de 16) e bus de 192 bits no lugar de 128 bits da GTS 450. Provavelmente a GTS 455 conte ainda com clocks mais elevados, dado o tremendo potencial de overclock da GTS 450.


(Arquitetura completa da GF106)

- Continua após a publicidade -

Em se tratando Texture Memory Units, a GTS 450 possui a mesma quantidade de TMUs por unidade de Streaming Multiprocessor que a GTX 460. Contudo, como o GF106 possui a metade da quantidade de SMs que o GF104, enquanto que a GeForce GTX 460 tem um total de 64 TMUs (sendo que apenas 56 ativos), a sua "irmã menor" possui 32 TMUs (4 SMs x 8 TMUs).

O mesmo raciocínio vale para a quantidade de unidades de rasterização (ROPs). Enquanto que o GF104 possui suporte para até 32 unidades de rasterização, o GF106 possui metade da quantidade, com um total de 16 ROPs.

Um dos grandes segredos do GF106 (assim como do GF104) estÁ no design e disposição de algumas estruturas internas, como é o caso da relação entre SM e CUDA Cores. Enquanto que no GF100 hÁ 32 CUDA Cores por SM, no GF106 hÁ 48 por Streaming Multiprocessor. Desta forma, os SMs do GF106 são capazes de processar as informações de forma mais eficiente que a de sua irmã maior. Enquanto que a GTX 480 possui 4 TMUs por SM, a GTS 450 possui 8 por SM, outro benefício advindo da mudança de design. Além disso, enquanto que o GF100 possui duas dispatch units por SM, o GF106 possui o dobro de unidades, ou seja, 4.

Em contrapartida aos Combinadores de Registros, Unidades de Shaders e Shaders Cores presentes nas gerações passadas, os novos CUDA Cores são o que existem de "última palavra" em termos de tecnologia. Tratam-se de unidades autônomas capazes de processar múltiplas instruções e múltiplos dados (arquitetura MIMD), em oposição ao SIMD (instrução única, múltiplos dados). Assim, os 192 CUDA Cores consistem em unidades de despachos, coletores de operações, 2 unidades de processamento (inteiros e pontos flutuantes) e registradores de filas de resultados.



Para ser sincero, o cluster de Streaming Multiprocessor é a grande razão pela qual a arquitetura da Fermi pode, desde jÁ, ser vista como a mais eficiente no que diz respeito à unidade de processamento grÁfico. Olhando para a imagem acima, podemos ver que os 48 CUDA Cores foram "empacotados" juntos com 64KB de memória cache dedicada que alterna entre os modos 48KB/16KB ou 16KB/48KB para toda a memória compartilhada e cache L1. Essa computação dinâmica irÁ ajudar os desenvolvedores a otimizar a performance de seus games, em virtude da arquitetura ser bastante flexível.

Além disso, hÁ ainda as unidades Warp Scheduler e Master Dispatch que se alimentam de arquivos de registros (Register Files) imensos (32.768 entradas de 32bits – o arquivo de registro pode aceitar formatos diferentes ou seja, 8bits, 16bits, etc). O cluster SM possui ainda 4 TMUs, cache de textura e o mais importante de tudo: Polymorph Engine.

A Polymorph Engine foi introduzida na Fermi para lidar com uma enorme carga de trabalho que as novas funções necessitam. Uma delas é a técnica conhecida como Tessellation (que é um dos grandes trunfos do DirectX 11), em que o número de triângulos em uma cena pode aumentar de forma exponencial.

A GTS 455 possui um total de 4 PolyMorph Engines. Esse fato é amplamente ressaltado pela NVIDIA, uma vez que as Radeons da geração Evergreen (série 5000) contam apenas com uma grande unidade para o processamento do tessellation.

As unidades ROPs receberam uma atenção especial por parte da equipe de desenvolvimento. O resultado é que, em alguns casos, o ganho de performance pode ser 3 vezes superior em relação à GeForce GTX 285 com o filtro de Anti-aliasing ligado!

Por falar nisso, a Fermi suporta o modo 32x CSAA (8+24x) com 33 níveis de transparência, com expressivo ganho de desempenho sobre a GT200. O melhor de tudo é que, segundo a NVIDIA, a degradação da performance é muito pequena em relação ao modo tradicional em 8X, variando entre 8-15%. Para quem critica e acha que a utilização de filtro de AA acima de 8x não traz ganho visível, segue abaixo uma imagem, seguindo o dito de que uma imagem vale mais que mil palavras.



Em relação às memórias cache, enquanto a GT200 estava limitada ao compartilhamento de nível L2, a Fermi conta ainda com o nível L1, auxiliando sobremaneira o trabalho dos Shaders Processors. São, ao todo, 1MB de cache L1 e 256KB de L2. Tratam-se de números interessantes. Enquanto a NVIDIA foi em uma direção (colocando mais memória L1 do que L2), a ATi foi justamente no caminho oposto ao equipar a linha Evergreen com mais cache L2 do que L1.

De acordo com Henry Moreton, engenheiro da NVIDIA, o cache L1 da Fermi pode ultrapassar a impressionante marca de 1,5TB/s de largura de banda. Valor muito semelhante ao que chega a L2.



{break::Os recursos da GTS 450}Os destaques da GeForce GTS 450 são:


• 1,17 bilhão de transistores;
• Litografia em 40 nm;
• Área do die (estimado): ~240mm²
• Frequência de operação das texturas e ROPs (GPU): 783Mhz;
• 192 shader processors/CUDA cores;
• Frequência de operação dos shaders processors/CUDA cores: 1566MHz;
• Frequência de operação das memórias: 3.6GHz (GDDR5);
• Quantidade de memória: 1GB;
• Interface de memória: 128 bits;
• Consumo de energia/TDP: mÁximo de 106 watts;
• Limiar térmico da GPU em 95° C;
• Suporte às tecnologias: CUDA, DirectX 11/Shader Model 5.0, GeForce 3D Vision, NVIDIA 3D Vision Surround, NVIDIA PhysX, PureVideo HD Technology, Badaboom, HDMI 1.3a, OpenGL 3.2, OpenCL, DirectCompute, Windows 7.

E ainda:

• Terceira Geração do Streaming Multiprocessor (SM)

• Segunda Geração de Execução de Thread Paralelo ISA
- Espaço de Endereçamento Unificado com suporte completo a C++;
- Otimização para OpenCL e DirectCompute;
- Precisão completa para IEEE 754-2008 32-bit e 64-bit;
- Caminho completo para inteiros de 32-bit e extensões de 64-bit;
- Instruções de acesso a memória para suportar a transição no endereçamento de 64-bit;
- Melhora na performance através da técnica de Predicação.

• Subsistema de Memória Otimizada
- Utilização da hierarquia NVIDIA Parallel DataCacheTM com L1 ajustÁvel e L2 unificada;
- Primeira GPU com suporte a memórias ECC;
- Otimização no desempenho das operações atômicas de memória.

• NVIDIA GigaThreadTM Engine
- 10x mais rÁpido nas aplicações de alternância de contexto;
- Execução simultânea de Kernel;
- Execução de blocos de theads fora de ordem;
- Engine de transferência de memória com dupla sobreposição.

A litografia em 40nm permitiu manter o consumo de energia (TDP) em um patamar bem interessante, chegando ao mÁximo de 106W. Esse valor é 54W menor do que o consumo da GTX 460 e 39W a menos do que a boa e velha GeForce GTS 250.

Sendo assim, para suprir tal demanda de energia, a VGA necessita apenas de um conector de alimentação extra de 6 pinos (75W). Aliados aos 75W do slot PCIe, a GTS 450 tem a disposição uma margem extra de 44W, podendo ser utilizado para overclock, que por sinal, pode atingir cima dos 900Mhz sem maior esforço! De acordo com a NVIDIA, é recomendado o uso de uma fonte real de pelo menos 400W.

Como em tese, a GTS 450 é a substituta da GTS 250, façamos uma rÁpida comparação em suas especificações, ainda que seja algo complicado, pois tratam-se de VGAs com arquiteturas bem distintas.

Em termos de quantidade de CUDA Cores, a GTS 450 tem 50% mais shaders processors que a GTS 250. São 192 contra 128. Além do "handcap" quantitativo, hÁ ainda o fator qualitativo, uma vez que as unidades de processamento dos shaders da Fermi são bem mais modernas e eficientes do que a boa e velha G80. Em compensação, em favor do G92b, hÁ 64 TMUs contra 32 do GF106. A quantidade de ROPs dos dois chips é exatamente a mesma: 16. Em relação aos clocks, a GPU da GTS 450 trabalha com frequência de operação a 783Mhz, contra 738Mhz de sua "irmã mais velha". Se a GTS 250 tem shaders mais velozes (1836Mhz contra 1566Mhz), a GTS 450 conta com memórias mais rÁpidas e modernas (GDDR5 de 3.60Ghz contra GDDR3 de 2.2Ghz). Este último item serve de contra peso para o fato do bus da GTS 450 ser de 128 bits, metade da GTS 250.

Se falarmos em overclock, a situação só piora para os lados da GTS 250. Por possuir um chip mais "refinado" com litografia em 40nm, o potencial da GF106 vai bem além do G80/G92b. HÁ alguns modelos super especiais da GTS 450 que ultrapassa os 900Mhz sem grande esforço, com sistema de refrigeração a ar.



{break::Enfim o DirectX 11}Como foi dito no início deste review, um dos grandes trunfos da geração Fermi é o suporte à nova API grÁfica da Microsoft, o DirectX 11, que promete facilitar e agilizar o processo de desenvolvimento dos jogos, além de trazer novas tecnologias ou mesmo melhorias nas atuais, aprimorando ainda mais a qualidade nos grÁficos. Apesar de ter ficado defasada cerca de seis meses em relação a sua rival Evergreen, a NVIDIA entra em uma nova era em termos grÁficos.

As novidades presentes no DX11 são:

- DirectCompute 11
- Hardware Tessellation
- High Definition Ambient Occlusion
- Shader Model 5.0
- Depth of Field
- Renderização Multi-threaded (Multi-threading)



DirectCompute 11
O DirectCompute é um dos grandes trunfos do DX11, pois possibilita que os desenvolvedores utilizem a GPU para o processamento de outras tarefas alheias à renderização 3D. Trata-se do conceito por trÁs do termo GPGPU, que "transforma" a placa de vídeo em um processador.

Os benefícios não ficam restritos às aplicações gerais. Nos games, por exemplo, é possível programar para que a GPU cuide de tarefas como o processamento e filtro das imagens (conceito de post processing). Ela também pode ficar responsÁvel por outros aspectos, como o Order Independent Transparency - OIT (técnica de sobreposição de objetos que aperfeiçoa o efeito de semi-transparência – como, por exemplo, na criação de efeito de fogo, fumaça, cabelo, vidro), a renderização de sombras, a física e a inteligência artificial, além de prevenir erros no processamento da priorização da formação das imagens.

Não é apenas o quesito qualidade que foi beneficiado com o OIT. Enquanto o método Simple Alpha Blending (SAB) presente no DX10 necessita de 64 passagens para a renderização, o OIT requer uma única leitura, ou seja, hÁ também uma expressiva otimização do processo.

Hardware Tessellation
Trata-se de um dos benefícios mais aguardados pela indústria dos jogos eletrônicos.

De forma simplista, trata-se da tecnologia que adiciona, em tempo real, mais detalhes aos objetos 3D. Para tanto, subdivide-se um objeto/superfície em pedaços menores, acrescentando polígonos mais simples (de fÁcil execução).

Em outras palavras, ao invés de a GPU gastar um grande tempo para o processamento de um objeto único (ou parte de um grande objeto) e complexo de uma única vez, o Tessellation "quebra" o mesmo em partes menores de forma a tornar a tarefa mais simples e rÁpida.

Assim, os desenvolvedores estão "impedidos" de acrescentar mais objetos e detalhes aos games. Com o Tessellation, o processamento dos terrenos/solos serÁ muito mais simples e rÁpido, sem contar que permitirÁ que os programadores criem texturas e maiores detalhes - como a deformação dinâmica - resultando em um maior realismo ao jogo.

Nas fotos abaixo, é possível perceber com nitidez a diferença na qualidade da imagem quando a tecnologia é utilizada.




(imagens à esquerda sem a técnica; e à direita com a técnica)

High Definition Ambient Occlusion
Trata-se de outra técnica de efeito de pós-processamento de imagem, que melhora as sombras e luzes, além de aumentar a sensação de profundidade dos objetos (3D).

Para isso, a Microsoft disponibilizou dois novos métodos de compressão de texturas: os filtros BC6 e BC7. O primeiro oferece uma taxa de compressão de 6:1 com 16 bits por canal e sem perdas, mostrando-se uma texturização eficiente e de alta qualidade para a iluminação HDR. JÁ o BC7 oferece compressões de 3:1 com o padrão de cores RGB ou 4:1 para Alpha.


Shader Model 5.0
O DX11 introduz a versão 5.0 do Shader Model para a linguagem de programação HLSL, na qual adiciona precisão dupla para o processo, permitindo o uso específico dos shaders com polimorfismo, objetos e interfaces.

Na verdade, diferentemente das versões anteriores, o SM 5.0 não traz grandes avanços em termos de capacidades, mas promete facilitar o trabalho dos desenvolvedores ao introduzir certos conceitos de programação orientada a objetos.

Depth of Field
O método adiciona efeitos bem interessantes envolvendo o foco da imagem (primeiro plano) e o plano de fundo, para dar um aspecto cinemÁtico às imagens.

O Depth of Field utiliza um filtro de núcleo nos pixels da imagem processada como um efeito de pós-processamento. Este utiliza os dados dos pixels adjacentes para criar efeitos como borrado de movimentos, mapeamento de tom, detecção de bordas, suavização e nitidez.

Renderização Multi-threaded
É a técnica pela qual as GPUs processam os dados de forma simultânea, e não mais em sequência como em uma fila. O ganho, claro, estÁ na eficiência no processamento, resultando em uma melhor performance.

Embora existam pouquíssimos jogos prontos ou em desenvolvimento sob o DirectX 11, é justo dizer que a sua adoção estÁ sendo feita de forma mais acelerada em relação à versão 10.

Confiram abaixo o vídeo Unigine Heaven DX11 benchmark com tecnologia 3D Vision Surround em uma GTX 480.

{break::Outras tecnologias}CUDA

Trata-se da abreviação para Compute Unified Device Architecture (em tradução livre: Arquitetura de Dispositivo Unificado de Computação). Em outras palavras, CUDA é o nome dado pela NVIDIA para designar a arquitetura de computação paralela mais conhecida como GPGPU (general-purpose computing on graphics processing units).

Sem maiores complicações ou termos técnicos, trata-se da tecnologia na qual se utiliza uma GPU (chip grÁfico) para realizar uma tarefa comumente executada por um processador (CPU). Isso só é possível graças à adição de estÁgios programÁveis e da aritmética de maior precisão contidas nos canais de processamento da GPU, que permite que os desenvolvedores de programas utilizem o processamento de fluxo de dados para dados não grÁficos.

Apresentada inicialmente em 2007, a tecnologia CUDA estÁ presente em uma vasta gama de chips da NVIDIA, tais como nas GPUs de classe científica Tesla, nas profissionais Quadro, além, é claro, das GeForces desde a geração G8x.

De acordo com vÁrios experts no assunto, a grande vantagem de utilizar uma GPU ao invés de uma CPU para realizar tarefas do cotidiano estÁ na arquitetura por trÁs do chip grÁfico, massivamente focado na computação paralela, graças à imensa quantidade de "cores"/núcleos. Eles são, portanto, capazes de rodar milhares de threads simultaneamente. Dessa forma, aplicações voltadas para a biologia, física, simulações, criptografia, entre outras, terão um benefício muito maior com a tecnologia GPGPU/CUDA.

No campo dos games, a renderização dos grÁficos torna-se muito mais eficiente com a Computer Unified Device Architecture, como é o caso, por exemplo, dos cÁlculos dos efeitos da física (como fumaça, fogo, fluidos...)

Atualmente, é o processo de GPGPU mais difundido no mercado, contando com mais de 100 milhões de placas compatíveis.

PhysX

Embora seja uma das grandes "vedetes" dos games modernos, a tecnologia de processamento da física é uma tecnologia que jÁ vem de alguns anos.

Lançado inicialmente em 2005 pela então AGEIA, com a sua famigerada PPU(Physics Processing Unit – um tipo de chip exclusivo para o processamento da física), a iniciativa nunca chegou a decolar em virtude de seu alto custo para a época, apesar de toda a promessa por trÁs da tecnologia.

Contudo, a NVIDIA enxergou na PPU da AGEIA uma imensa oportunidade pela frente. Tanto foi que, em 2008, anunciou para o mercado a compra da companhia, assim como de seu bem mais precioso: a tecnologia PhysX. Dessa forma, a NVIDIA passou a incorporar os benefícios da PPU dentro de suas GPUs.

Mas o que vem a ser exatamente tal cÁlculo da física presente no PhysX? É a técnica na qual o chip grÁfico realiza uma série de tarefas específicas em um game, tornando-o mais realista para o jogador, ao adicionar ambientes físicos vibrantes, de imersão total.

A física é o próximo passo na evolução dos jogos. Trata-se da forma como os objetos se movimentam, interagem e reagem ao ambiente que os cerca. Em muitos dos jogos atuais, sem física, os objetos não parecem se mover da forma desejada ou esperada na vida real. Hoje em dia, a maior parte da ação se limita a animações pré-fabricadas, que são acionadas por eventos do próprio jogo, como um tiro que acerta a parede. Até as armas mais pesadas produzem pouco mais que uma pequena marca nas paredes mais finas, e todos os inimigos atingidos caem da mesma forma jÁ programada. Para os praticantes, os jogos são bons, mas falta o realismo necessÁrio para produzir a verdadeira sensação de imersão.

Em conjunto com as GPUs GeForce habilitadas para a CUDA, o PhysX oferece a potência computacional necessÁria para produzir a física avançada e realista nos jogos de próxima geração, deixando para trÁs os efeitos de animação pré-fabricados.

É através do cÁlculo da física que, por exemplo, uma explosão parece mais real para o usuÁrio, uma vez que se pode gerar um verdadeiro "efeito dominó" por trÁs desse evento. Assim, é possível adicionar uma série de elementos para a cena, como é o caso de estilhaços, e não mais apenas o fogo em si e a fumaça.

O PhysX é responsÁvel, entre outras funções, por processar as seguintes tarefas em um game:

• Explosões com efeitos de poeira e destroços;
• Personagens com geometrias complexas e articuladas para permitir movimentação e interação mais realistas;
• Novos e incríveis efeitos em disparos de armas;
• Tecidos que se enrugam e rasgam naturalmente;
• Fumaça e névoa formadas em torno de objetos em movimento.


(Vídeo de Batman Arkham Asylum, que compara o game com e sem o PhysX)

Ironias à parte, atualmente é possível utilizar, por exemplo, uma GeForce mais simples como uma PPU (exclusivo para o processamento da física), deixando uma segunda placa da NVIDIA de classe superior responsÁvel para o processamento principal.

Na teoria, uma placa da ATI até pode realizar os cÁlculos da parte física sem possuir o PhysX, mas, na prÁtica, o resultado é desastroso, derrubando os FPS para níveis que podem, em certos casos, inviabilizar a prÁtica do jogo.

3D Vision (óculos 3D)

Lançado no início do ano de 2009 durante a Consumer Electronic Show (CES) em Las Vegas, Estados Unidos, o 3D Vision foi de início motivo de certa desconfiança por parte da comunidade. A razão nada teve a ver com a tecnologia em si (muito boa por sinal), mas por experiências nada bem sucedidas de outras empresas no passado.

Antes do 3D Vision, basicamente a sensação de imagens tridimensionais era (e na maioria dos casos ainda é) feita por óculos anaglíficos (famosos por suas lentes na cor azul e vermelha), ou por lentes mais elaboradas com LCD (aos moldes dos óculos presentes no Master System), mas que pecavam por suas limitações técnicas. Era esse o caso das televisões e monitores de CRT (tubo) que causavam dores de cabeça com o uso prolongado ou de LCDs com baixa taxa de atualização (refresh rate).

Contudo, a NVIDIA lançou um produto sem impedimentos técnicos, aproveitando-se da nova geração das telas de cristal líquido, com nada mais nada menos do que 120Hz (60Hz para cada olho humano).

Não basta apenas comprar o kit e um monitor especial e sair usufruindo da tecnologia. É preciso que o jogo tenha suporte a imagens em três dimensões. Dessa forma, o driver ForceWare reconhece a compatibilidade e entra em ação, acionando o 3D Vision e alternando os frames para o lado esquerdo e direito do óculos a cada atualização de imagem (técnica conhecida como multiplexação seqüencial de tempo). Utilizando-se dos dados contidos na engine Z-buffer, o programa é capaz de criar uma representação 3D do game, ao invés de apenas duplicar e compensar a imagem para criar o efeito, como faz, por exemplo, o monitor Triton da Zalman, dinamicamente alternando a profundidade e então a distância dos objetos no game.

Trata-se, na verdade, de uma ação extremamente ambiciosa e ousada da NVIDIA, uma vez que tem que contar com o apoio das produtoras para disponibilizar cada vez mais títulos compatíveis com a tecnologia. Porém, para a felicidade da gigante das GPUs, a companhia dispõe do programa "The Way It's Meant To Be Played", em que atua em conjunto com diversos estúdios dando o suporte para o desenvolvimento de novos jogos.

Vale ressaltar que a tecnologia não estÁ limitada apenas aos games. É possível, por exemplo, desfrutar de imagens e vídeos em três dimensões.

Utilizado em conjunto com as GPUs GeForce, o 3D Vision consiste nos seguintes componentes:

• Óculos Sem Fio 3D Estereoscópico Ativo
Projetado com lentes especiais, oferece o dobro de resolução por olho e ângulo de visão superior, em comparação com os óculos passivos. Parecidos com os óculos de sol, são uma alternativa aos tradicionais óculos 3D de papel e plÁstico.

• Emissor Infravermelho de alta potência (porta USB)
Transmite dados diretamente para os óculos 3D, a uma distância de até seis metros, além de possuir um controle de ajuste em tempo real.

• Monitores Ultra-Flexíveis
Projetado para os monitores LCD de 120Hz ViewSonic e Samsung, HDTVs Mitsubishi DLP 1080p, e projetores DepthQ HD 3D, o 3D Vision produz imagens 3D estereoscópicas nítidas em soluções de todos os tipos.

• Softwares de Compatibilidade
Softwares da NVIDIA convertem automaticamente mais de 300 jogos para o formato 3D Stereo, sem a necessidade de patches ou atualizações. O 3D Vision também é a única solução 3D a suportar as tecnologias SLI, PhysX, e o Microsoft DirectX 10.

• Visualizador 3D
Inclui também um visualizador 3D Vision gratuito que permite a captura de screenshots e sua posterior visualização em 3D. Também é possível importar fotos e vídeos 3D de diversas outras fontes, como galerias de fotos da Internet.


Não bastasse tudo isso, recentemente a NVIDIA ampliou a tecnologia, com o lançamento do 3D VISION SURROUND (imagem acima), que nada mais é do que ampliar a capacidade para até 3 monitores simultaneamente, formando assim uma ampla Área de visualização em 3 dimensões.

Para saber mais detalhes sobre a tecnologia, leia nossa review completa do 3D Vision aqui.

SLI

Antes de iniciarmos a falar da tecnologia SLI, é preciso voltar no tempo. Em 1998, em uma época em que Radeons e GeForces eram meras coadjuvantes, havia uma Rainha das Placas 3D: a Voodoo 2 da então 3Dfx. A placa tinha como destaque o suporte ao SLI (Scan Line Interleaving), que possibilitou colocar duas VGAs PCI (não confundir com o atual PCIe) Voodoo 2 para renderizar os grÁficos em regime de cooperação, dividindo as linhas de varredura em pares e ímpares, sendo que cada uma das placas ficava encarregada de processar um tipo de linha. Como resultado, o ganho de performance foi imenso para a época.

Sendo assim, a tecnologia SLI presente tanto na antiga Voodoo 2 quanto nas modernas GeForces é a mesma: unir duas ou mais placas de vídeo em conjunto para produzir uma única saída. Trata-se, portanto, de uma aplicação de processamento paralelo para computação grÁfica, destinada a aumentar o poder de processamento disponível nas placas 3D.

Depois de comprar a 3Dfx em 2001, a NVIDIA adquiriu a tecnologia, mas deixou-a "engavetada" até 2004, quando a reintroduziu com o nome de Scalable Link Interface. Contudo, a tecnologia por trÁs do nome SLI mudou dramaticamente.

Enquanto o modo SLI original dividia as linhas da tela (scan-lines) entre as placas — uma renderizava as linhas horizontais pares, enquanto a outra as ímpares — o modo SLI adotado pela NVIDIA (e também no CrossFire da ATI) separa o processamento por partes da tela (split frame rendering) ou em quadros alternados (alternate frame rendering). Abaixo, maiores detalhes dos métodos:

• SFR (Split Frame Rendering ou Renderização por Divisão de Quadros)
Trata-se do método em que se analisa a imagem processada, a fim de dividir a carga de trabalho em duas partes iguais entre as GPUs. Para isso, o frame/quadro é dividido horizontalmente em vÁrias proporções, dependendo da geometria. Vale destacar que o SFR não escalona a geometria ou trabalho tão bem como no AFR. Este é o modo padrão usado pela configuração SLI usando duas placas de vídeo.

• AFR (Alternate Frame Rendering ou Renderização Alternada de Quadros)
Aqui, cada GPU renderiza frames/quadros inteiros em seqüência - uma trabalhando com os frames ímpares e outra ficando responsÁvel pelos pares, um após o outro. Quando a placa escrava/secundÁria finaliza o processo de um quadro (ou parte dele), os resultados são enviados através da ponte SLI para a VGA principal, que então mostra o frame por completo. Esse é o modo utilizado normalmente pelo Tri-SLI.

• AFR de SFR
Como o próprio nome sugere, trata-se do método híbrido, no qual os dois processos descritos acima são utilizados. Desta forma, duas GPUs processam o primeiro quadro via SFR, enquanto as outras duas renderizam o frame seguinte também em SFR. Como é possível perceber, é necessÁrio, portanto, quatro placas 3D, em um conjunto chamado Quad-SLI.

• SLI Antialiasing
Esse é um modo de renderização independente voltado para a melhoria da imagem, que oferece até o dobro do desempenho com o filtro antialiasing (para retirar o efeito serrilhado) ativado, através da divisão da carga de trabalho entre as duas placas de vídeo. Enquanto com uma placa é possível normalmente utilizar até 8X de filtro antialiasing, com esse método ativado, pode-se chegar a 16X, 32X ou mesmo a 64X via Quad-SLI.

Assim como com o CrossFire, é preciso possuir uma placa mãe com slot PCI Express x16. Na verdade pelo menos dois, ou ainda com três ou quatro, para Tri-SLI ou Quad-SLI. Como a comunicação entre as placas é realizada via ponte SLI (conector dedicado que ligas as VGAs) e não pelo slot PCIe, não hÁ grandes problemas em utilizar o PCI Express na configuração x8.

Atualmente, não hÁ restrição quando aos tipos de placas a serem utilizadas no SLI, bastando apenas que as mesmas possuam o mesmo chip grÁfico. No início, a tecnologia restringia o uso de VGAs idênticas, do mesmo fabricante e, em alguns casos, com a mesma versão da BIOS! Felizmente, hoje isso é coisa do passado.

PureVideo

Trata-se do recurso de otimização de imagem e decodificação por hardware de vídeos nos formatos WMV, WMV-HD, MPEG4, DVD e HD-DVD, tendo ainda como vantagem o fato de desafogar a CPU do oneroso trabalho, transferindo a tarefa para a GPU. Assim, o usuÁrio poderÁ ainda utilizar o computador para executar outras tarefas, como por exemplo, navegar pela web.

O PureVideo possui os seguintes recursos:

• Aceleração MPEG-2 de alta definição por hardware: Um processador dedicado de 16 vias proporciona fluência na reprodução de vídeo de alta definição (HD) com o mínimo uso da CPU;

• Aceleração WMV de Alta Definição por hardware: Suporte programÁvel ao novo formato disponível no Windows Media Player e no Windows XP MCE 2005, proporcionando fluidez na reprodução de vídeos WMV e WMV-HD;

• Gravação de vídeos em tempo real de alta qualidade: Uma avançada engine de compensação possibilita gravação em tempo real sem perda de qualidade;

• Desentrelaçamento temporal/espacial adaptÁvel: Permite assistir a conteúdo entrelaçado provindo de satélite, cabo e DVD nos mínimos detalhes sem serrilhados ou artefatos;

• 3:2 Correção Pull-down e Correção Bad Edit: Restaura o filme ao seu formato original de 24 fps, evitando o aparecimento de"fantasmas" e "trepidações" durante a reprodução;

• Flicker-free Multi-Steam Scaling: Mantém a qualidade de imagem aumentando ou diminuindo a Área da tela de reprodução;

• Display Gamma Correction: Detecção automÁtica de formato que ajusta a qualidade de cor na reprodução para que não seja muito escuro ou claro demais, independentemente da tela;

Badaboom

Trata-se da tecnologia utilizada para a conversão de diferentes formatos de streaming multimídia para utilização em outros meios. A grande diferença do Badaboom para a grande maioria dos outros programas existentes no mercado é que, enquanto seus concorrentes utilizam o processador para executar a tarefa, a solução da NVIDIA faz uso de outra tecnologia, a CUDA, ou seja, da GPU. Desta forma, o processo é realizado de forma muito mais rÁpida e eficiente.

Outro benefício é que ao deixar a CPU livre, o usuÁrio poderÁ realizar outras atividades, como por exemplo, navegar pela a web. Na conversão tradicional via processador, a mÁquina fica praticamente inoperante para outras tarefas.

Na versão 1.2.1, o Badaboom Media Converter é vendido por US$30 e possui como um dos grandes destaques a facilidade na interface. O usuÁrio necessitarÁ apenas escolher a origem, ajustar as configurações e definir o destino.

Embora seja focado para os produtos da Apple, como iPhone, iPod e Apple TV, o usuÁrio poderÁ definir ainda uma série de opções de saída, como Xbox 360, PS3, PSP e HTPCs.

{break::Nova geração de drivers}A GeForce GTS 450 estÁ trazendo consigo uma nova classe de drivers para o mundo das placas de vídeo da NVIDIA com o advento do ForceWare 260.52.

Além do aumento na performance, que de acordo com a NVIDIA pode chegar a até 22%, como é o caso de "Riddick: Dark Athena", a partir de agora, os ForceWares da série 260.xx trarão uma série de facilidades e melhorias, tais como:

3D VISION
- Suporte ao 3D VISION (dispensando assim a instalação de um driver próprio em separado);

Blu-ray 3D
- Reprodução de discos Blu-Ray ao conectar a GPU a uma TV 3D HDMI 1.4;

Áudio HD
- Suporte sem perdas para as tecnologias DTS-HD Master Audio e Dolby TrueHD compatíveis para filmes em Blu-ray paras as GeForces séries GTX/GTS 400, e GT 200.


Além disso, a nova geração de drivers trouxe significativos avanços em seu instalador, com interface mais avançada e personalizada, dividido em duas opções: Express (expressa) e Custom (personalizada).

Nesta última opção, o usuÁrio poderÁ agora de forma rÁpida e eficiente, uma instalação "limpa", excluindo em definitivo uma versão antiga do driver, bem como fazendo a remoção completa de qualquer entrada ou menção do mesmo no sistema. É possível ainda escolher uma série de componentes auxiliares, como os softwares para o PhysX, driver para Audio HD e 3D Vision.

{break::Modelos Parceiros}Abaixo temos fotos dos modelos de praticamente todas as parceiras atuais da Nvidia que lançaram ou irão lançar placas de vídeo baseadas no chip GeForce GTX 460.

Asus


eVGA


Gainward

Galaxy

Gigabyte

Jetway

Leadtek

MSI

Palit

PNY

PoV

Sparkle

Zotac



{break::Asus GTS 450 DirectCU TOP (Overclocked)}Além do modelo de referência gentilmente enviado pela NVIDIA, gostaríamos de deixar registrado os agradecimentos à toda equipe da Asus por ter nos cedido, em primeiríssima mão (somos o único portal de tecnologia do Brasil a receber a VGA), o modelo top de linha da companhi. em se tratando de GeForce GTS 450.


Batizada de ENGTS450 DirectCU TOP, a VGA é, sem dúvidas, um produto altamente diferenciado e especial, em virtude de suas características. Um dos principais destaques estÁ em seus clocks, trabalhando bem acima do modelo padrão da NVIDIA. Ao invés dos 783Mhz de GPU, tem-se 925Mhz!, ou seja, um overclock de fÁbrica de 18%. Para quem achou pouco, de acordo com a Asus, é possível ainda ir bem além desse patamar, chegando ao mÁximo de 1.3Ghz com sistema de refrigeração especial a base de nitrogênio líquido. Em se tratando de CUDA Cores/Shaders Processors, o modelo da Asus trabalha a 1850Mhz contra 1566Mhz de uma GTS 450 comum. Por fim, as memórias têm clock de 4.0Ghz, aumento de 400Mhz em relação ao modelo padrão.

Diante de especificações tão robustas, a Asus se preocupou em equipar a ENGTS450 DirectCU TOP com componentes de primeiríssima qualidade, como é o caso do uso de "POSCAPs" – capacitores eletrolíticos sólidos de 4 fases possuindo o mais baixo nível de E.S.R. (Resistência de Séries Equivalentes) e com excelente performance para alta freqüência, possuindo baixo perfil, alta capacitância e confiabilidade, além de alta resistência térmica. Sua função principal é dar estabilidade à VGA em overclock ao proporcionar maior fluxo de corrente, e voltagem mais estÁvel durante o ajuste. De acordo com a Asus, o benefício é de 32% em relação aos modelos com capacitores convencionais de 3 fases.


Pensando nos mínimos detalhes, os engenheiros da Asus disponibilizaram um protetor para o PCB (PCB Stiffener) que junto com a tecnologia GPU Guard, reforçam a estrutura da VGA, evitando assim que a placa se envergue (e quebre/rache) durante o manuseio ou mesmo durante o uso diÁrio dentro do gabinete. Completando a lista de proteção, a ENGTS450 DirectCU TOP conta com EMI blindados, reduzindo as interferências eletromagnéticas em 66% e tornando os sinais mais estÁveis; Covered Chokes, garantindo maior eficiência energética e gerando menos calor em relação aos tradicionais Toroidal Coil Chokes e finalmente, capacitores sólidos que reduzem as perdas de energia, aumentando a estabilidade e durabilidade da placa. Por fim, hÁ ainda a tecnologia FUSE Protection, conjunto de micro fusíveis que protegem a placa contra sobrecargas elétricas.


Outro ponto alto da ENGTS450 DirectCU TOP é o seu avançado sistema de refrigeração, baseado na tecnologia de design térmica DirectCU. O recurso garante uma maior eficiência na dissipação do calor e simultaneamente gera menos ruído do que o modelo de referência.


O nome da tecnologia é uma referência ao contato direto dos heatpipes de cobre com a GPU. Ao todo são 2 heatpipes de 8mm que passam pelo bloco de dissipação e aletas de alumínio, aumentando, assim, a dissipação térmica. HÁ ainda uma ventoinha PWM a prova de poeira, garantindo uma vida útil 25% maior e gerando apenas 21dB quando ocioso (idle).

De acordo com a Asus o sistema de refrigeração DirectCU dissipa 20% mais calor e é 35% mais silencioso do que o cooler do modelo de referência.


Os diferenciais não param por aí. A placa conta ainda com o utilitÁrio para overclock, chamado Smart Doctor, capaz de alterar a voltagem da GPU sem a necessidade de ajustes nas configurações da BIOS ou mesmo reiniciar o computador. Desta forma, os jogadores podem obter mais FPS sob demanda sem interromper a ação passada na tela.

Por fim, mas não menos interessante, a ENGTS450 DirectCU TOP vem ainda com um programa de brinde da AIWI que permite utilizar o iPhone e o iPod Touch como um teclado e mouse sem fio. Para completar, o software transforma os dois gadgets da Apple em sensores de movimentos wireless, o que confere uma nova e emocionante sensação para simuladores de esportes e jogos de corrida.

Confiram abaixo o vídeo de apresentação da tecnologia remota AIWI:


{break::Fotos}Abaixo fotos da GeForce GTS 450 modelo referência da NVIDIA. Nas fotos colocamos ela sendo comparada com a GTS 450 overclockada da Asus (ENGTS450 DirectCU TOP) e com uma versão de referência da GTX 460. O destaque ficou pela diferença no tamanho do PCB da GTS 450 da Asus sobre o modelo referência.

Asus GeForce GTS 450 DirectCU TOP (Overclocked)
Após as fotos do modelo referência, vamos às da ENGTS450 DirectCU TOP, modelo que vem com um overclock considerÁvel. Para isso a Asus desenvolveu um cooler especial, com alguns heatpipes e, inclusive, com PCB maior do que o utilizado no modelo referência, como jÁ destacamos.

{break::MÁquina/Softwares utilizados}Utilizamos nos comparativos placas destinadas ao mercado intermediÁrio, sendo de nova geração os modelos GeForce GTX 460 768 MB, Radeon HD 5770 e Radeon HD 5750. Também colocamos dois modelos da geração passada da NVIDIA, as GeForces GTX 260 e GTS 250.


Abaixo, detalhes da mÁquina, sistema operacional, drivers, configurações de drivers e softwares/games utilizados nos testes.

MÁquina utilizada nos testes:
- Mainboard ECS X58B-A
- Processador Intel Core i7 920 @ 3.8GHz
- Memórias 6 GB DDR3-1600MHz G.Skill Trident
- HD 1TB Sata2 Wester Digital Black
- Fonte XFX 850W Black Edition
- Cooler Thermalright HR-02 com FAN 12x12

Sistema Operacional e Drivers:
- Windows Seven 64 Bits
- Intel INF 9.1.2.1007
- ForceWare 260.52: GeForce GTS 450, GTX 460 768 Mb
- ForceWare 258.96 WHQL: GeForce GTX 260 e GTS 250
- ATI Catalyst 10.8: Radeon HD 5770 e 5750

Configurações de Drivers:
Games
- Texture filtering: High Quality
- Vertical sync: OFF
- Demais opções em Default

Aplicativos/Games:
- 3DMark Vantage (DX10)
- Unigine Heaven Benchmark 2.1 (DX11)

- "Aliens vs Predators" (DX11)
- "Crysis Warhead" (DX10)
- "DiRT 2" (DX11)
- "Just Cause 2" (DX10.1)
- "Mafia II" (DX9)
- "Metro 2033" (DX11)
- "StarCraft II" (DX10)

{break::GPU-Z, Temperatura}GPU-Z
Abaixo, a tela principal do GPU-Z, mostrando as principais características dos dois modelos de GTS 450 testados. Notem as diferenças de clocks entre as duas placas, com ampla vantagem para o modelo da Asus.


(GeForce GTS 450 - Modelo de Referência da NVIDIA)


(Asus ENGTS450 DirectCU TOP)

Temperatura
Iniciaremos nossa bateria de benchmarks com um dos testes mais solicitados e importantes de uma VGA: a temperatura.

A NVIDIA deixa mais uma vez claro que a questão das altas temperaturas é coisa do passado, em que as novas VGAs conseguem manter uma ótima relação de performance x consumo de energia.

Em idle, onde a placa estÁ praticamente "adormecida", o modelo de referência da GTS 450 surpreendeu ao ficar em primeiro lugar, à frente da ENGTS DirectCU TOP. Outro destaque foi para a segunda posição da GTX 460, placa de segmento mais elevado e que por isso mesmo naturalmente consome mais energia e gera mais calor. A concorrente direta da GTS 450, a Radeon HD 5750 ficou apenas na quinta colocação, com 6°C a mais de temperatura. Em último estÁ a 5770, com 40°C.

Quando as placas são submetidas a stress (full), o cenÁrio muda. Mais uma vez, a GTX 460 surpreende e reforça a sua condição de uma das melhores VGAs no quesito custo x benefício x consumo de energia, sagrando-se a grande campeã. Em seguida vem a placa da Asus, mostrando todo o poder do sistema de refrigeração DirectCU. Empatadas na terceira posição estão as GTX 260 e GTS 250.

Uma provÁvel explicação para a superioridade das VGAs da geração passada da NVIDIA sobre a GTS 450 "padrão" esteja no fato de que esta última possui clocks mais elevados e bem mais transistores, apesar de sua litografia mais refinada em 40nm.

Este teste derrubou o mito de que as Radeons da série 5000 sempre geram menos calor do que as GeForces. Apesar de esquentarem, respectivamente, 1 e 2 graus Celsius a mais do que a GTS 450, as Radeons HD 5750 e 5770 ficaram nas duas últimas posições.

{benchmark::843}

{break::3DMark Vantage, Unigine HEAVEN 2.1}3DMark Vantage
Embora seja considerado um teste bastante polêmico por parte da comunidade, por ser tachado como um bench sintético que muitas vezes não reflete a condição da placa no mundo real (leia-se jogos), o 3DMark Vantage é um dos indicadores de performance mais amplamente utilizados em todo o mundo, e não poderíamos refutÁ-lo neste teste.

Como não poderia deixar de ser, a GTX 460 estÁ absoluta na primeira colocação, com uma vantagem de 22% ou 2.733 pontos sobre a Asus ENGTS DirectCU TOP, que por sinal surpreendeu ao bater a Radeon HD 5770 (quarta colocação) por 10%, ficando ainda à frente da GTX 260 Matrix com 7% de vantagem.

Na quinta posição, com 15% de superioridade em relação à Radeon 5750, ficou a GTS 450. A GTS 250 ficou bem atrÁs, demonstrando que a G92b jÁ não tem tanto fôlego assim.

{benchmark::844}

Unigine HEAVEN Benchmark 2.1
Trata-se de um dos testes sintéticos mais "descolados" do momento, pois tem como objetivo mensurar a capacidade das placas 3D em suportar os principais recursos da API grÁfica DirectX 11, como é o caso do Tessellation.

O teste fora dividido em duas partes: uma sem e outra com o uso do Tessellation, ambos a 1920x1080 com o filtro de antialiasing em 8x e anisotropic em 16X.

No primeiro cenÁrio (sem o Tessellation), a Asus ENGTS DirectCU TOP surpreendentemente ficou em primeiro lugar com 548 pontos, deixando para trÁs a sua irmã maior, a GTX 460 (versão com 768MB e 192 bits) com 539 pontos. Mais uma vez o modelo padrão da GTS 450 se deu bem frente à Radeon 5750 (483 x 406). Desta vez, a placa ainda levou sobre a 5770, que cravou 459 pontos.

No teste com tessellation setado em "normal", nenhuma mudança de posição, Asus ENGTS DirectCU TOP em primeiro, seguido da GTX 460, GTS 450 "padrão", Radeon 5770 e 5750. Este teste corrobora com a tese da NVIDIA de que as VGAs da geração Fermi se dão melhor que as Radeons série 5000 no quesito Tessellation, em virtude das novas GeForces terem mais unidades especialmente projetadas para lidar com este recurso do que as Evergreen. Contudo, a coisa deve mudar com a chegada das Radeons 6000, uma vez que hÁ fortes indícios de que a futura geração tenha 4 vezes mais unidades para o Tessellation do que as Radeons 5000.

{benchmark::845}

{break::Aliens vs Predators}Chegamos finalmente ao ponto alto do review: os testes em jogos! Nada melhor do que começar por Aliens vs Predator, game que foi um dos primeiros a ser lançados com o suporte ao DX11 e que foi muito bem recebido pelo público e crítica.

Nas três resoluções testadas, o resultado foi o mesmo: GTX 460 absoluta em primeiro, com a ENGTS DirectCU TOP na segunda posição, Radeon 5770 em terceiro lugar, GTS 450 "padrão" em quarto e a 5750 na última posição.

O destaque fica realmente para a GeForce GTS 450 overclockada da Asus na vice liderança a frente da 5770. Outro ponto a ser destacado é a GTS 450 "comum" sempre a frente da Radeon 5750. A título comparativo, a ENGTS DirectCU TOP foi, em média, 15% mais veloz que a GeForce GTS 450 em todas as resoluções.

{benchmark::846}

{benchmark::847}

{benchmark::848}

{break::Crysis Warhead}O FPS futurístico da Crytek fez muito barulho por trazer uma qualidade grÁfica bem superior aos concorrentes e por ser considerado por muito tempo como um dos games que mais exigia recursos do computador, principalmente das placas 3D. Desta forma, nada melhor do que submeter as VGAs do review pelo crivo de "Crysis Warhead".

Assim como em "AvP", os resultados das VGAs mantiveram-se inalteradas nas 3 resoluções. Em primeiro a GTX 460 (21% mais rÁpida do que a ENGTS DirectCU TOP em 1280x1024 e em 1680x1050 e 19% em 1920x1080). Esta por sua vez foi apenas 1% mais veloz que a GTX 260 Matrix nas três situações.

Briga acirradíssima pela quarta posição entre Radeon 5770 e a GeForce GTS 450. Mas por quase nada a placa da AMD levou a melhor. A mesma situação para a sexta posição, onde por um "fio de cabelo" a Radeon 5750 venceu a GTS 250. A diferença entre a GeForce GTS 450 turbinada da Asus para a versão comum foi de 15% nas três resoluções.

{benchmark::849}

{benchmark::850}

{benchmark::851}

{break::DiRT2}"Colin McRae: Dirt 2", mais conhecido simplesmente como DiRT 2, é uma das séries de corrida off-road de maior sucesso da história da indústria dos jogos eletrônicos. Lançado em setembro de 2009, o game foi um dos primeiros a ser desenvolvido com o DirectX 11.

Finalmente ocorreram algumas mudanças de posições ao longo das três resoluções. Em 1280x1024, a GTX 460 foi 24% mais veloz do que a segunda colocada, a ENGTS DirectCU TOP. Esta foi apenas 1,1 FPS mais poderosa que a Radeon 5770. Mas em compensação foi 11% mais veloz que a quarta colocada, a GTS 450 comum. Em último lugar, apenas 0,3 FPS, ficou a Radeon 5750.

{benchmark::852}

Em 1280x1050, com 25% de vantagem sobre o segundo lugar, temos a GTX 460. Finalmente as Radeons mostram do que são capazes, ficando a frente das GeForces GTS 450. Em segundo ficou a 5770 com 48,2 FPS, contra 47,5 FPS da terceira colocada Asus ENGTS DirectCU TOP. A quarta posição foi para a 5750, 0,6 FPS a frente da GTS 450 padrão.

{benchmark::853}

Em 1920x1080 as colocações não se alteram: GTX 460 em primeiro, Radeon 5770 em segundo, com a Asus ENGTS DirectCU TOP na terceira posição, seguidas da 5770 em quarto e GTS 450 comum em quinto. 

{benchmark::854}

Em um comparativo entre a Asus ENGTS DirectCU TOP e a GTS 450 "padrão", a placa da Asus foi em média, 14% mais veloz que a versão de referência da NVIDIA nas três resoluções.

{break::Just Cause 2}Em "Just Cause 2", ocorre um fato interessante: a Radeon HD 5770 "rouba" a liderança da GTX 460 nas três resoluções. Assim como a 5750, que fica a frente das duas GTS 450.

Em 1280x1024, a vantagem da 5770 sobre a GTX 460 é de 5%. Esta por sua vez é 10% mais rÁpida que a terceira colocada, a 5750. A diferença do terceiro para o quarto lugar (ENGTS DirectCU TOP) é de 8%. Em quinto ficou a GTX 260 Matrix, 20% a frente da GTS 450 padrão. A VGA com chip GF106 foi 32% mais poderosa que a GTS 250.

{benchmark::855}

Em 1680x1050, embora a Radeon 5770 mantenha-se no top, a GTX 460 encosta, sendo apenas 1,5% mais lenta. JÁ a vantagem da GTX 460 para a 5750 é de 13,5%. Em relação à ENGTS DirectCU TOP, a 5750 é 5% mais rÁpida que a placa da Asus. JÁ a GTX 260 Matrix é 14,5% mais veloz que a GTS 450 padrão. Esta, por sua vez, fez 50% mais FPS que a GTS 250.

{benchmark::856}

Por fim, em 1920x1080, a única mudança ficou na disputa pela quarta colocação, com a GTX 260 Matrix "roubando" o lugar da ENGTS DirectCU TOP por ínfimos 0,1 FPS.

{benchmark::857}

Mais uma vez a diferença entre a ENGTS DirectCU TOP da GTS 450 de referência foi bem expressiva, de 24% em 1280, 16,5% em 1680 e de 17% em 1920.

{break::Mafia II}"Em Mafia II", game recém-lançado que trouxe a continuação do aclamado game de ação em terceira pessoa e ambientado no obscuro mundo da mÁfia italiana dos anos 40 e 50 nos EUA, a liderança voltou para a GTX 460. A GTX 260 Matrix, até então em posições apenas intermediÁrias. Fez bonito e conquistou a segunda colocação, à frente da Radeon HD 5770. O quarto lugar ficou para a ENGTS DirectCU TOP. Outro fato curioso foi que a GTS 250 deixou a GTS 450 na última posição. Vale ressaltar que em todas as resoluções, a briga pelas posições foi bastante acirrada.

{benchmark::858}

{benchmark::859}

{benchmark::860}

Na média, a diferença entre a ENGTS DirectCU TOP e a GTS 450 padrão foi de 15% em favor da placa da Asus em todas as resoluções, novamente demonstrando um ótimo ganho de performance.

{break::Metro 2033}Atendendo a inúmeros pedidos, disponibilizamos os benchs com Metro "2033", FPS da 4A Games baseado em um romance homônimo russo, que conta a saga dos sobreviventes de uma guerra nuclear ocorrida em 2013 que se refugiam nas estações de metrô. O game, que faz uso intensivo da técnica de Tessellation e demais recursos do DirectX 11, desbancou o título de jogo mais pesado de "Crysis". Sendo assim, nada melhor do que observar como se comportam as VGAs sob este intenso teste.

à exceção da GTX 460, que reinou absoluta em todas as resoluções, as demais placas tiveram um resultado muito semelhante, sem grande favoritismo para as Radeons ou GeForces.

Em 1280x1024, a Radeon 5770 ficou em segundo lugar com 2,5% de vantagem (ou 1 FPS) sobre a ENGTS DirectCU TOP. A quarta posição foi para a GTS 450 da NVIDIA, que foi 1,5% mais veloz (0,5 FPS) que a 5750.

{benchmark::861}

Em 1680x1050 houve não um, mas dois fatos inusitados. Asus ENGTS DirectCU TOP e Radeon 5770 ficaram empatadas na segunda posição com 33 FPS, assim como a GTS 450 da NVIDIA e a Radeon 5750 também obtiveram os mesmos FPS, 29.

{benchmark::862}

Finalmente em 1920x1080, por um quadro por segundo (30 contra 29 FPS), a Radeon 5770 bateu a ENGTS DirectCU TOP, conquistando a segunda posição. A briga pela quarta colocação não foi menos intensa. Melhor para a 5750, que por 0,5 FPS ultrapassou a GeForce GTS 450 da NVIDIA.

{benchmark::863}

A vantagem da versão turbinada da Asus sobre o modelo de referência da NVIDIA foi de 14% (média) nas três resoluções. Outro bom ganho da ENGTS DirectCU TOP.

{break::StarCraft II}Não poderíamos deixar de fora em nossos testes um dos games mais aguardados dos últimos tempos. Desenvolvido pela Blizzard Entertainment como a sequência de um dos mais populares jogos de estratégia dos anos 90, "StarCraft II: Wings of Liberty" é um dos testes de referência utilizados nos principais portais de tecnologia.

"StarCraft II" foi um dos testes onde houve um maior delta (diferença de resultado) entre o primeiro e último colocado (33,7 FPS ou 78,5% de vantagem). As colocações praticamente ficaram as mesmas, a exceção em uma resolução, havendo troca entre duas VGAs. No topo, mais uma vez a GTX 460. Outro fato a destacar é o comportamento anormal das Radeons HD 5770 e 5750, ambas ficando nas duas últimas posições, atrÁs da GTS 250.

Em 1280x1024, 4 placas demonstraram um desempenho bem parecido. GTX 460, ENGTS DirectCU TOP, GTX 260 Matrix e GTS 450 padrão ficaram respectivamente em 1º, 2º, 3º, e 4º lugares. 14,5% atrÁs da GTS 450 estÁ a GTS 250, que foi 17,5% mais veloz que a 5770. Na lanterna ficou a 5750, 14% atrÁs da sua "irmã maior".

{benchmark::867}

Em 1680x1050, a GTX 460 consegue abrir uma vantagem de 10% sobre a segunda colocada, a ENGTS DirectCU TOP. Contudo, GTX 260 Matrix e GTS 450 padrão ficaram bem próximas da GTS 450 turbinada da Asus, respectivamente em terceira e quarta posições. A GTS 250 foi 18% mais lenta que a GeForce GTS 450 da NVIDIA. Esta por sua vez foi 12% mais potente que a Radeon 5770. A 5750 foi 14% mais lenta que a sua "irmã maior", ficando assim na última posição.

{benchmark::868}

Em 1920x1080, as posições são idênticas as da resolução intermediÁria, ou seja, boa vantagem da primeira para a segunda colocada. Contudo, a GTX 260 Matrix "rouba" a vice liderança da ENGTS DirectCU TOP, ficando em terceiro, seguida da GTS 450 padrão da NVIDIA em quarto lugar. Estas 3 últimas com desempenhos semelhantes. 16% atrÁs da GTS 450 de referência, estÁ a GTS 250 em quinto lugar. Em sexto lugar ficou a 5770, 8% atrÁs da GTS 250 e 13,5% acima da última colocada, a Radeon 5750.

{benchmark::869}

Outro fato curioso é que em "StarCraft II", a diferença da ENGTS DirectCU TOP para a GeForce GTS 450 de referência foi insignificante, de apenas2% nas duas primeiras resoluções e de míseros 1% em 1920x1080.

{break::PhysX} Não poderiamos deixar de fora testes com a tecnologia PhysX ativada. Para isso, testamos as placas da Nvidia rodando "Mafia II", que faz bastante uso dessa tecnologia.

Confiram abaixo o comportamento das placas.

{benchmark::864}

{benchmark::865}

{benchmark::866}

{break::Filtros ON / OFF}Como estamos testando placas de segmento intermediÁrio, em vÁrios de nossos testes padrões, por utilizarmos games recentes, as placas não conseguem atingir FPS altos, dessa forma fizemos alguns testes com os filtros desativados, para termos noção do comportamento delas quando rodando sem filtros.

Confiram abaixo algumas fotos e testes.

"Aliens vs Predators"
Reparem que as placas alcançaram scores muito mais altos quando não utilizando filtros, típico comportamento de placas de segmento de entrada ou intermediÁrio, jÁ que não são desenvolvidas como foco no uso massivo dessas tecnologias. Para comparação, analisamos os resultados da resolução de 1920x1080 sem filtros ativados, que são melhores do que 1280x1024 com filtros em 4xAA 16xAF no "Aliens VS Predator".

{benchmark::870}

"Just Cause 2"
Com "Just Cause 2", a história não muda: novamente, o resultado da resolução mais alta sem filtros é superior ao resultado alcançado pelas placas na resolução mais baixa com filtros. Aos menos informados, placas de segmento TOP de linha normalmente alcançam uma regularidade maior quando rodando com filtros ativados, não tendo quedas bruscas no desempenho como acontece em placas de segmento de entrada e intermediÁrio.

{benchmark::871}

{break::Overclock}Assim como a GTX 465 e as GTX 460, a GTS 450 é outra placa da Nvidia com ótimo potencial para overclock.

Nessa review, testamos ao mesmo tempo dois modelos de GTS 450, um com clock´s referência, com core setado a 783MHz e memórias a 1.8GHz, e o modelo overclockado da Asus com core trabalhando a 925MHz e memórias a 2GHz. Diga-se de passagem, deveremos ter uma chuva de modelos overclockados nos próximos meses com o chip GTS 450.

Fizemos overclock em ambos os modelos, tanto na referência como também na placa da Asus, aumentando ainda mais seus clocks, só possível devido a empresa ter desenvolvido um cooler diferenciado e colocado dissipadores nas memórias, diferente da referência, motivo a qual não deixa ela passar muito acima de onde colocamos.

Abaixo podemos ver as telas principais do GPU-Z de ambos os modelos, mostrando os clocks overclockados. No modelo referência colocamos o core a 920MHz(de tabela o shader a 1840MHz) e as memórias a 1950MHz. JÁ o modelos overclockado da Asus, que foi RE-Overclockado, chegou a incríveis 980MHz no core(shaders a 1960MHz) e 2.2GHz nas memórias.

Com o overclock ambos os modelos aumentaram um pouco sua performance. Confiram abaixo alguns testes comparativos.

Temperatura
Como podemos ver, mesmo aumentando significativamente os clocks, tanto do modelo referência, como da Asus que jÁ era overclockada, a temperatura em "modo ocioso" quase não mudou, mostrando a eficiência dos sistemas de cooler. Vale destacar que em nenhum momento os FAN´s trabalharam em rotação mais alta, consequentemente não tivemos ruídos mais altos.

Quando o sistema estava em uso, tivemos uma leve subida na temperatura na comparação das placas em stock, mas continuando com resultados bem interessante por estarem com clocks bem mais altos do padrão.

{benchmark::872}

3DMark Vantage
Se tratando dos resultados prÁticos em performance, vemos que o modelo referência teve um ganho de cerca de 15% quando overclockada, como esperado, ainda abaixo do modelo da Asus que jÁ vem overclockada de fÁbrica com clock um pouco mais altos. Quando RE-overclockamos a placa da Asus,  tivemos um ganho na casa de 7%, mostrando que da para tirar ainda mais de uma GTS 450, mesmo dos modelos overclockados de fÁbrica.

{benchmark::873}

"Aliens vs Predator"
Por fim, rodando o game "Aliens VS Predator", o ganho do modelo referência quando overclockado foi em média de 15%. JÁ a placa da Asus ficou pouco acima dos 5%.

{benchmark::874}

{break::SLI}Atualmente praticamente todo o modelo de placa de vídeo lançado traz suporte à tecnologia de cascateamento de placas, seja Crossfire por parte da ATI, ou SLI pela Nvidia.

Não é toda combinação que surte um bom resultado, isso porque apesar de termos duas placas trabalhando em conjunto, não quer dizer que a velocidade dobrarÁ. Na verdade, isso nunca vai acontecer. Um resultado acima de 80% jÁ é muito bom para esse tipo de tecnologia. O problema é que não é uma regra, sendo que em um determinado game/aplicativo o resultado das placas cascateadas é 80% superior que uma trabalhando sozinha e, em outro, apenas 10%, às vezes nem existindo melhora.

As combinações mais atrativas estão sempre lecionadas ao preço e resultado do conjunto escolhido. Quando colocamos duas placas trabalhando juntas, e o resultado delas ultrapassa um modelo mais potente, e mesmo somando o preço delas continua ficando abaixo desse modelo mais potente, ai podemos dizer que é uma boa combinação. A Radeon 5770 é um bom exemplo disso, sendo que duas 5770 em Crossfire batem uma 5870, e com seus preços somados ainda custam menos que uma 5870.

Agora a pergunta é: A GeForce GTS 450 em SLI tem bons resultados? Fizemos alguns testes para ver como a placa se comporta quando utilizando essa tecnologia, confiram abaixo:

3DMark Vantage
Começamos pelo 3DMark Vantage, onde a placa quando trabalhando em SLI conseguiu um aumento de quase 90% em cima de uma GTS 450 sozinha. Resultado impressionante: quem dera fosse sempre assim.

{benchmark::875}

"Metro 2033"
Rodando o "Metro 2033", game com suporte a tecnologias do DirectX 11, como tessellation, o resultado também foi muito bom, sendo que o sistema quando trabalhando com SLI ativado fez com que o resultado ficasse com ganho sempre acima dos 70%, chegando a 90% na resolução mais alta, muito bom.

{benchmark::877}

"Mafia II" com PhysX
Por fim, fizemos alguns testes "Mafia II" com a tecnologia de física "PhysX" ativada. Como vemos abaixo, houve ganho, mas que ficou em média na casa de 40%, bem abaixo dos dois testes anteriores. Isso mostra bem como esse tipo de tecnologia não mantém uma regularidade, que se deve ao suporte do game e versões de drivers, que pode e deve ser melhorado no caso do "Mafia II".

Analisando os números, vemos que em SLI em nenhum momento o score ficou abaixo de 30 FPS, jÁ trabalhando sozinha a GTS 450 não tinha ultrapassado 30 FPS em nenhuma resolução, mesmo o modelo overclockado da Asus.

{benchmark::878}

{break::Conclusão}Embora tenha sido lançado aos "45 minutos do segundo tempo", a GeForce GTS 450 chegou demonstrando ser mais uma ótima opção de placa para quem não quer gastar uma "pequena fortuna" em uma VGA e que mostrou bom fôlego para encarar a grande maioria dos jogos, mesmo os recém lançados.

Por falar nisso, de acordo com a NVIDIA, a GeForce GTS 450 foi desenvolvida especialmente para conciliar uma ótima relação entre preço e performance para os gamers intermediÁrios que têm monitores entre 17 e 22 polegadas e que jogam com resoluções entre 1280x1024 e 1680x1050. De acordo com a companhia, 57% do universo de jogadores estão dentro das condições mencionadas acima..

A GTS 450 cumpriu com o esperado: o de se manter entre as Radeons 5750 e 5770. Entretanto, o modelo especial e turbinado da Asus, a ENGTS 450 DirectCU TOP foi bem mais além, brigando muitas vezes com a Radeon 5770 e chegando em alguns casos, a ultrapassÁ-la. Logicamente que isso só foi possível em virtude dos altos clocks da ENGTS 450 DirectCU TOP. O melhor de tudo é que a diferença entre o seu preço e o de uma GTS 450 "comum" é de apenas US$10 a mais, ou seja, US$139, um acréscimo irrisório por todos os diferenciais que a placa oferece, como é o caso dos ganhos extras de FPS, sistema de refrigeração especial e os componentes de primeiríssima qualidade.

HÁ ainda o fato de que a performance deverÁ ainda ter pequenos e sucessivos aumentos, na medida em que novos drivers forem lançados. Por falar nisso, a nova geração dos ForceWares parecem bem promissores, trazendo muitas novidades e facilidades aos usuÁrios.

Outros pontos positivos dizem respeitos aos baixos níveis de ruído da placa da Asus e ao baixo consumo e dissipação de calor da GTS 450. Junto com sua irmã maior, a GTX 460, a NVIDIA põe por terra definitivamente a fama de que as Fermis eram "beberronas" e demasiadamente "quentes".

Com a chegada da GF106, resta saber como que a AMD irÁ se comportar, se contra-ataca de imediato reduzindo os preços das Radeons 5700, se esperar mais um pouco para ver como o mercado reage, ou simplesmente não faz nada e aguarda pelo lançamento das Radeons HD 6700 que, segundo rumores, chegariam jÁ em outubro.

Apesar de ser um produto bem interessante, a NVIDIA perdeu muito mercado para a sua rival no segmento de entrada e intermediÁrio de baixo custo, pois muitos consumidores simplesmente "cansaram" de esperar pelas GeForces desses segmentos, optando pelos modelos da AMD.

Contudo, levando-se em conta principalmente o resultado das vendas de sua "irmã maior", a GTX 460, que é um verdadeiro sucesso, a GTS 450 tem tudo para, aos poucos, ir ganhando seu espaço no mercado.

 

PRÓS
- Alto potencial de overclock;
- Ótima relação de custo x benefício;
- Bom desempenho para o segmento.
- Suporte ao que hÁ de melhor em tecnologias
CONTRAS
- Chegou tarde ao mercado;
Assuntos
Tags
  • Redator: Fabio Feyh

    Fabio Feyh

    Fábio Feyh é sócio-fundador do Adrenaline e Mundo Conectado, e entre outras atribuições, analisa e escreve sobre hardwares e gadgets. No Adrenaline é responsável por análises e artigos de processadores, placas de vídeo, placas-mãe, ssds, memórias, coolers entre outros componentes.

O que você achou deste conteúdo? Deixe seu comentário abaixo e interaja com nossa equipe. Caso queira sugerir alguma pauta, entre em contato através deste formulário.