18/08/2011

Escolhendo a workstation certa para cada tipo de tarefa.

“No início era o PC, depois os deuses da informática criaram a workstation”. Assim poderia começar a ser escrito o evangelho da computação gráfica. Depois de vários anos sendo pau para toda obra, o PC teve que evoluir. Não resta dúvida que o chamado computador pessoal foi responsável por vários fenômenos na sociedade do século XX e que continua a fazer história no século XXI. Graças a ele, o uso do computador por bilhões de pessoas se tornou uma tarefa rotineira.
No trabalho, nos centros de pesquisa, nas universidades e em nossos lares, ele hoje é indispensável. Milhares de tarefas delegadas a máquinas e mecanismos distintos foram, aos poucos, sendo reunidas em um só equipamento. Os programas se multiplicaram aos milhões. Foram e são inventadas diariamente mais e mais atividades que usam o computador como administrador. Algumas delas, antes executadas por humanos, jamais voltarão a serem feitas manualmente
Na área de criação de entretenimento audiovisual o avanço foi enorme. A edição de vídeo passou de sistemas eletro-mecânicos lentos, grandes e caros para computadores muitas vezes portáteis como notebooks. A criação efeitos visuais em 2D ou 3D passou das pranchetas dos artistas gráficos e oficinas de maquetes para dentro dos computadores pessoais. A gravação e masterização de música e áudio pode ser feita em casa, com instrumentos e microfones ligados diretamente a equipamentos portáteis como notebooks e, mais recentemente, aos notepads.
Muito mais pessoas tem acesso a toda essa tecnologia e podem ingressar em um mercado de trabalho usando seus próprios equipamentos. Não dependem mais de serem empregados em grandes complexos industriais que antes detinham essas tecnologias e seus maquinários. Mas não devemos confundir disseminação e popularidade com banalização, sob pena de perder o foco da qualidade.
A popularização da tecnologia de criação e edição de conteúdo audiovisual possibilitou aos fabricantes de programas e de hardware baixarem os preços desses componentes, venderem mais e conseqüentemente terem mais recursos para investir em pesquisa e desenvolvimento desses produtos. Esse desenvolvimento aumentou a sofisticação dos recursos disponibilizados e por conseguinte a especialização dos equipamentos necessários para sua execução.
A geração atual de processadores para computadores e especificamente para placas de vídeo deu um salto qualitativo enorme. A Intel, líder na fabricação e venda de processadores e a AMD, sua maior concorrente conseguiram dar um salto enorme em um período de tempo curto na potencia de seus chips. Até o lançamento da segunda geração de processadores da série Core i7, o desempenho desses chips crescia de maneira linear e aritmética. Durante duas décadas cada modelo lançado era, geralmente 30% melhor que seu antecessor em termos de desempenho e economia de energia.
Da primeira para a segunda geração do Intel i7, o desempenho mais que duplicou em algumas tarefas. E a economia de energia chegou, em certos casos, a mais de 100%. Com os chipsets gráficos fabricados pela AMD e pela Nvidia parece estar ocorrendo o mesmo. Restrição feita entretanto ao quesito economia de energia, que não foi tão substancial quanto o desempenho.
Como eu monto workstations para edição não linear e computação gráfica, sempre estou sempre atento a esse desenvolvimento. A internet é uma fonte inesgotável de pesquisa. Procuro acompanhar os testes de desempenho e opiniões dos profissionais seriamente envolvidos com o tema. Atualmente monto 5 modelos distintos de equipamentos, cada um com uma finalidade-chave.
Como discorri no início do artigo, a especialização se tornou quase obrigatória. Uma determinada workstation equipada com um tipo de processador pode ser muito rápida para uma tarefa. Isso não significa que vá ter o mesmo desempenho em tarefas parecidas mas com requisitos ligeiramente diferentes.
Poucos anos atrás, minha meta era montar sistemas que pudessem realizar todas as tarefas comuns a um empreendimento dedicado a produção de conteúdo audiovisual. A métrica era a economia de recursos. E os aplicativos, até então necessários, rodavam razoavelmente bem em um único computador. Eu podia rodar programas de edição, pós-produção e criação de animações 2D e 3D sem maiores problemas.
A partir de 2009 o cenário mudou completamente. As necessidades e especificações técnicas se tornaram distintas. Hoje aceito a necessidade de ter 2 ou 3 sistemas diferentes, que se comuniquem entre si com velocidade, para realizar as etapas distintas da produção de um vídeo em alta definição. O custo certamente aumentou, mas pode ser pago com a economia de tempo conseguida.
Eu ainda posso montar um sistema rápido o bastante para trabalhar com computação gráfica e superdimensionado para edição de vídeo. Mas como o profissional também se tornou especializado, o uso de apenas um sistema implicaria em 2 ou 3 pessoas usando o mesmo computador. Um aguardando a sua hora de trabalhar no conteúdo terminado pelo colega.
Isso obviamente é inviável, dada a pressa permanente da nossa atividade. Os contratos tem prazos curtíssimos e sempre trabalhamos em cima de atrasos inerentes a própria natureza do trabalho criativo e dos caprichos do cliente.
Mesmo no caso do profissional autônomo e multi-tarefa tão comum no nosso meio, quase sempre é mais rápido realizar uma etapa em um sistema, perder alguns minutos exportando o conteúdo para outra e ganhar um tempo considerável na outra etapa.
Falando mais especificamente de números, vamos analisar os gráficos abaixo. O primeiro ponto que quero abordar, está relacionado com a velocidade de processamento a qual me referi no início desse artigo. Nos testes, usando três programas dedicados para edição, computação gráfica e pós-produção, que representam o fluxo geral da maioria dos trabalhos de vídeo para televisão, vemos que o desempenho da segunda geração de processadores i7 da Intel é substancialmente maior que seus predecessores.



Outro detalhe importante e surpreendente é que o processador i7 2600K de 4 núcleos conseguiu ser ligeiramente mais rápido que o processador i7 990X de 6 núcleos rodando o aplicativo Adobe After Efects CS5. Parece que o After Efects não se beneficia tanto da computação distribuída entre os diversos núcleos do processador quanto o Premiere Pro CS5 ou o 3DMax. Os dois núcleos físicos extras do i7 990X são mais foram mais rápidos rodando os dois últimos citados. Mesmo assim a diferença foi pequena considerando um aumento de 50% no número de núcleos. Isso pode estar relacionado ao uso da tecnologia Turbo Boost que aumenta automaticamente a frequência dos núcleos de acordo com o número deles em uso. No caso de todos os 6 núcleos estarem sendo usados, a frequência máxima do 990X fica pouco acima dos 3,46 Ghz oficiais. Enquanto o i7 2600K com 8 núcleos pode chegar até 3,8 Ghz.
O processamento paralelo distribuído por diversos núcleos faz diferença em todos os programas que usam essa tecnologia. Ainda observando o gráfico acima, percebemos que os tempos médios caíram pela metade entre o antigo Core 2 Duo de dois núcleos e o Core 2 Quad de quatro núcleos. E também entre o Core 2 Quad e Core i7 990X de seis núcleos.
Mas o desempenho do modelo i7 2600K de apenas 4 núcleos e processador numérico destravado (indicado pela sufixo K) é apenas ligeiramente inferior, sendo até mais rápido rodando o Adobe After Efects, que seu irmão maior e 3 vezes mais caro i7990X, ainda a grande estrela da Intel e considerado o processador mais rápido do mundo na categoria. Perde apenas para o Intel Xeon 5690 por pouca diferença e que custa estratosféricos R$ 5.000,00!
No aspecto custo-benefício também é necessário ressaltar que atualmente é discutível o investimento em estações de trabalho baseadas nos processadores Xeon e placas-mãe com duas CPU. A pergunta é: vale investir R$ 8.000,00 somente na compra de 2 processadores Xeon, fora o restante do hardware, contra R$ 800,00, que é o preço de um Core i7 2600K, para ter um ganho de apenas 40% de performance em aplicativos como o Adobe After Efects? Uma resposta da vida real: Renderizar 30 segundos de vídeo com 3 layers e alguns efeitos no After Efects CS5 com um processador i7 2600K, que custa R$ 800,00 vai levar nove minutos. Se o mesmo render for realizado com os dois Xeon a um custo 10 vezes mais alto, o tempo total será de cinco minutos. Economia de quatro minutos.
Se fosse um vídeo com duas horas de duração, os tempos seriam 36 horas de render com i7 2600K e 22 horas com uma estação usando os dois Xeon. Mas ninguém renderiza um vídeo desse tamanho em After Efects! Em 90% dos casos usamos o After para produzir comerciais de trinta segundos ou vinhetas menores que isso para ilustrar vídeos corporativos ou documentários. Devemos ter sempre em conta a duração da vida útil do equipamento. As tecnologias mudam rapidamente. A durabilidade pode ser longa, mas certamente a obsolescência vai aposentar antes sua estação de trabalho. E certamente, em um caso como o descrito acima, ela não iria se pagar.
Falei do primeiro ponto, que era o ganho de desempenho dos processadores atuais. O segundo ponto a ser considerado é a especialização das tarefas. Aqui deve ser levado em conta não apenas a adequação da CPU mas também o conjunto de hardwares que ela gerencia. Para certas aplicações com uso intensivo do processador, como em atividades de computação paralela, todos os núcleos devem ter memória RAM e velocidade de tráfego suficientes para evitar gargalos. Alguns programas exigem mais memória RAM, outros maior capacidade de processamento paralelo, outros dependem mais de um gerenciamento eficaz e veloz do fluxo de dados contido em diversos discos rígidos.
Cada processador deve trabalhar com um chipset apropriado e esse chipset por sua vez, demanda certas características contidas em outros chips incorporados nas placa-mãe. Então a combinação harmoniosa de todos esses elementos é que vai determinar a vocação de cada sistema. Vejamos o exemplo do Adobe After Efects CS5:

Como pode ser notado no gráfico acima, surpreendentemente o processador i7 2600 de 4 núcleos foi mais rápido que o mais rápido processador da Intel no momento. Embora a diferença tenha sido mínima, o i7 990X de 6 núcleos ficou 31 segundos atrás do concorrente. Esse resultado causa espanto em todos os autores de benchmarks de processadores. O resultado favorável ao 2600 se deve provavelmente a forma com que o programa gerencia o paralelismo entre os núcleos, a memória e os parâmetros de cada quadro de vídeo durante o render.
O After Efects em suas Preferências de Sistema, permite ao usuário escolher quantos núcleos quer dedicar exclusivamente ao render e quais devem ser deixados de lado para as demais atividades do computador e do sistema operacional. Também permite a escolha a quantidade de memória que deve ser reservada pelo programa para cada núcleo do processador e para uso geral pelo sistema. Apesar do 990X ter 6 núcleos, a arquitetura interna dos novos processadores Sandy Bridge, da qual o 2600 faz parte, gerencia melhor o controle de memória, a comunicação entre os discos rígidos ligados as portas Sata e por fim, a tecnologia Quik Synk, direciona a codificação e decodificação de vídeo para uma área específica e dedicada do processador.
Influencia também o nos resultados a quantidade de memória RAM disponível. Provavelmente um teste entre processadores i7 2600 instalados em sistemas com quantidades de memória diferentes iria apresentar resultados diretamente proporcionais. Esse é um caso típico em que investir um valor expressivamente maior na compra de um processador 990X não traria resultados práticos. A diferença de preços entre os dois processadores citados é mais que suficiente para popular todos os slots disponíveis com a maior quantidade possível de RAM de marca e velocidade top de linha e ainda sobrar dinheiro para investir em discos rígidos mais rápidos. Em linhas gerais, uma workstation equipada com o i7 2600 é pelo menos R$ 2000,00 mais barata, se comparada com outra equipada com os mesmos periféricos, porém com um processador i7 990X.
Quando se trata de edição não linear, ha uma boa vantagem do processador 990X sobre o 2600 rodando o Premiere Pro CS5:


O Premiere Pro CS5 apesar de pertencer a mesma família de aplicativos da Adobe, na chamada Suite CS5, faz uso mais eficiente da computação paralela distribuída por vários núcleos. A vantagem aqui se inverte para o top de linha da Intel que terminou com folga de 45 minutos a tarefa de renderização de um vídeo de duas horas exportado da timeline para o formato H.264 BluRay. Aqui estamos falando de uma workstation com valor médio de R$ 10.000,00 para outra equipada com i7 2600 que requer um investimento de cerca de R$ 6.500,00.
Nesse caso, se a maior parte do fluxo de trabalho for a edição não-linear o investimento compensa. Mas, curiosamente, se além dessa tarefa forem executados muitos trabalhos com uso intensivo de After Efects, a balança pende mais para o lado da ilha equipada com processador i7 2600 com custo mais atraente. Se, por outro lado, a tarefa principal for a criação de conteúdo de animação com uso de aplicativos como AutoDesk 3DMax ou Maya, ou mesmo criação de projetos de engenharia, com detalhamento ultra realista de maquetes, de peças e outros objetos com alto nível de detalhes, a escolha novamente requer alguns cuidados, pois a diferença de desempenho do top 990X é apenas ligeiramente superior ao 2600:


No gráfico acima podemos ver que renderizar 30 segundos de vídeo, em movimento de câmera (flyby) com o plugin Mental Ray, em alta definição, deu uma vantagem de quase dois minutos para o 990X sobre seu irmão menor 2600. Aqui novamente estamos falando de uma diferença suficiente em reais para, por exemplo, investir em um upgrade da placa de vídeo. Nesse caso, aliás em todos os aplicativos citados nesse artigo, uma placa de vídeo top faz toda a diferença no desempenho dos sistemas testados.
Para trabalhar com os aplicativos da Adobe, apesar de recomendado por ela e pela parceira Nvidia, uma placa GTX 480 pode funcionar com o mesmo desempenho de uma Quadro 4000, com economia de quase 50% no valor inicial de aquisição. Mas com a diferença de preços entre um processador 990e um 2600, um investimento em uma NVidia Quadro 5000 ou mesmo a top Quadro 6000 com seus massivos 6 Gb de RAM DDR5. O valor médio de uma workstation Core i7 9600 equipada com GPU Quadro 4000 chega aos R$ 12.000,00. A mesma estação equipada com processador Intel i7 2600 e a mesma placa de vídeo fica nos R$ 10.000,00. A diferença, no caso, R$ 2000,00 é suficiente para trocar a Quadro 4000 por um modelo 5000. Para o modelo 6000 ainda seria necessário investir mais uns R$ 3.000,00, elevando o custo final para algo em torno de R$ 15.000,00.

Se fosse minha escolha, eu apostaria na i7 2600 com a NVidia Quadro 5000. Potencia suficiente para rodar qualquer aplicativo da Adobe, AVID ou AutoDesk sem dificuldades. O que vale ressaltar para concluir esse artigo é que, conforme já foi dito antes, o importante e planejar bem o uso da estação de trabalho. Se você é um profissional autônomo, trabalha sozinho e executa as três atividades (edição, criação 3D e finalização), pode pensar em ter uma estação só como essa que acabei de sugerir. Mas uma divisão de tarefas entre duas estações medianas custando, cada uma, cerca de R$ 7.500,00 reais pode ser também uma ótima solução. Liberar uma máquina para concluir o trabalho em outra pode significar um ganho de tempo razoável, pois enquanto uma renderiza ou finaliza um job, você pode iniciar outro trabalho na máquina ociosa. Se as tarefas forem executadas em paralelo, por mais de um profissional, a escolha óbvia é dois ou três estações de trabalho configuradas para cada tarefa. Afinal ninguém está livre de um surto de energia, uma falha de hardware ou paradas para manutenção. E nessa hora, dois pássaros na mão é melhor do que um voando.







Nenhum comentário:

Postar um comentário

Obrigado por sua participação! Asim que eu puder, vou responder! Volte sempre!

Marcelo Ruiz