Se você planeja fazer jogos pesados, computação GPU, renderização gráfica, [email protected] ou mineração de criptografia em sua placa gráfica, pode estar preocupado com o desgaste da GPU devido ao uso intensivo. Mas ele vai? Nós investigaremos.
Table of Contents
Sim, mas é complicado
A maioria das informações sobre a vida útil da placa gráfica que você encontra on-line é anedótica, com números que podem variar muito dependendo de quem você pergunta. Com centenas de modelos diferentes de placas gráficas lançados na última década, é difícil resumir dados de placas tão diferentes em simples generalizações.
Até agora, sabemos disso: de acordo com um relatório de 2020 de um varejista alemão, as placas gráficas mais recentes têm uma taxa de falha de cerca de 2-5% (medida em retornos ao varejista) em geral. E em 2021, a Nvidia ainda estava fornecendo atualizações de driver para placas com cerca de 9 a 10 anos (como a série GTX 600), então você pode esperar uma década de uso de uma placa GPU bem processada, embora possam ser discrepantes, como veremos mais adiante.
Independentemente dos números, há alguma física difícil no trabalho. Os materiais e componentes que entram nas placas de GPU não são mágicos: quanto mais você os usa, mais rápido as peças se degradam e mais provável é que falhem completamente. O uso intensivo, portanto, afeta a vida útil.

Se você vê uma falha em sua placa de GPU depende de variáveis muito diferentes, incluindo a quantidade exata de uso da GPU, a natureza e o grau de oscilações de temperatura no circuito, o número de vezes que a placa foi ligada e apagada e o limpeza do ambiente operacional.
Como uma placa de GPU é um dispositivo complexo com muitas partes, cada uma pode falhar ou se degradar de maneiras diferentes. Analisaremos várias partes importantes de uma placa de GPU e veremos como elas podem se desgastar com o uso pesado ao longo do tempo.
Primeiro a ir: ventiladores de refrigeração
De todas as partes de uma placa gráfica que provavelmente falharão primeiro, temos que destacar as ventoinhas (ou ventoinhas), que são peças físicas móveis. As ventoinhas mantêm a sua GPU fria retirando o ar quente do chip da GPU (com um dissipador de calor) para que possa continuar a funcionar.

Por que o calor é ruim? Com calor suficiente, os transistores não funcionam corretamente, o que significa que a placa GPU não funcionará. Com ainda mais calor, os transistores nos chips da placa podem ser danificados permanentemente.
Com o tempo, os ventiladores de resfriamento geralmente ficam entupidos com poeira, reduzindo sua capacidade de mover o ar com eficiência. Ou os ventiladores podem falhar completamente se um lubrificante interno falhar. Qualquer um dos cenários aumentará a temperatura da GPU.
Cada GPU se protege do superaquecimento usando a limitação térmica, que desacelera a operação da GPU para diminuir a temperatura de operação. Isso limita severamente o desempenho. Portanto, se você tiver uma GPU que de repente está mais alta do que o normal (a ventoinha gira mais rápido) ou funciona com menos suavidade, limpe completamente as ventoinhas e o dissipador de calor da sua GPU com ar comprimido.
Se uma ventoinha de refrigeração da GPU falhou completamente, geralmente você pode substituí-la se encontrar uma ventoinha equivalente em um fornecedor de peças de computador.
RELACIONADO: Como limpar completamente seu computador desktop sujo
Outro suspeito: uma pasta térmica defeituosa
Entre cada dissipador de calor e o chip da GPU, há uma camada de material condutor térmico, como uma massa ou pasta que ajuda a transferir o calor do chip da GPU para o dissipador de calor.
Com o tempo, a pasta térmica pode rachar ou perder força. Quando isso acontece, o dissipador de calor não resfria com a mesma eficiência e a temperatura da GPU aumenta. Como vimos na seção de ventoinhas acima, altas temperaturas da GPU causam estrangulamento térmico, o que diminuirá a velocidade da sua GPU.
A melhor solução neste cenário é substituir você mesmo a pasta térmica. Você pode comprar pasta térmica de fornecedores de peças de computador.
Falhas em outros componentes, solda
Além do chip GPU, uma placa gráfica incluirá dezenas de outros componentes eletrônicos, como capacitores, resistores, chips de memória, etc. Qualquer um deles pode falhar com uso intenso ou exposição a muito calor. Alguns são mais propensos a falhar do que outros.

Os capacitores, em particular, são suscetíveis a falhas ao longo do tempo. Eles são sensíveis a mudanças frequentes de temperatura e alguns são defeituosos quando produzidos pela primeira vez. Se você for habilidoso o suficiente para solucionar problemas de capacitores, poderá substituir capacitores ruins em uma placa de GPU se encontrar peças sobressalentes equivalentes.
Além disso, a solda que une os chips e componentes à placa de circuito da placa GPU pode envelhecer e rachar com o tempo devido a mudanças frequentes de temperatura, manuseio físico inadequado, armazenamento inadequado ou aquecimento excessivo. Então, sim, o uso pesado de GPU pode aumentar as chances de falha na junta de solda. Reparar juntas de solda ruins pode ser tecnicamente difícil, mas não é impossível.
Falhas no próprio chip GPU
A questão, portanto, permanece: um chip GPU pode eventualmente se desgastar após uso intensivo? A resposta é sim, teoricamente, em circunstâncias extremas. Mas você provavelmente verá outro componente da placa gráfica falhar muito antes disso.
O chip GPU da sua placa gráfica contém milhões ou bilhões de transistores, gravados em um pedaço de silício. Os transistores envelhecem com o tempo, afetando seu desempenho. Quando transistores suficientes se comportam mal, o chip falha.
De acordo com a Semiconductor Engineering, existem várias razões principais pelas quais os transistores têm um desempenho ruim ao longo do tempo devido ao envelhecimento (um dos quais é o calor), e os erros são mais prováveis quanto maior o tamanho do recurso no chip. Especialistas suspeitam que os chips de computador fabricados hoje não durarão tanto quanto os fabricados na década de 1990, mas prever uma vida útil exata ainda é uma suposição, já que a tecnologia é muito nova.

Atualmente, a NVIDIA não publica estimativas de MTBF (tempo médio entre falhas) para suas placas gráficas de consumo, mas a empresa as publica para alguns de seus aceleradores gráficos industriais e comerciais. Por exemplo, a folha de dados do Tesla K20X GPU Accelerator cita o MTBF da placa (a 35 C/95 F) como 14,7 anos para um “ambiente não controlado” e 23,8 anos para um “ambiente controlado”. (Observe que, geralmente, o hardware gráfico industrial deve ser mais robusto e suportar melhor o uso pesado do que o hardware gráfico do consumidor.)
Curiosamente, podemos comparar esse número teórico com dados concretos do campo. Um dos poucos estudos empíricos sobre a vida útil da GPU vem de um artigo de 2020 intitulado “GPU Lifetimes on Titan Supercomputer: Survival Analysis and Reliability” do Oak Ridge National Labs. O artigo relata a confiabilidade das 18.688 placas de GPU Nvidia K20X Kepler usadas no supercomputador Cray XK7 Titan, agora aposentado, por um período de quase 7 anos (2012-2019).

Após alguns contratempos iniciais devido a problemas de conexão, eles encontraram confiabilidade relativamente alta com as placas gráficas do XK7 até 2016 (cerca de 3-4 anos atrás), quando muitas começaram a falhar. Mas adivinhem? Eles atribuíram a maioria das falhas no primeiro lote de placas (antes da substituição) a um resistor defeituoso no PCB da placa gráfica, não ao próprio chip da GPU. No geral, os autores do estudo descobriram que o MTBF médio das placas de GPU muito usadas do K20X era de cerca de 3 anos (não 14-23 anos, conforme declarado na folha de dados da Nvidia), algumas das placas de coração mais quentes falhando primeiro. Eles concluíram que “a confiabilidade da GPU depende da dissipação de calor”.
Portanto, as chances são de que, se você usar sua placa gráfica com tanta força quanto um dos maiores supercomputadores do mundo (na época), ela se desgastará mais rapidamente e do que outros componentes, como ventiladores e resistores, falharão muito antes do próprio chip da GPU. . . A duração exata que você terá depende de fatores que não podemos prever.
No final, o calor é o inimigo
Em última análise, de todas as fontes que lemos, o fator decisivo mais importante para a vida útil de uma placa GPU é sua temperatura operacional. Quanto mais quente a placa, mais rápido todos os seus componentes se degradam. Além disso, quanto mais quente o cartão, mais seu desempenho diminui para evitar uma falha catastrófica. O resfriamento adequado prolonga a vida útil do seu cartão e aumenta seu desempenho.
Portanto, se você estiver minerando criptomoedas ou jogando, se mantiver sua placa GPU razoavelmente fria com ventoinhas limpas e funcionais e pasta térmica eficiente, provavelmente terá uma placa muito capaz que, se tiver sorte, pode durar até se tornar obsoleto e você atualiza.
Se você está pensando em comprar uma GPU usada, definitivamente precisa considerar seu histórico, incluindo como seu proprietário a tratou e usou. Os cartões mais usados (que funcionam agora) provavelmente funcionarão bem no curto prazo, mas são mais propensos a falhas no longo prazo. Não podemos estimar a duração exata de uma placa, mas o uso pesado definitivamente desgasta as placas gráficas mais rapidamente.
Boa sorte!
RELACIONADO: É seguro comprar GPUs usadas de mineradores de criptomoedas?