Le GPU si consumano con un uso intenso?

Le GPU si consumano con un uso intenso?

Se pianifichi giochi intensivi, elaborazione GPU, rendering grafico, Folding@home o mining di criptovalute sulla tua GPU, potresti essere preoccupato che la tua GPU si esaurisca in caso di uso intenso. Ma lo farà? Indagheremo.

Sì, ma è difficile

Molte delle informazioni che trovi su Internet sulla durata delle schede grafiche sono aneddotiche e i numeri possono variare notevolmente a seconda di chi chiedi. Con centinaia di diversi modelli di schede grafiche rilasciati negli ultimi dieci anni, è difficile restringere i dati su schede così diverse a semplici generalizzazioni.

Quello che sappiamo finora è questo: secondo il rapporto 2020 del rivenditore tedesco , le schede grafiche più recenti hanno un tasso di errore complessivo di circa il 2-5% (misurato nei resi al rivenditore). E nel 2021, Nvidia stava ancora rilasciando aggiornamenti dei driver per schede che avevano circa 9-10 anni (come la serie GTX 600), quindi puoi aspettarti un decennio di una scheda GPU ben realizzata, anche se questi potrebbero essere valori anomali, dato che noi Vedrò più lontano.

Indipendentemente dai numeri, la fisica pesante è al lavoro qui. I materiali e i componenti utilizzati nelle schede GPU non sono magici: più li usi, più velocemente si consumano e più è probabile che si guastino completamente. Quindi l’uso intensivo influisce sull’aspettativa di vita.

Il fatto che si verifichi un problema tecnico nella scheda GPU dipende da variabili completamente diverse, incluso quanto pesantemente è stata utilizzata la GPU, la natura e l’entità delle fluttuazioni di temperatura nel circuito, quante volte la scheda è stata accesa e spenta e quanto è pulita l’ambiente operativo è.

Poiché la scheda GPU è un dispositivo complesso con molte parti, ognuna può guastarsi o degradarsi a modo suo. Daremo un’occhiata ad alcune parti principali di una scheda GPU e vedremo come possono usurarsi in caso di uso intenso nel tempo.

Per prima cosa: ventole di raffreddamento

Di tutte le parti di una scheda grafica che possono guastarsi in primo luogo, dobbiamo indicare le ventole di raffreddamento (o ventole) che sono le parti fisiche mobili. Le ventole raffreddano la tua GPU allontanando l’aria calda dal chip GPU (con dissipatore di calore) in modo che possa continuare a funzionare.

Perché il calore fa male? Con abbastanza calore, i transistor non funzionano correttamente , il che significa che la scheda GPU non funzionerà. Con ancora più calore, i transistor nei microcircuiti della scheda possono essere danneggiati irreparabilmente .

Nel tempo, le ventole di raffreddamento spesso si intasano di polvere, riducendo la loro capacità di spostare l’aria in modo efficiente. Oppure le ventole possono guastarsi completamente se la lubrificazione interna fallisce. Qualsiasi script aumenterà la temperatura della GPU.

Ogni GPU si protegge dal surriscaldamento con la limitazione termica, che rallenta la GPU per abbassare la sua temperatura di esercizio. Questo limita notevolmente le prestazioni. Quindi, se hai una GPU che è improvvisamente più rumorosa del normale (la ventola gira più velocemente) o ha prestazioni peggiori, pulisci a fondo le ventole di raffreddamento della GPU e il dissipatore di calore con aria compressa.

Se la ventola di raffreddamento della GPU è completamente guasta, di solito può essere sostituita se riesci a trovare una ventola simile dal fornitore di parti del tuo computer.

Un altro sospetto: pasta termica difettosa

Tra ogni dissipatore di calore e il chip GPU c’è uno strato di materiale termicamente conduttivo, come stucco o pasta, per aiutare a trasferire il calore dal chip GPU al dissipatore di calore.

Nel tempo, la pasta termica può rompersi o perdere efficacia. Quando ciò accade, il dissipatore di calore non viene raffreddato in modo efficiente e la temperatura della GPU aumenta. Come abbiamo visto nella sezione delle ventole sopra, le temperature elevate della GPU portano al throttling termico, che rallenta la GPU.

La soluzione migliore in questo caso è sostituire da soli la pasta termica . È possibile acquistare pasta termica da fornitori di hardware per computer.

Difetti in altri componenti, saldatura

Oltre al chip GPU, la scheda grafica includerà dozzine di altri componenti elettronici come condensatori, resistori, chip di memoria e altro. Ognuno di questi potrebbe potenzialmente fallire a causa di un uso intenso o dell’esposizione a troppo calore. Alcuni hanno maggiori probabilità di fallire rispetto ad altri.

In particolare, i condensatori si guastano nel tempo . Sono sensibili a frequenti sbalzi di temperatura e alcuni di essi presentano difetti nella prima produzione. Se sei abbastanza esperto da risolvere i problemi dei condensatori, puoi potenzialmente sostituire i condensatori difettosi su una scheda GPU se riesci a trovare parti di ricambio equivalenti.

Inoltre, la saldatura che collega chip e componenti al circuito stampato della scheda GPU può invecchiare e rompersi nel tempo a causa di frequenti sbalzi di temperatura, manipolazione brusca, conservazione impropria o surriscaldamento. Quindi sì, un uso intenso della GPU può aumentare il rischio di guasti ai giunti di saldatura. Riparare giunti di saldatura difettosi può essere tecnicamente difficile, ma non impossibile .

Guasti nel chip GPU stesso

Quindi la domanda rimane: un chip GPU può usurarsi nel tempo con un uso intenso? La risposta è sì, in teoria, in circostanze estreme. Ma molto probabilmente vedrai un altro componente della scheda grafica fallire molto prima.

Il chip GPU sulla tua scheda video contiene milioni o miliardi di transistor incisi su un pezzo di silicio. I transistor invecchiano nel tempo , il che influisce sulle loro prestazioni. Quando un numero sufficiente di transistor va storto, il chip si guasta.

Secondo Semiconductor Engineering , ci sono diversi motivi principali per cui i transistor si guastano nel tempo a causa dell’invecchiamento ( uno dei quali è il calore ) e più piccolo è l’elemento sul chip, più probabili sono gli errori. Gli esperti sospettano che i chip per computer prodotti oggi non dureranno tanto quanto i chip prodotti negli anni ’90, ma prevedere l’esatta durata della vita è ancora un’ipotesi perché la tecnologia è così nuova.

Attualmente NVIDIA non pubblica le valutazioni MTBF (Mean Time Between Failures) per le sue schede grafiche consumer, ma l’azienda le  pubblica per alcuni dei suoi acceleratori grafici industriali e aziendali. Ad esempio, il foglio dati per l’acceleratore GPU Tesla K20X afferma che l’MTBF della scheda (a 35°C/95F) è di 14,7 anni per un “ambiente non controllato” e 23,8 anni per un “ambiente controllato”. (Si noti che, in generale, l’hardware grafico industriale è considerato più affidabile e in grado di resistere meglio a un uso intenso rispetto all’hardware grafico di consumo.)

È interessante notare che possiamo confrontare questo numero teorico con i dati esatti ottenuti sul campo. Uno dei pochi studi empirici sulla durata della GPU viene da un documento del 2020 intitolato ” GPU Lifespan on the Titan Supercomputer: Survival and Reliability Analysis ” scritto da Oak Ridge National Laboratory. Il documento riporta l’affidabilità di 18.688 schede GPU Nvidia K20X Kepler utilizzate nel supercomputer Cray XK7 Titan, ora in pensione, per quasi 7 anni (2012-2019).

Dopo alcuni guasti iniziali dovuti a problemi di connettività, hanno scoperto che le schede grafiche XK7 erano relativamente altamente affidabili fino al 2016 (circa 3-4 anni), quando molte di esse hanno iniziato a non funzionare. Ma sai una cosa? Hanno rintracciato la maggior parte dei guasti nel primo lotto di schede (prima della sostituzione) a un resistore difettoso sul PCB della scheda grafica, non al chip GPU stesso. Nel complesso, gli autori dello studio hanno scoperto che l’MTBF delle schede grafiche K20X molto utilizzate è di circa 3 anni (non 14-23 anni come indicato nella scheda tecnica di Nvidia), con alcune delle schede più calde nel core che sono state le prime a fallire. Hanno concluso che “l’affidabilità della GPU dipende dalla dissipazione del calore”.

Quindi è molto probabile che se usi la tua scheda grafica con la stessa forza di uno dei più grandi supercomputer del mondo (all’epoca), si consumerà più velocemente e altri componenti come ventole e resistori si guasteranno molto prima che il chip GPU stesso si rompa. il tempo che ottieni dipende da fattori che non possiamo prevedere.

Dopotutto, il nemico è il calore

Alla fine, da tutte le fonti che abbiamo letto, il fattore più importante nel determinare quanto durerà una scheda GPU è quanto è calda. Più calda è la scheda, più velocemente si degradano tutti i suoi componenti. Inoltre, più la scheda è calda, più riduce le prestazioni per prevenire un guasto catastrofico. Un buon raffreddamento prolunga la vita della tua scheda e ne migliora le prestazioni.

Quindi, se ti piacciono le criptovalute o i giochi, fintanto che la tua scheda grafica è mantenuta abbastanza fresca con ventole pulite e pasta termica efficace, probabilmente avrai una scheda ad alte prestazioni che, se sei fortunato, può durare il più a lungo come obsoleto e si aggiorna.

Se stai pensando di acquistare una GPU usata, dovresti assolutamente prendere in considerazione la sua storia, incluso il modo in cui il suo proprietario l’ha gestita e utilizzata. Le carte più utilizzate (quelle che funzionano ora) hanno maggiori probabilità di funzionare bene a breve termine, ma sono più inclini a fallire a lungo termine. Non siamo in grado di individuare la durata della scheda, ma un uso intenso consuma sicuramente la scheda grafica più velocemente.

Buona fortuna!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *