Bisakah dibuktikan bahwa menjalankan GPU pada suhu tinggi buruk untuk kartu?


11

Jika Anda terus menjalankan kartu grafis di antara 80 ° C dan 90 ° C (176 ° F dan 194 ° F) apakah itu benar-benar buruk untuk kartu grafis? Yaitu apakah itu mengurangi masa pakai kartu? Bisakah ini dibuktikan? Atau hanya asumsi?

Saya mengerti bahwa keselamatan untuk GPU biasanya 90 ° C (194 ° F).


'Safety shut off' sangat tergantung pada di mana suhu diukur dan apa proses dan suhu maksimum sirkuit itu dirancang. Saya ingat beberapa waktu yang lalu generasi intel CPU tertentu memiliki suhu nilai maksimum 110 ° C, yang membuat penggemar perangkat keras tertentu khawatir karena mereka berpikir chip akan menghancurkan diri mereka sendiri. Spoiler: Mereka tidak.
Joren Vaes

1
Saya pikir pertanyaan ini sangat terkait dengan pertanyaan lain ini ic-produk-seumur-hidup-sebagai-fungsi-persimpangan-suhu . Intinya dari pertanyaan itu adalah bahwa setiap 15 ° C di atas suhu kamar membagi dua harapan hidup IC. Jadi menjalankan kartu grafis pada 90 ° C dibandingkan dengan 80 ° C akan mengurangi masa pakainya hingga ~ 37% (jadi jika harapan hidup adalah 8 tahun dengan 80 ° C, itu ~ 5 tahun dengan 90 ° C sebagai gantinya)
Harry Svensson

1
Arhennius Law lebih dekat dengan kenaikan MTBF / 10'C 50% lebih rendah tetapi ada faktor-faktor lain yang harus dipertimbangkan untuk dielektrik di mana mereka mulai dengan MTBF yang jauh lebih rendah seperti 1000 jam @ 85 jam atau 105 jam jadi saya curiga mereka menggunakan topi berperingkat 105'C atau lebih baik.
Tony Stewart Sunnyskyguy EE75

Jawaban:


21

Mari kita mempelajari mekanisme kegagalan, dan melihat bagaimana mereka dipengaruhi oleh panas. Sangat penting untuk diingat bahwa hanya karena mekanisme kegagalan terjadi lebih cepat dengan suhu, GPU tidak akan selalu gagal lebih cepat! Jika sub-komponen yang bertahan 100 tahun pada suhu kamar hanya berlangsung 20 tahun jika panas, tetapi sub-komponen lain hanya berlangsung 1 tahun untuk memulai (tetapi tidak terpengaruh oleh panas), masa hidup produk Anda tidak akan berubah dengan suhu.

Saya akan mengabaikan masalah bersepeda yang dibicarakan oleh Simeon karena ini bukan keahlian saya.

Pada level papan, saya bisa memikirkan satu komponen utama yang akan 'putus' dengan head: kapasitor elektrolitik. Kapasitor ini mengering, dan dipahami dengan baik bahwa kapasitor lebih cepat kering saat panas diterapkan. (kapasitor tantalum juga cenderung memiliki umur yang lebih pendek tapi saya tidak tahu bagaimana ini berubah dengan panas).

Tapi bagaimana dengan silikon?

Di sini, seperti yang saya pahami, ada beberapa hal yang dapat menyebabkan kegagalan. Salah satu yang utama di sini adalah electromigration. Dalam sebuah sirkuit, elektron yang melalui potongan-potongan logam sebenarnya akan secara fisik bergerak di sekitar atom. Ini bisa menjadi sangat buruk sehingga akan menyebabkan celah pada konduktor, yang kemudian dapat menyebabkan kegagalan.

Gambar ini memberikan ilustrasi yang baik (dari Tatiana Kozlova, Henny W. Zandbergen; Pengamatan TEM in situ dari electromigration di Ni nanobridges):

masukkan deskripsi gambar di sini

Proses ini meningkat secara eksponensial dengan suhu, dan dengan demikian memang, chip akan bertahan lebih sedikit jika suhu lebih tinggi dan elektromigrasi adalah penyebab utama kegagalan.

Mekanisme lainnya adalah pemecahan oksida, di mana di dalam rangkaian transistor akan mengalami gate-punch-through. Ini juga tergantung suhu. Namun, voltase memiliki dampak yang jauh lebih besar di sini.

Ada juga pergeseran VT, baik karena penyimpangan dopan atau karena hot-carrier-injection. Peningkatan driop dopant dengan suhu (tetapi tidak mungkin menjadi masalah, terutama dengan sirkuit digital, karena ini adalah proses yang sangat lambat). Saya tidak yakin tentang ketergantungan suhu pada injeksi hot-carrier, tapi saya pikir lagi tegangan adalah faktor yang jauh lebih penting di sini.

Tapi kemudian ada pertanyaan penting: Berapa banyak ini mengurangi umur? Mengetahui hal ini, haruskah Anda memastikan bahwa kartu grafis Anda tetap dingin setiap saat? Dugaan saya adalah tidak, kecuali ada kesalahan pada tahap desain. Sirkuit dirancang dengan mempertimbangkan situasi terburuk ini, dan dibuat sedemikian rupa sehingga mereka akan bertahan hidup jika didorong hingga batas usia pengenal pabrik. Dalam kasus orang overclocking sirkuit: Peningkatan tegangan yang sering mereka gunakan untuk menjaga sirkuit stabil (karena dapat mempercepat sirkuit sedikit) akan jauh lebih berbahaya daripada suhu itu sendiri. Selain itu, peningkatan tegangan akan menyebabkan peningkatan arus, yang secara signifikan akan mempercepat masalah elektromigrasi.


2
Itu adalah beberapa gambar fantastis, saya selalu bertanya-tanya seperti apa elektromigrasi secara fisik.
Cursorkeys

9

Ya, telah terbukti bahwa panas menurunkan komponen listrik. Logam mengembang saat dipanaskan, solder (digunakan untuk koneksi rangkaian listrik) adalah paduan logam sehingga akan mengembang saat dipanaskan. Pemanasan dan pendinginan yang konstan akan menyebabkan sambungan terus mengembang dan berkontraksi yang dapat menyebabkan keretakan dan akhirnya kegagalan sambungan.

                                                      Grafik tingkat Kegagalan vs Suhu

The grafik di atas menunjukkan bagaimana Arrhenius'Law memberikan korelasi antara peningkatan panas dan semikonduktor kegagalan. Makalah ini merinci efek panas pada komponen elektronik. Ini lebih berurusan dengan hal-hal di tingkat elektron, yang sedikit di luar jangkauan pengetahuan saya


1
Saya dapat percaya bahwa bersepeda itu buruk, karena seperti yang Anda katakan ekspansi dan kontraksi, tetapi apakah ada masalah dengan berlari dengan beban tinggi, dan dengan demikian suhu tinggi sepanjang waktu?
Colin

Saya seorang perancang IC, jadi saya hanya memiliki sedikit pengetahuan tentang mode kegagalan tingkat papan, tetapi dalam semua waktu saya memperbaiki hal-hal (sebagai hobi) saya belum menemukan kegagalan karena bersepeda ekspansi, jadi saya harus mempertanyakan seberapa signifikan itu dibandingkan dengan mekanisme lain.
Joren Vaes

1
@Colin tidak ada yang namanya "beban tinggi sepanjang waktu"; kecuali Anda hanya mis. menambang bitcoin di GPU Anda, akan ada detik di mana ada lebih banyak beban daripada yang lain. Dengan pendinginan harus cukup ampuh pada GPU, ini sudah mengarah ke masalah yang disebutkan. Lihat: Cincin kematian XBox.
Marcus Müller

@ MarcusMüller benar-benar ada. Dan tidak masalah bahwa bebannya tidak sepenuhnya konstan. Untuk bersepeda, suhu delta itu penting. Sebuah kartu yang menjalankan 99% dari waktu pada beban 95-100% (yaitu menghitung) dalam temps yang dirancang, akan jauh lebih rentan terhadap kerusakan bersepeda hipotetis, daripada kartu yang sama berosilasi antara 0% dan 100% liar 50% dari if (yaitu game).
Dan M.

6

Hubungan antara peningkatan suhu persimpangan semikonduktor dan pengurangan MTBF (Mean Time Between Failure) dipahami dengan baik.

Catatan teknis dari Micron ini membicarakan hal ini

Dalam praktiknya, tingkat kegagalan akan meningkat secara eksponensial setelah suhu persimpangan mendekati dan melebihi ~ 125˚C, jadi jika Anda beroperasi jauh di bawah suhu kenaikan kecil itu mungkin tidak terlalu kritis.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.