Bagaimana cara memeriksa kesehatan SSD?


81

Kita semua tahu bahwa SSD memiliki masa hidup terbatas yang telah ditentukan sebelumnya. Jadi pertanyaan bagi saya adalah bagaimana cara saya memeriksa (Ubuntu) Linux apa status kesehatan SSD saya saat ini? Dan mungkin perkiraan berapa lama?

Alat grafis lebih disukai, tetapi alat baris perintah juga akan baik-baik saja.

Saya menggunakan Xubuntu 12.04 LTS


1
Bisakah Anda menambahkan output smartctl -i /dev/sdake pertanyaan Anda?
Mitch

1
@ dschinn1001 Tidak juga, itu hanya berlaku untuk SSD terbaru. SSD generasi Pertama dan Kedua diketahui memiliki masa hidup terbatas sesuai dengan jumlah operasi tulis ke disk.
João André

1
Berasal dari drive pemintalan jadul, saya menggunakan alat untuk menguji HD yang menulis dan membaca semua disk beberapa kali, yang memakan waktu beberapa jam. Tampaknya tidak ada alat yang disebutkan menggunakan pendekatan seperti itu? Apakah pendekatan semacam itu tidak masuk akal untuk SSD? Nah, maka tampaknya SSD mencatat pengalamannya sendiri, dan kemudian dapat mengetahui apakah SSDnya sakit. Sudahkah saya memahami ini dengan benar?
Mads Skjern

@MadsSkjern Sangat layak untuk menggunakan alat seperti badblock untuk memeriksa status SSD. Namun ada alasan yang sangat bagus untuk TIDAK melakukannya. SSD menurut pengalaman saya biasanya gagal setelah melampaui batas penulisan tertentu, sehingga tes tulis baca yang merusak seperti dapat dilakukan dengan badblocksbenar-benar dapat mempersingkat masa pakai drive.
Penatua Geek

Jawaban:


35

Instal Gnome Disk Utility dan periksa Data dan Tes SMART untuk menghitung tingkat keausan atau yang serupa. Semakin tinggi angka itu (%, dari 1 hingga 100), semakin "habis" SSD Anda, yang berarti Anda cenderung memiliki masalah. Tetapi jika Anda memiliki SSD baru, Anda tidak perlu khawatir tentang hal itu.

Diinstal melalui

 sudo apt-get install gnome-disk-utility

mulai melalui

baik menu-> Pengaturan-> Utilitas disk

atau melalui baris perintah

sudo gnome-disks

2
Ya, saya tidak yakin tentang nama itu karena mereka mengubahnya di 12.10
João André

8
palimpsest tidak dikenali oleh Ubuntu 14.04, meskipun gnome-disk-utility diinstal. Saya juga tidak melihat utilitas disk dalam pengaturan (ikon roda gigi). palimpsestadalah nama yang buruk, apakah namanya berbeda dengan bahasa pengguna (misalnya bahasa Inggris vs. yang lain).
Paul

10
sebagai catatan untuk pembaca; palimpset diubah namanya menjadi gnome-disk (seperti yang disebutkan askubuntu.com/a/623306/4580 ).
immeëmosol

2
Mengapa Anda mengatakan "Jika Anda memiliki SSD baru-baru ini, Anda tidak perlu khawatir tentang hal itu"?
JFA

2
Anda mendapatkan ini mundur. Angka keausan dimulai dari 100 dan berkurang dengan penggunaan, jadi semakin tinggi angkanya, KURANG yang digunakan adalah SSD, lihat di sini: superuser.com/questions/1037644/…
Logix

48

untuk memeriksa kesehatan SSD

Untuk distribusi berbasis Ubuntu, Mint, atau Debian

# apt-get install smartmontools

Media_Wearout_Indicator adalah apa yang Anda cari. Untuk 100 berarti SSD Anda memiliki 100% masa pakai, angka yang lebih rendah berarti sisa masa pakai yang lebih sedikit.

# smartctl -a /dev/sda | grep Media_Wearout_Indicator

Untuk menampilkan informasi sdd Anda

# smartctl -a /dev/sda

Anda dapat membaca artikel selengkapnya di Nam Huy Linux Blog - Bagaimana cara mengecek sisa SSD di linux


1
Jadi, jika nilai saya 199 - 199, apakah itu kredibel?
m4tm4t

7
Properti itu tidak muncul di SSD saya. Mungkin saya harus melihat Wear_Leveling_Count sebagai gantinya? seperti pada: sudo smartctl -a / dev / sda | grep Wear_Leveling_Count EDIT: Dikonfirmasi oleh respons di bawah ini: askubuntu.com/a/381779/221115
Jose Gómez

Di Kingston, Anda memilikiWear_Range_Delta
kotak telepon

Dalam KINGSTON SV300S37A240G Anda harus mencariSSD_Life_Left
Herlon Aguiar


35

Jika Anda tidak memiliki SSD merek Intel: BACA INI.

Awas !! - Saya benar-benar disesatkan oleh 'smartmontools.' Saya memiliki Samsung SSD, dan alat smartmonitor / 'smartctl' dengan bahagia melaporkan bahwa atribut '233' (hex 'E9') adalah 'Media_Wearout_Indicator'; pada kenyataannya - tidak, untuk Samsung (dan produsen lain) semuanya berbeda. Posting ini dan yang lainnya di forum, pertanyaan / jawaban pertukaran-tukar, dan blog-pengguna kuasa yang saya temukan tampaknya 'berfokus pada Intel', dengan hanya petunjuk samar bahwa 'ini mungkin berbeda.' (Lawan setiap saran yang perlu Anda perhatikan karena pelabelan atribut yang salah dan salah oleh smartmontools).

Ketika saya sedang bersiap untuk menyalin SSD saya ke harddisk baru yang saya beli (karena apa yang dikatakan smartmontools), saya boot ke windows (saya memiliki sistem dual boot), untuk mempelajari sesuatu tentang SSD dari apa yang hanya dimiliki windows saja Alat Samsung 'Samsung_Magician_v43.exe' harus memberi tahu saya tentang drive saya - itu sangat tidak informatif.

Setelah menggali selama berjam-jam - akhirnya saya bisa menjalankan alat-alat windows saja: hddgaurdian - 'code.google.com/p/hddguardian', dan kemudian juga CrystalDiskInfo: Surprise! kedua alat secara independen memberi tahu saya Samsung SSD saya 'baik-baik saja' (wali hdd mengatakan '5 bintang' dan Crystal Disk "98% OK"). Sebaliknya alat smartctl secara eksplisit memberi label atribut dengan 'desimal-233 /' hex-E9 'sebagai "Indikator Keausan Media" - dan memberi tahu saya bahwa nilainya adalah "1" atau 1% - indikator (risiko) kegagalan yang tertunda. Untuk memastikan saya bisa, saya menggali dan menggali dan akhirnya dapat menemukan setidaknya sesuatu dari pejabat Samsung: " http://www.samsung.com/global/business/semiconductor/minisite/SSD/us/download/ 07_Communicating_With_Your_SSD.pdf"Dokumen itu memang menyiratkan bahwa atribut 'hex E9' / 'desimal' 233 'tidak digunakan oleh Samsung dengan cara yang sama. (Samsung: Saya sangat kecewa, tolong perbaiki perangkat lunak resmi perangkat Anda, atau setidaknya buatlah jelas bahwa Anda tidak memberikan informasi indikasi aus!)

Lebih lanjut - jika Anda tidak memiliki SSD Intel atau Samsung SSD - berhati-hatilah, info ini tampaknya berbeda di setiap produsen. (mis. lihat tabel label atribut pada 'code.google.com/p/hddguardian/wiki/about_r Keandalan' untuk satu-satunya indikasi yang berguna tentang tingkat variabilitas yang saya temukan.)

The begitu-apa: Jika Anda tidak memiliki Intel SSD-- jangan tidak menyesatkan oleh atribut label nama palsu yang diberikan oleh smartmonitor. Mungkin ini akan membaik di masa mendatang, tetapi versi yang diinstal secara default untuk Ubuntu 12.04 LTS (April, 2014) gagal total. Alih-alih memberi tahu Anda itu 'tidak tahu' - smartctl hanya salah memberi label pada atribut. Saya tidak menemukan alat lain untuk linux yang membuat informasi yang 'benar' transparan atau jelas.


1
Alat peraga untuk menyertakan tautan ke dokumentasi Samsung dari atribut SMART mereka. Saya tidak tahu aplikasi apa yang Anda sebutkan itu atau seberapa bermanfaatnya aplikasi tersebut, tetapi saya sangat menyarankan agar Anda cukup memperhatikan "Nomor Alokasi Sektor" yang di-atributkan karena ini akan menjadi indikator yang baik tentang seberapa dekat SSD Anda. gagal, karena setelah kehabisan sektor cadangan yang harus digunakan untuk mengganti yang rusak maka Anda akan mendekati EOL pada SSD Anda
Maks


10

Untuk drive Kingston di komputer berbasis Debian

Mirip dengan eksekusi ini dijalankan

# apt-get install smartmontools

Namun ketika saya menjalankan perintah untuk menampilkan info drive, sepertinya SMART dinonaktifkan:

# smartctl -a /dev/sda 
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.13.0-45-generic] (local build)
[ ... ]
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

Anda harus mengaktifkannya dengan menjalankan yang berikut ini sebagai root:

# smartctl -s on -a /dev/sda

Anda kemudian dapat melakukan swa-uji dengan melakukan tes singkat (yang memakan waktu sekitar 1 menit):

# smartctl -t short -a /dev/sda

atau tes yang lebih menyeluruh (yang memakan waktu sekitar 1,5 jam):

# smartctl -t long -a /dev/sda

Catatan, dalam sebagian besar keadaan Anda tidak perlu melepas drive untuk menjalankan tes ini. Jika ya, lihat man smartctl.

Sekarang, ketika Anda menjalankan smartctl -a /dev/sdaAnda kemudian harus melihat hasil tes penilaian diri. Ini mungkin yang perlu Anda perhatikan:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Jika Anda menyukai detail, Anda juga akan melihat tabel seperti ini:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x0032   095   095   050    Old_age   Always       -       0/178007034
  5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours_and_Msec 0x0032   092   092   000    Old_age   Always       -       7626h+46m+45.580s
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       8
171 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       4
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x000a   100   100   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
189 Airflow_Temperature_Cel 0x0000   030   035   000    Old_age   Offline      -       30 (Min/Max 24/35)
194 Temperature_Celsius     0x0022   030   035   000    Old_age   Always       -       30 (Min/Max 24/35)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/178007034
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/178007034
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/178007034
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       3498
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       2885
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       2885
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       868

Jika Anda mencari apa arti semua nilai ini, lihat dokumentasi Kingston .


Jika Anda akan menurunkan suara, setidaknya tinggalkan komentar ...
Mike

1
Tidak semua SSD Kingston mendukung semuanya. Beberapa yang tidak (seperti UV400 saya ) tampaknya menunjukkan angka acak di bidang yang tidak mereka dukung.
otus

jawabannya hilang beberapa petunjuk lebih berguna tentang detail pintar. Hanya untuk memastikan pembaca secara tepat membaca tabel nilai yang dihasilkan. Singkatnya, menurut saya nilai SSD_Life_Left adalah indikator yang paling mudah. Jika 100, baru SSD, jika 1, mati berjalan SSD.
mh-cbon

@ mh-cbon Karena jawabannya sudah relatif bertele-tele, saya hanya menautkan ke dokumentasi Kingston karena ada BANYAK detail di sana. Namun, jika Anda merasa dapat meningkatkan jawabannya, silakan mengeditnya.
Mike

5

Wear_Leveling_Count adalah atribut yang tepat untuk dilacak. Namun, seperti atribut lainnya, 100 adalah nilai TERBAIK dan 0 adalah TERBURUK. Anggap saja sebagai "persen sisa hidup".


3
Ini mungkin berbeda dari produsen ke produsen, tetapi ini kemungkinan besar sangat salah. Pada halaman ini menjelaskan mikron (alias. Penting, seperti dalam "kode penting m4", dll), yang satu ini adalah "Rata-rata menghapus jumlah semua blok baik." Itu angka yang akan meningkat seiring penggunaan. Jika Anda membaca tentang leveling pemakaian , Anda akan menyadari bahwa itu harus mencapai setidaknya puluhan ribu sebelum drive mati (yaitu, Anda mungkin tidak akan hidup untuk melihatnya mati dengan cara ini).
goldilocks

2
Punyaku mengatakan 1461.
CMCDragonkai

4

Cara terbaik untuk memeriksa kesehatan SSD adalah dengan mengikuti rekomendasi pabrik untuk melakukannya. Karena ini bervariasi dari pabrikan ke pabrikan dan dapat berubah dari waktu ke waktu, ada baiknya untuk memeriksa dengan pabrikan drive Anda jika ada masalah. Berdasarkan peringkat MTBF (standar JEDEC JESD218A mendefinisikan metode) yang disediakan oleh sebagian besar produsen, SSD harus bertahan lebih dari satu juta jam tanpa masalah.

Saya memiliki beberapa di antaranya yang mencakup beberapa produsen. Saya dapat menjamin bahwa atribut SMART bervariasi di antara produsen. Untuk tujuan perbandingan, inilah contoh dari OCZ dan data pintar dari unit Corsair F40 bersama dengan diskusi tentang seberapa tidak dapat diandalkannya data ini.

Meskipun data SMART pasti memiliki nilai, karena semua perangkat pada akhirnya akan gagal, yang penting adalah Anda mencadangkan data Anda secara teratur. Ini memberikan ketenangan pikiran bahwa data Anda aman saat Anda menunggu (kemungkinan untuk beberapa tahun) agar SSD Anda gagal. Saat biaya turun dan kapasitas meningkat, Anda kemungkinan besar akan mengganti SSD karena kendala ruang daripada kegagalan. (Dalam pengalaman saya 10x lebih mungkin). Saya hanya akan membuat cadangan secara teratur dan tidak khawatir tentang hal itu.

Sumber:

Pengalaman, http://www.hardcoreware.net/mtbf-ssd-what-does-it-mean-for-you/


0

Untuk (setidaknya beberapa) drive NVMe, Anda dapat melakukannya

smartctl -a /dev/nvme0

Anda kemudian dapat mencari garis seperti:

Percentage Used:                    5%

Di sini angka yang lebih rendah lebih baik dan 100%berarti drive "aus". Dokumentasi pabrikan menyarankan bahwa dimungkinkan untuk mendapatkan angka di atas 100% jika Anda tetap menggunakan drive di luar titik ini ( contoh dari Seagate, lihat halaman 12 ).

Perhatikan bahwa jika Anda menggunakan namespace atau perangkat partisi, suka /dev/nvme0n1atau /dev/nvme0n1p1, itu tidak akan berfungsi dan Anda akan mendapatkan pesan seperti Read NVMe SMART/Health Information failed: NVMe Status 0x4002.


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.