Selama seminggu terakhir server saya (menjalankan Debian Jessie) telah reboot dua kali. Di syslog saya melihat ini sebelum setiap reboot, dan tidak ada poin lain:
Aug 15 13:32:58 hoshimiya kernel: [296512.005355] {1}[Hardware Error]: Hardware error from APEI Generic Hardware Error Source: 1
Aug 15 13:32:58 hoshimiya kernel: [296512.005360] {1}[Hardware Error]: It has been corrected by h/w and requires no further action
Aug 15 13:32:58 hoshimiya kernel: [296512.005361] {1}[Hardware Error]: event severity: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005362] {1}[Hardware Error]: Error 0, type: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005363] {1}[Hardware Error]: fru_text: CorrectedErr
Aug 15 13:32:58 hoshimiya kernel: [296512.005364] {1}[Hardware Error]: section_type: memory error
Aug 15 13:32:58 hoshimiya kernel: [296512.005365] [Firmware Warn]: error section length is too small
Beberapa googling membuat saya percaya bahwa ini ada hubungannya dengan RAM ECC saya yang mendeteksi dan memulihkan dari kesalahan. Apakah ini benar? Jika sudah pulih, mengapa sistem reboot? Saya ingin mencegah sistem me-reboot, jika memungkinkan.