Saya menjalankan Debian 7.2 pada Macbook Pro 2006 lama. Saya memiliki dua hard disk Seagate Backup Plus 4 TB yang terhubung dengannya yang saya miliki di dalam kumpulan ZFS cermin. Baru-baru ini salah satu drive mati, dan saya menerima drive pengganti yang saya coba tambahkan sebagai mirror baru. Namun, saya tidak bisa membuatnya resilver, karena kesalahan pasti terjadi sebelum bisa selesai.
Masalahnya adalah drive pengganti ini tampaknya terus memutus dan menghubungkan kembali dalam sepersekian detik. Apa yang saya temukan adalah pesan-pesan berikut sedang dicetak dalam log sistem berulang kali:
Jan 19 20:08:07 thingamadealies kernel: [100555.410370] usb 1-1: USB disconnect, device number 43
Jan 19 20:08:07 thingamadealies kernel: [100555.660059] usb 1-1: new high-speed USB device number 44 using ehci_hcd
Jan 19 20:08:07 thingamadealies kernel: [100555.794444] usb 1-1: New USB device found, idVendor=0bc2, idProduct=a0a4
Jan 19 20:08:07 thingamadealies kernel: [100555.794452] usb 1-1: New USB device strings: Mfr=2, Product=3, SerialNumber=1
Jan 19 20:08:07 thingamadealies kernel: [100555.794458] usb 1-1: Product: Backup+ Desk Mac
Jan 19 20:08:07 thingamadealies kernel: [100555.794463] usb 1-1: Manufacturer: Seagate
Jan 19 20:08:07 thingamadealies kernel: [100555.794467] usb 1-1: SerialNumber: XXXXXXXX
Jan 19 20:08:07 thingamadealies kernel: [100555.795636] scsi41 : usb-storage 1-1:1.0
Jan 19 20:08:07 thingamadealies mtp-probe: checking bus 1, device 44: "/sys/devices/pci0000:00/0000:00:1d.7/usb1/1-1"
Jan 19 20:10:46 thingamadealies kernel: [100714.601169] usb 1-1: USB disconnect, device number 44
Jan 19 20:10:46 thingamadealies kernel: [100714.872081] usb 1-1: new high-speed USB device number 45 using ehci_hcd
... etc ...
Terkadang ini akan terjadi beberapa kali dalam satu menit. Terkadang pesan dicetak dengan beberapa detik satu sama lain. Pada kesempatan lain perilaku ini berhenti sama sekali selama beberapa jam, atau bahkan hampir sehari. Saya agak curiga, tetapi tidak punya bukti, bahwa itu mungkin terkait dengan ketika hard drive sedang memuat.
Tidak ada kesalahan USB atau IO lain atau pesan relevan lainnya yang dicetak ke syslog, dan saya tidak tahu di mana lagi saya bisa mencari petunjuk.
Drive lain tidak memiliki masalah ini sama sekali, dan telah bekerja dengan baik sejak saya mendapatkannya.
Apa yang saya coba sejauh ini:
- mengganti colokan USB mana yang terhubung dengan drive, untuk melihat apakah drive lain mulai mengalami masalah ini. Sejauh ini belum tetapi hanya satu atau dua jam.
- Saya juga sudah googled sedikit, dan menemukan orang lain dengan masalah yang sama, tetapi tidak ada yang persis seperti saya, dan saya belum menemukan solusi. Kebanyakan orang dengan masalah ini setidaknya mendapatkan semacam kesalahan USB di syslog bersama dengan pesan "USB disconnect".
Bantuan siapa pun yang bisa memberi saya akan sangat dihargai! Saya tidak benar-benar tahu cara men-debug masalah perangkat keras seperti ini.
Memperbarui:
Setelah beralih ke colokan USB mana drive terhubung, pesan yang sedang dikeluarkan ke syslog diubah menjadi:
usb 1-3: reset nomor perangkat USB kecepatan tinggi 4 menggunakan ehci_hcd
Saya sudah mengkonfirmasi usb 1-3 adalah drive masalah. Jadi ada sesuatu yang salah, tapi itu salah sedikit berbeda sekarang. Sejauh ini ZFS tidak memiliki kesalahan ... semoga akan tetap seperti itu.
Pembaruan 2:
Resilver telah selesai! Namun, saya masih mendapatkan pesan "setel ulang perangkat USB kecepatan tinggi". Saya mencoba mengganti kabel di antara dua drive saya, tetapi tidak ada bedanya, jadi saya pikir itu berarti bahwa masalahnya adalah kabel.
Saya telah melihat beberapa bukti bahwa memutakhirkan kernel saya mungkin memperbaikinya, jadi saya akan mencobanya.
Pembaruan 3:
Upgrade kernel saya ke 3.10, tidak berpengaruh. Masih tidak tahu bagaimana cara memperbaikinya.
usb 4-1.5: USB disconnect, device number 3
usb 4-1.5: new low-speed USB device number 4 using ehci-pci
usb 4-1.5: New USB device found, idVendor=17ef, idProduct=6019
....