Kami memiliki beberapa lusin server Proxmox (Proxmox beroperasi pada Debian), dan sekitar sebulan sekali, salah satu dari mereka akan mengalami kepanikan kernel dan terkunci. Bagian terburuk tentang penguncian ini adalah ketika server yang ada di sakelar terpisah dari master kluster, semua server Proxmox lain di sakelar itu akan berhenti merespons hingga kami dapat menemukan server yang benar-benar macet dan reboot.
Ketika kami melaporkan masalah ini di forum Proxmox, kami disarankan untuk meningkatkan ke Proxmox 3.1 dan kami sedang dalam proses melakukan itu selama beberapa bulan terakhir. Sayangnya, salah satu server yang kami migrasi ke Proxmox 3.1 dikunci dengan panik kernel pada hari Jumat, dan sekali lagi semua server Proxmox yang berada di saklar yang sama tidak dapat dijangkau melalui jaringan sampai kami dapat menemukan server yang crash dan reboot.
Yah, hampir semua server Proxmox di sakelar ... Saya merasa menarik bahwa server Proxmox di sakelar yang sama yang masih di Proxmox versi 1.9 tidak terpengaruh.
Berikut ini adalah cuplikan layar konsol server yang mogok:
Ketika server terkunci, seluruh server pada switch yang sama yang juga menjalankan Proxmox 3.1 menjadi tidak terjangkau dan memuntahkan yang berikut ini:
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
...etc...
uname -a output dari server yang terkunci:
Linux ------ 2.6.32-23-pve #1 SMP Tue Aug 6 07:04:06 CEST 2013 x86_64 GNU/Linux
pveversion -v output (disingkat):
proxmox-ve-2.6.32: 3.1-109 (running kernel: 2.6.32-23-pve)
pve-manager: 3.1-3 (running version: 3.1-3/dc0e9b0e)
pve-kernel-2.6.32-23-pve: 2.6.32-109
Dua pertanyaan:
Ada petunjuk apa yang menyebabkan panik kernel (lihat gambar di atas)?
Mengapa server lain pada sakelar dan versi Proxmox yang sama dihilangkan dari jaringan sampai server yang terkunci di-reboot? (Catatan: Ada server lain di sakelar yang sama yang menjalankan Proxmox versi 1.9 yang lebih lama yang tidak terpengaruh. Selain itu, tidak ada server Proxmox lain di gugus 3.1 yang terpengaruh yang tidak berada pada sakelar yang sama.)
Terima kasih sebelumnya atas sarannya.