Saya memiliki server HP ProLiant DL380 G7 yang berjalan sebagai unit penyimpanan NexentaStor . Server memiliki RAM 36GB, 2 LSI 9211-8i pengontrol SAS (tanpa ekspander SAS), 2 drive sistem SAS, 12 drive data SAS, disk hot-spare, cache L2ARC Intel X25-M L2ARC, dan akselerator DDRdrive PCI ZIL. Sistem ini melayani NFS ke beberapa host VMWare. Saya juga punya sekitar 90-100GB data deduplikasi pada array.
Saya mengalami dua insiden di mana kinerja merosot tiba-tiba, membuat para tamu VM dan konsol Nexenta SSH / Web tidak dapat diakses dan memerlukan reboot penuh array untuk memulihkan fungsionalitas. Dalam kedua kasus, itu adalah Intel X-25M L2ARC SSD yang gagal atau "ditolak". NexentaStor gagal memberi tahu saya tentang kegagalan cache, namun peringatan FMA ZFS umum terlihat di layar konsol (tidak responsif).
The zpool status
Output menunjukkan:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
Ini tidak memicu peringatan apa pun dari dalam Nexenta.
Saya mendapat kesan bahwa kegagalan L2ARC tidak akan berdampak pada sistem. Tapi dalam kasus ini, itu pasti pelakunya. Saya belum pernah melihat rekomendasi ke RAID L2ARC. Menghapus SSD yang buruk sepenuhnya dari server membuat saya kembali berjalan, tetapi saya khawatir tentang dampak kegagalan perangkat (dan mungkin juga kurangnya pemberitahuan dari NexentaStor).
Edit - Apa SSD pilihan terbaik saat ini untuk aplikasi cache L2ARC hari ini?