Apakah saya perlu kartu RAID Fusion-io?


27

Dapatkah saya menjalankan dengan andal dengan satu kartu Fusion-io yang dipasang di server, atau apakah saya perlu menggunakan dua kartu dalam pengaturan RAID perangkat lunak?

Fusion-io tidak terlalu jelas (hampir menyesatkan) pada topik ketika meninjau materi pemasaran mereka. Mengingat biaya kartu, saya ingin tahu bagaimana insinyur lain menyebarkannya dalam skenario dunia nyata.

Saya berencana untuk menggunakan kartu 1.2TB Fusion-io ioDrive2 Fusion -bermerek HP untuk solusi database mandiri yang berjalan di Linux. Ini adalah pengaturan server tunggal tanpa opsi ketersediaan tinggi nyata. Ada adalah replikasi asynchronous dengan 10 menit RPO bahwa transaksi cermin log ke server fisik kedua.

Secara tradisional, saya akan menentukan server HP ProLiant high-end dengan stepping CPU top untuk aplikasi ini. Saya harus pergi ke SSD, dan saya dapat memperoleh Fusion-io dengan harga lebih rendah daripada SSD SAS perusahaan untuk kapasitas yang diperlukan.

  • Apakah saya perlu menjalankan dua kartu ioDrive2 dan menggabungkannya dengan perangkat lunak RAID (md atau ZFS), atau apakah itu tidak perlu?
  • Haruskah saya khawatir tentang kegagalan Fusion-io lebih dari saya akan khawatir tentang kegagalan pengontrol RAID atau kegagalan motherboard?
  • Administrator sistem seperti RAID. Apakah ini memerlukan pola pikir yang berbeda, mengingat antarmuka yang berbeda dan koreksi tingkat keausan / koreksi kesalahan pada kartu yang tersedia di faktor-bentuk ini?
  • Apa IS tingkat kegagalan perangkat ini?

Sunting: Saya baru saja membaca whitepaper keandalan Fusion-io dari Dell, dan sepertinya adalah "Kartu Fusion-io memiliki banyak redudansi internal ... Jangan khawatir tentang RAID !!" .


Apakah peranti lunak akan menggerebek dan / atau bus PCIe bahkan berhasil mengikuti jika Anda mendorong batas IOPS? Jujur saya tidak tahu, tapi ada baiknya memeriksa.
pauska

1
Bus PCIe akan melanjutkan. RAID perangkat lunak (jika saya PERLU ) akan berbasis ZFS, sehingga mampu. Saya telah memesan dua kartu untuk saat ini, tetapi literatur Fusion-io tampaknya mengatakan, "satu kartu cukup baik".
ewwhite

Bahkan ZFS perlu menggunakan siklus CPU untuk mirror data, sehingga menambah kompleksitas dan latensi - tetapi seberapa besar itu akan mempengaruhi aplikasi spesifik Anda tidak mungkin untuk mengatakan. Fusion tampaknya sangat bangga dengan biaya CPU yang rendah pada mirroring internal / pengamanan ..
pauska

Jawaban:


16

Pada akhirnya, ini akan menjadi model kegagalan Anda. Apa dampak dari kegagalan?

Secara historis, kami selalu mem-RAID semuanya karena biaya melakukannya dapat diabaikan. Lain $ 500 untuk drive mirroring? Benar-benar sepadan dengan biaya tanpa mempertimbangkannya.

Ketika Anda berbicara tentang $ 10K + lain untuk menghidupkan mirroring, perlu sedikit lebih banyak pertimbangan.


Tidak, Anda tidak perlu bercermin

Kartu Fusion-io memang memiliki redundansi internal yang cukup bagus. Ini bukan jenis perangkat keras di mana disk Anda adalah satu chip. Dalam sebagian besar situasi di mana saya mengamati kegagalan, ini merupakan masalah firmware yang telah memengaruhi kedua anggota mirror sehingga RAID tidak menjadi masalah.

Pikirkan kartu Fusion-io sebagai pengontrol RAID dengan disk di belakangnya. Apakah Anda baik-baik saja dengan pengaturan satu-pengontrol? Mungkin. Perlakukan itu seperti itu.

Di banyak pengaturan di mana Anda akan menggunakan drive Fusion-io, Anda akan memiliki perlindungan lain bawaan (redundansi di tingkat node) sehingga tidak masuk akal.


Ya, Anda perlu mirror

RAID meningkatkan ketersediaan Anda . Apakah Anda memerlukan ketersediaan maksimum absolut di samping biaya? Apakah biaya kegagalan dan kemungkinan downtime mahal? Silakan dan mirror drive. Dalam pengaturan besar secara statistik, Anda akan mengalami kegagalan drive meskipun ada perlindungan internal.


Pembaruan: Saya telah mencerminkan kartu Fusion-io di instalasi di mana klien baik-baik saja dengan pengeluaran tambahan (dan untuk memudahkan diri saya menggunakan produk). Saya telah menggunakan sejumlah instalasi kartu tunggal dalam situasi lain. Semuanya baik-baik saja sejauh ini ...
ewwhite

18

Redundansi pada perangkat harus melakukan pekerjaan dengan baik untuk kegagalan chip flash - analog dengan RAID di antara semua komponen yang melakukan penyimpanan data aktual.

Haruskah saya khawatir tentang kegagalan Fusion-io lebih dari saya akan khawatir tentang kegagalan pengontrol RAID atau kegagalan motherboard?

Kegagalan seluruh perangkat akan sangat analog dengan hilangnya pengontrol RAID atau motherboard - saya kira-kira sama khawatirnya dengan kartu Fusion-io seperti komponen-komponen kegagalan tunggal lainnya, meskipun saya tidak tahu. t memiliki pengalaman dengan perangkat dalam skala besar untuk dapat membandingkan tingkat kegagalan menggunakan data keras.

Apakah saya perlu menjalankan dua kartu ioDrive2 dan menggabungkannya dengan perangkat lunak RAID (md atau ZFS), atau apakah itu tidak perlu?

Menambahkan redundansi sebagai tambahan terhadap apa yang sudah dimiliki perangkat (katakanlah, RAID perangkat lunak di antara beberapa kartu Fusion-io) akan sangat mirip dengan melakukan RAID perangkat lunak antara dua kelompok RAID perangkat keras pada dua pengontrol RAID yang berbeda; mungkin bermanfaat untuk sistem yang menjamin redundansi ekstrem untuk menghilangkan satu titik kegagalan tambahan, tetapi tidak untuk penyebaran umum (RPO 10 menit pada cermin harus cukup baik untuk sebagian besar aplikasi?).

Sysadmin menyukai RAID. Apakah ini memerlukan pola pikir yang berbeda, mengingat antarmuka yang berbeda dan koreksi tingkat keausan / koreksi kesalahan pada kartu yang tersedia di faktor-bentuk ini?

Ya saya berpikir begitu. Anda pada dasarnya mendapatkan perangkat yang seperti pengontrol RAID dan banyak perangkat penyimpanan di belakangnya dalam satu paket. Pasti tergoda untuk khawatir menempatkan data sensitif Anda pada satu perangkat, tetapi orang perlu memiliki tingkat kepercayaan pada redundansi internal perangkat ... Yang harus diimbangi dengan pemahaman yang sehat tentang "RAID bukan konsep cadangan ": selalu siap untuk kegagalan komponen yang berlebihan, atau bagi pengguna untuk menghapus data di dalamnya, dengan cadangan yang baik.


13

Seperti yang Anda ketahui, kami telah menggunakan kit mereka untuk sementara waktu, baik dalam pengaturan RAID dan non-RAID - Saya berharap saya memiliki beberapa pengalaman kegagalan untuk memberi Anda tetapi saya belum. Kami tidak mengalami kegagalan yang akan membantu RAID dan fitur ketahanan on-board mereka hanya menjadi lebih baik. Juga fungsi utama yang kami gunakan untuk mereka sekarang diskalakan / dikelompokkan secara horizontal sekarang sehingga kami memiliki lebih sedikit alasan untuk melakukan RAID. Kartu hebat, sangat merekomendasikannya.


Titik data yang bagus. Namun, saya tidak tahu apakah menambahkan lapisan RAID berlebihan atau tidak.
ewwhite

1
Saya melihat teknologi ini tidak menjadi titik pendefinisian di sini - baik data Anda memerlukan kemampuan untuk mendukung hilangnya satu kartu FusionIO atau tidak - anggap saja cakram itu cepat, boros, dan disk - yang tidak mengubah apakah Anda dapat hidup tanpa RAID atau tidak?
Chopper3

Sedikit ... Pendekatan tradisional akan menggunakan SSD SAS perusahaan dalam RAID 1 + 0. Itu hanya menerapkan standar yang sama yang digunakan untuk memutar disk ke SSD. Tapi itu juga mengasumsikan hot-swappability. Itu tidak berlaku untuk kartu berbasis PCIe, terutama ketika saya terpaksa menggunakan RAID perangkat lunak untuk mencapai ini. Karena Fusion-io juga memiliki manfaat leveling dan pemantauan keausan yang lebih baik, saya mencoba memahami mode kegagalan realistis yang terlibat di sini. Apakah saya memperlakukan Fusion-io seperti disk atau pengontrol? Anda tidak akan memasukkan dua kartu Smart Array ke dalam ProLiant untuk melayani disk internal, bukan?
ewwhite

2
@ewwhite Anda mungkin memiliki dua pengontrol RAID dengan disk berbeda, dan RAID1 di antara disk pengontrol, jika Anda harus dapat menangani kegagalan pengontrol RAID. Saya akan mengatakan memperlakukan kartu Fusion-io seperti pengontrol RAID dalam hal perencanaan redundansi Anda.
Shane Madden

@ewwhite Jika Anda melihat kata-kata yang saya gunakan Anda dapat membaca yang tersirat bahwa kami memang memiliki satu pemadaman pada satu server yang dilengkapi FusionIO - kami memiliki pop mobo go - DL580 G6 (kami memiliki sangat sedikit dari mereka) dan sesuatu terjadi pada satu bank seluruh memori dan mengeluarkan papan siapa. Dalam skenario ini, RAID 1'ed tapi jelas itu tidak masalah. Tentu saja ingatlah bahwa PCIe bisa hot-swappable, itu bisa menjadi faff besar tetapi bisa bekerja dengan baik.
Chopper3

9

Saya tidak terbiasa dengan Fusion secara langsung, tetapi saya memiliki beberapa pengalaman PCIe SSD untuk bekerja.

Yang saya bekerja dengan menyajikan empat LUN berbeda untuk OS, dan memperlakukan kartu PCIe seperti HBA. Jika saya ingin RAID, saya akan mirror dua LUN bersama-sama menggunakan OS. Ini memungkinkan saya solusi satu kartu untuk redundansi. Padahal, jika kartunya langsung gagal aku masih anak sungai. Saya tidak tahu apakah ioDrive melakukan hal yang sama.


Unit khusus ini akan menghadirkan satu perangkat blok.
ewwhite

1
ioDrives menghadirkan satu atau dua perangkat independen. Jika ada dua, mereka secara fisik dua perangkat terpisah pada satu kartu masing-masing dengan perlindungan internalnya sendiri. Bandingkan dengan, katakanlah, Intel 910 yang menghadirkan masing-masing empat perangkat yang harus diperlakukan sebagai SSD.
MikeyB

5

Saya membeli 6 kartu 1.2tb dalam beberapa bulan terakhir. Salah satunya sudah gagal. Jadi saya benar-benar akan menyerang mereka. Saya menggunakan cermin disk windows aktif. Drive gagal dengan pesan "missing LEB map". Saya diberitahu bahwa itu perlu ditukar. Tetapi untuk mendapatkan RMA yang disetujui saya perlu mengambil gambar di kedua sisi kartu yang gagal (membutuhkan pemadaman produksi untuk mengeluarkan kartu). Dan kemudian mereka memberi tahu saya kartu pengganti sudah habis tanpa eta. Jadi, Anda mungkin ingin berpikir cukup keras sebelum membelinya.


Terima kasih telah berbagi pengalaman Anda. Saya pergi ke depan dan menempatkan kartu 1.2TB ini dalam pasangan cermin. Saya menggunakan SKU HP, jadi saya memiliki kontrak dukungan HP untuk menangani RMA / penggantian.
ewwhite
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.