Dari orang-orang yang mengelola kelompok mereka sendiri (yaitu tidak menggunakan / membayar untuk Amazon Autoscale, Rightscale, Scalr, dll.), Bagaimana Anda mengelola mesin virtual Anda pada EC2 dan menangani (misalnya) failover? Saya bertanya-tanya apakah kebanyakan orang akhirnya menulis skrip kapal mereka sendiri melawan EC2 API, seperti yang saya duga.
Itu tentu saja pendekatan kami: menyiapkan daemon pemantauan / memulai ulang Python Boto kami sendiri yang berjalan di luar situs, mendengarkan UDP keep-alive dari instance kami. Jika gagal, kami memotret volume, mendaftarkan gambar, memulai instance baru, menghapus volume lama, dan sebagainya.
Sering kali, ketika meretas skrip kami, saya pikir pasti ada beberapa alat open-source di luar sana yang sudah menangani masalah ini, dan yang tidak memiliki kendala (katakanlah) Scalr, tapi saya selalu kembali dari Google dengan tangan kosong (Hal-hal seperti yang dimiliki Scalr sangat terbatas pada set / versi / konfigurasi perangkat lunak yang didukung, dan memiliki cara rumit dan rumit IMO untuk memanipulasi pengaturan ini.)
Juga, ekosistem Linux-HA / Alat Pacu Jantung (Detak Jantung, ldirectord, dll.) Sepertinya tidak cocok untuk EC2 . (Tapi kemudian saya menemukan ini - walaupun saya tidak yakin ini benar-benar solusi berkualitas tinggi).