Bagaimana saya bisa meyakinkan pengembang di tim saya untuk merangkul "Anda membangunnya, Anda menjalankannya"? Dengan itu, saya memiliki kutipan dari Werner Vogels ini dalam pikiran:
Memberi tanggung jawab operasional kepada pengembang telah sangat meningkatkan kualitas layanan, baik dari sudut pandang pelanggan maupun teknologi. Model tradisional adalah bahwa Anda membawa perangkat lunak Anda ke dinding yang memisahkan pengembangan dan operasi, dan membuangnya lalu melupakannya. Bukan di Amazon. Anda membangunnya, Anda menjalankannya. Ini membawa pengembang ke dalam kontak dengan operasi harian dari perangkat lunak mereka. Ini juga membawa mereka ke dalam kontak sehari-hari dengan pelanggan. Putaran umpan balik pelanggan ini sangat penting untuk meningkatkan kualitas layanan.
Saya secara khusus memikirkan serangkaian pengembang yang:
- Dipekerjakan sebagai pengembang, dengan sedikit / tanpa menyebutkan tugas yang berhubungan dengan operasi.
- Secara tradisional telah "melemparkan kode ke tembok" ke tim operasi.
- Secara tradisional memiliki jadwal kerja 9-5, dan secara aktif memusuhi gagasan "tugas pager", berpartisipasi dalam pemulihan bencana, menulis post-mortem, dll, terutama di luar jam kerja normal. (Catatan: Saya hanya memikirkan pemadaman yang sangat jarang terjadi; saya tidak mengusulkan agar kami menambahkan dukungan pelanggan setelah jam kerja ke beban kerja tim ini.)
- Saat ini tidak bertanggung jawab untuk menulis / mendukung pemantauan atau mengingatkan pada aplikasi mereka.
Misalkan ada tim yang dengan cepat mengembangkan layanan mikro cloud baru dengan profil yang menjadi sedemikian rupa sehingga menyerahkan layanan ini ke tim ops adalah kurang optimal karena mereka tidak dapat mengimbangi untuk mendapatkan pengetahuan yang mendalam tentang layanan yang diperlukan untuk mengelola dan memonitor mereka secara efektif. "Anda membangunnya, Anda menjalankannya" akan bekerja lebih baik untuk tim ini karena tugas dapat didelegasikan kepada setiap anggota tim yang bertanggung jawab. Jadi tim ini akan mulai mengambil bagian dalam merancang infrastruktur, memonitor / mengingatkan alat untuk layanan, dan (sangat jarang) menanggapi peristiwa pemadaman.
Saya secara khusus tertarik pada metodologi, yang didukung oleh contoh-contoh dunia nyata. Bagaimana ini berhasil diimplementasikan di tempat kerja lain, dan jika ada langkah kanonik untuk diikuti saat menerapkan ini? Tautan apa saja ke artikel yang dapat mendukung jawaban akan sangat membantu.