Setelah berbulan-bulan lalai, kobaran api email dan pertempuran manajemen sysadmin kami saat ini dipecat dan menyerahkan "kredensial server" kepada saya. Kredensial tersebut terdiri dari kata sandi root dan tidak ada yang lain: tidak ada prosedur, tidak ada dokumentasi, tidak ada tips, tidak ada.
Pertanyaan saya adalah: dengan asumsi dia meninggalkan boobytraps, bagaimana cara saya mengambil alih server dengan downtime sesedikit mungkin?
Berikut detailnya:
- satu server produksi yang terletak di server farm di ruang bawah tanah; server ubuntu 9.x mungkin, dengan patch grsec (rumor yang saya dengar terakhir kali saya bertanya kepada admin)
- satu server internal yang berisi semua dokumentasi internal, repositori file, wiki, dll. Sekali lagi, server ubuntu, berumur beberapa tahun.
Anggap kedua server telah ditambal dan mutakhir, jadi saya lebih suka tidak mencoba meretas jalan saya kecuali ada alasan yang bagus (yaitu yang dapat dijelaskan kepada manajemen tingkat atas).
Server produksi memiliki beberapa situs web yang di-host (standar apache-php-mysql), server LDAP, suite / server email ZIMBRA, dan sejauh yang saya tahu beberapa workstation vmware berjalan. Tidak tahu apa yang terjadi di sana. Mungkin satu adalah master LDAP, tapi itu dugaan liar.
Server internal memiliki wiki / cms internal, budak LDAP yang mereplikasi kredensial dari server produksi, beberapa workstation vmware lagi, dan backup berjalan.
Saya hanya bisa pergi ke admin farm server, menunjuk ke server, memberi tahu mereka ' sudo
matikan server itu', masuk dalam mode pengguna tunggal dan dapatkan cara saya dengannya. Sama untuk server internal. Namun, itu berarti downtime, manajemen atas kesal, sysadmin tua membalas saya dengan berkata 'lihat? Anda tidak dapat melakukan pekerjaan saya 'dan gangguan lainnya, dan yang paling penting saya harus kehilangan potensi beberapa minggu waktu yang belum dibayar.
Di ujung lain dari spektrum saya hanya bisa login sebagai root dan inci melalui server untuk mencoba membuat pemahaman tentang apa yang terjadi. Dengan semua risiko memicu kejutan yang tertinggal.
Saya mencari solusi di tengah: cobalah untuk menjaga semuanya berjalan seperti apa adanya, sambil memahami apa yang terjadi dan bagaimana, dan yang paling penting adalah menghindari memicu jebakan yang tertinggal .
Apa saran Anda?
Sejauh ini saya berpikir tentang 'berlatih' dengan server internal, memutus jaringan, me-reboot dengan live cd, membuang sistem file root ke drive USB, dan memuatnya pada mesin virtual yang terputus dan terisolasi untuk memahami cara sysadmin sebelumnya. berpikir (a-la 'kenal musuhmu'). Bisa menarik prestasi yang sama dengan server produksi, tetapi dump penuh akan membuat seseorang memperhatikan. Mungkin saya bisa login sebagai root, periksa crontab, periksa. Profil untuk semua perintah yang diluncurkan, buang lastlog, dan apa pun yang terlintas dalam pikiran.
Dan itu sebabnya saya di sini. Petunjuk apa pun, sekecil apa pun, akan sangat dihargai.
Waktu juga menjadi masalah: mungkin ada pemicu yang terjadi dalam beberapa jam, atau beberapa minggu. Terasa seperti salah satu film Hollywood yang buruk, bukan?