Bukan pertanyaan teknis, tetapi yang valid tetap. Skenario:
HP ProLiant DL380 Gen 8 dengan CPU 2 x 8-core Xeon E5-2667 dan RAM 256GB yang menjalankan ESXi 5.5. Delapan VM untuk sistem vendor yang diberikan. Empat VM untuk pengujian, empat VM untuk produksi. Keempat server di setiap lingkungan melakukan fungsi yang berbeda, misalnya: server web, server aplikasi utama, server OLAP DB dan server SQL DB.
CPU share dikonfigurasikan untuk menghentikan lingkungan pengujian agar tidak memengaruhi produksi. Semua penyimpanan di SAN.
Kami telah memiliki beberapa pertanyaan tentang kinerja, dan vendor bersikeras bahwa kami perlu memberikan lebih banyak memori dan vCPU sistem produksi. Namun, kita dapat dengan jelas melihat dari vCenter bahwa alokasi yang ada tidak disentuh, misalnya: tampilan bulanan pemanfaatan CPU pada server aplikasi utama berkisar sekitar 8%, dengan lonjakan ganjil hingga 30%. Paku-paku tersebut cenderung bertepatan dengan perangkat lunak cadangan yang mulai berdatangan.
Kisah serupa tentang RAM - angka pemanfaatan tertinggi di seluruh server adalah ~ 35%.
Jadi, kami telah melakukan penggalian, menggunakan Process Monitor (Microsoft SysInternals) dan Wireshark, dan rekomendasi kami kepada vendor adalah bahwa mereka melakukan beberapa penyetelan TNS pada contoh pertama. Namun, ini tidak penting.
Pertanyaan saya adalah: bagaimana kita membuat mereka mengakui bahwa statistik VMware yang telah kita kirim cukup bukti sehingga lebih banyak RAM / vCPU tidak akan membantu?
--- PEMBARUAN 12/07/2014 ---
Minggu yang menarik. Manajemen TI kami telah mengatakan bahwa kami harus melakukan perubahan pada alokasi VM, dan kami sekarang sedang menunggu waktu henti dari para pengguna bisnis. Anehnya, para pengguna bisnis adalah orang-orang yang mengatakan bahwa aspek-aspek tertentu dari aplikasi berjalan lambat (dibandingkan dengan apa, saya tidak tahu), tetapi mereka akan "beri tahu kami" ketika kami dapat menurunkan sistem (menggerutu) , menggerutu!).
Sebagai tambahan, aspek "lambat" dari sistem tampaknya bukan elemen HTTP (S), yaitu: "aplikasi tipis" yang digunakan oleh sebagian besar pengguna. Kedengarannya seperti instalasi "klien besar", yang digunakan oleh badan keuangan utama, yang tampaknya "lambat". Ini berarti bahwa kami sekarang mempertimbangkan interaksi klien dan server-klien dalam penyelidikan kami.
Karena tujuan awal dari pertanyaan ini adalah untuk mencari bantuan apakah akan turun rute "menyodok", atau hanya membuat perubahan, dan kami sekarang membuat perubahan, saya akan menutupnya menggunakan jawaban longneck .
Terima kasih atas masukan Anda; seperti biasa, serverfault lebih dari sekedar forum - itu seperti sofa psikolog juga :-)