Ok, build baru kami memiliki lonjakan cpu 100% di setiap server secara acak. Untuk jangka waktu lama, itu membuat situs benar-benar tidak responsif - ini akan menjadi saat puncak ketika orang-orang di berbagai negara masuk ke situs dll.
Kami telah melihat perfmom, memori profiler, profiler CLR, sql profiler, profiler semut gerbang merah, mencoba pengujian beban dalam UAT - tetapi bahkan tidak dapat mereproduksi masalah. Ini bisa berarti hanya ribuan pengguna yang memukul situs langsung yang menyebabkannya terjadi.
Salah satu pola yang kami perhatikan adalah bahwa kode baru - build rusak - sebenarnya menggunakan thread yang lebih sedikit.
Kami juga menggunakan pegas untuk IOC - apakah ini memiliki reputasi bed?
Untuk memperburuk keadaan, kami tidak dapat menggunakan untuk hidup karena dampak bisnis - jadi tidak dapat mempersempit masalah menjadi subset dari fitur baru yang kami tambahkan.
Kami benar-benar hancur - adakah yang punya bekas luka pertempuran yang bisa menyelamatkan kami beberapa nyawa?