Di waktu senggang saya, saya sedang mengerjakan sistem berbasis web kecil yang mengumpulkan laporan kerusakan (tetapi bukan yang lain, laporan bug yang tidak mogok) yang dikirim dari aplikasi Delphi Windows.
Untuk pemecahan masalah, pengguna akan senang memiliki fitur penambangan data untuk menemukan hubungan antara perangkat keras atau versi sistem operasi dan bug dan / atau kerusakan spesifik.
Sebagai contoh bagaimana ini seharusnya bekerja:
- untuk setiap kerusakan ada laporan dalam database, yang memiliki kode sidik jari / hash dari jejak tumpukan (panggilan tumpukan) pada saat kecelakaan untuk mengidentifikasi duplikat
- algoritme memeriksa apakah semua duplikat dari laporan bug juga memiliki beberapa atribut umum lainnya, misalnya paket layanan yang hilang dari sistem operasi
- hasil analisis mencantumkan semua properti yang memiliki laporan bug yang sama
Mari kita asumsikan laporan bug otomatis ini mengandung semua informasi utama seperti nama semua proses yang sedang berjalan, nama file, informasi versi DLL yang dimuat, dll.
Bagaimana saya bisa menemukan korelasi antara tabrakan berulang dan lingkungan? Apakah ada algoritma atau metode statistik tertentu yang akan membantu?