Apakah ada alasan khusus Anda akan memilih estimasi kepadatan kernel daripada estimasi parametrik? Saya sedang belajar menyesuaikan distribusi dengan data saya. Pertanyaan ini datang kepada saya.
Ukuran data saya cukup besar dengan 7500 titik data. Klaim otomatis. Tujuan saya adalah mencocokkannya dengan distribusi (nonparametrik atau parametrik). Dan kemudian menggunakannya untuk mensimulasikan data klaim otomatis, dan menghitung VaR atau TVaR.
Saya menggunakan log untuk mengubah data agar relatif normal. Saya memasang banyak distribusi termasuk normal, lognormal, gamma, t, dll ... Saya menggunakan AIC dan loglikehood untuk mengidentifikasi pemasangan terbaik. Tapi tidak satu pun dari semua pemasangan ini lulus uji KS (nilai p sangat kecil, dengan e-10).
Itu sebabnya saya bertanya dalam situasi apa saya harus beralih ke KDE.