Saya memiliki dataset yang melihat aplikasi imigrasi dan penerimaan visa (pemberian visa). Tarif dihitung untuk aplikasi visa yang "diterima" dan "ditolak".
Namun, dataset juga memiliki nilai untuk kasus yang ditutup. Biasanya ini adalah ketika imigran berhenti muncul untuk janji, bermigrasi ke tempat lain, atau meninggal. Karena angka-angka ini tidak digunakan ketika tarif dihitung, tarif sering muncul sebagai hilang (karena kasus tidak diterima atau ditolak).
Yang sedang berkata, jika satu-satunya kasus untuk tahun itu adalah "jika tidak ditutup," akankah tidak apa-apa untuk menghentikan pengamatan ini? Bagian dari masalah yang saya alami adalah bahwa tahun acak dalam dataset akan dihapus, karena satu-satunya keputusan untuk tahun itu ditutup.
Kasus-kasus yang ditutup sangat sewenang-wenang, dan seperti yang saya sebutkan, kemungkinan besar adalah kasus di mana imigran bermigrasi ke tempat lain, dan mungkin hanya menggunakan negara pertama sebagai tempat transit sementara. Data tidak secara spesifik mengatakan mengapa para imigran pergi, mengapa mereka ditutup, dll. Saya tidak begitu yakin bagaimana menangani nilai-nilai yang hilang ini. Saya tidak percaya bahwa metode imputasi standar akan bekerja di sini, karena perhitungan laju (tapi saya bisa saja salah).