Saya memiliki dataset medis dengan sekitar 200 variabel. Salah satu variabel adalah penanda-bio (konsentrasi enzim tertentu). Distribusinya condong ke kanan, dan masalahnya adalah bahwa nilai di atas level tertentu disensor / terputus pada level itu. Jadi, sementara rata-rata variabel sekitar 10, nilai apa pun yang lebih besar dari 50 dicatat sebagai 50.
Saya ingin menambahkan nilai kontinu untuk nilai-nilai yang disensor itu. Saya menggunakan beberapa imputasi dengan paket mouse di R saat ini, meskipun sistem lain tersedia untuk saya dan saya terbuka untuk pendekatan lain. Sebuah pemikiran yang saya miliki adalah untuk mengkode ulang semua nilai yang disensor agar hilang dan kemudian menjalankan imputasi. Jika salah satu nilai imputasi yang awalnya disensor di bawah cut-off, maka mereka akan ditetapkan sebagai nilai cut-off.
Saya ingin mengetahui pendapat tentang ini, dan / atau metode yang lebih baik untuk menangani ini.