Penyensoran sering dijelaskan dalam perbandingan dengan pemotongan . Deskripsi yang bagus dari kedua proses ini disediakan oleh Gelman et al (2005, p. 235):
Data terpotong berbeda dari data yang disensor bahwa tidak ada jumlah pengamatan di luar titik pemotongan yang tersedia. Dengan menyensor nilai -
nilai pengamatan di luar titik pemotongan hilang, tetapi jumlahnya diamati.
Sensor atau pemotongan dapat terjadi untuk nilai di atas beberapa level (sensor kanan), di bawah beberapa level (sensor kiri), atau keduanya.
2.02.0
Contoh intuitif sensor adalah bahwa Anda bertanya kepada responden tentang usia mereka, tetapi catat hanya sampai beberapa nilai dan semua usia di atas nilai ini, katakanlah 60 tahun, dicatat sebagai "60+". Ini mengarah pada memiliki informasi yang akurat untuk nilai-nilai yang tidak disensor dan tidak ada informasi tentang nilai-nilai yang disensor.
Tidak begitu khas, contoh kehidupan nyata dari sensor diamati dalam skor ujian matura Polandia yang menarik cukup banyak perhatian di internet . Ujian diambil di akhir sekolah menengah dan siswa harus lulus agar dapat mendaftar ke pendidikan tinggi. Bisakah Anda menebak dari plot di bawah ini berapa jumlah minimal poin yang siswa butuhkan untuk lulus ujian? Tidak mengherankan, "celah" dalam distribusi normal dapat dengan mudah "diisi" jika Anda mengambil fraksi yang sesuai dari skor yang diwakili tepat di atas batas sensor.
Dalam hal analisis survival
penyensoran terjadi ketika kita memiliki beberapa informasi tentang waktu bertahan hidup individu, tetapi kita tidak tahu persis waktu bertahan hidup
(Kleinbaum dan Klein, 2005, hal. 5). Misalnya, Anda merawat pasien dengan beberapa obat dan mengamati mereka sampai akhir studi Anda, tetapi Anda tidak memiliki pengetahuan apa yang terjadi pada mereka setelah studi selesai (apakah ada kekambuhan atau efek samping?), Satu-satunya hal yang Anda tahu adalah mereka " selamat " setidaknya sampai akhir penelitian.
Di bawah ini Anda dapat menemukan contoh data yang dihasilkan dari distribusi Weibull yang dimodelkan menggunakan estimator Kaplan-Meier. Kurva biru menandai model yang diperkirakan pada dataset lengkap, di plot tengah Anda dapat melihat sampel yang disensor dan model yang diperkirakan pada data yang disensor (kurva merah), di sebelah kanan Anda melihat sampel terpotong dan model diperkirakan pada sampel tersebut (kurva merah). Seperti yang Anda lihat, data yang hilang (pemotongan) memiliki dampak signifikan pada perkiraan, tetapi sensor dapat dengan mudah dikelola menggunakan model analisis survival standar.
Ini tidak berarti bahwa Anda tidak dapat menganalisis sampel terpotong, tetapi dalam kasus seperti itu Anda harus menggunakan model untuk data yang hilang yang mencoba "menebak" informasi yang tidak diketahui.
Kleinbaum, DG dan Klein, M. (2005). Analisis Kelangsungan Hidup: Teks Belajar Mandiri. Peloncat.
Gelman, A., Carlin, JB, Stern, HS, dan Rubin, DB (2005). Analisis Data Bayesian. Chapman & Hall / CRC.