Bagaimana cara mengatasi efek plafon akibat alat ukur?


12

Saya telah mengumpulkan data psikofisiologis yang mengukur kemampuan subyek (dua kelompok) untuk merasakan getaran. Probe bergetar bergerak melawan kulit pada perpindahan yang lebih kecil dan lebih kecil, dan subjek mengindikasikan kapan mereka merasakan getaran. Sayangnya, pada frekuensi tinggi, probe hanya bisa bergerak jarak pendek, dan kadang-kadang jarak terbesar yang bisa bergerak probe masih tidak cukup besar untuk dilihat oleh subjek. Jadi, saya memiliki nilai ambang batas yang akurat untuk beberapa mata pelajaran, tetapi bagi sebagian yang tidak pernah merasakan getaran, saya hanya memiliki nilai yang saya tahu ambangnya lebih besar daripada. Apakah ada cara bagi saya untuk tetap memasukkan data ini? Dan apa cara terbaik untuk menganalisanya?


5
Ini disebut pengamatan tersensor . Cara memasukkannya tergantung pada jenis analisis statistik yang Anda lakukan.

Saya setuju dengan Penunda, kecuali bahwa saya akan menggunakan istilah terpotong. Pendekatan untuk masalah simlar yang disebut sensor kanan terjadi dalam analisis survival di sana Anda menyimpan nilai terpotong tetapi memiliki variabel indikator untuk memberi tahu Anda apakah nilainya adalah nilai lengkap atau yang disensor. Dalam analisis survival ada cara sederhana untuk menangani ini tetapi itu karena Anda memperkirakan kurva survival. Di sini Anda mungkin ingin menghitung rata-rata. Jika Anda mengabaikan pendidikan Anda meremehkan rata-rata. Jika Anda membuang poin terpotong Anda meremehkan rata-rata.
Michael R. Chernick

Untuk memasukkan nilai terpotong dengan benar, Anda harus memiliki model probabilitas untuk jarak probe mengingat bahwa itu lebih besar dari ambang. Anda kemudian dapat mengambil rata-rata distribusi itu dan menghitung rata-rata tertimbang menggunakan rata-rata untuk nilai-nilai yang tidak terpotong dengan rata-rata untuk distribusi terpotong di mana bobotnya sesuai dengan proporsi kasus terpotong.
Michael R. Chernick

4
Pemotongan adalah apa yang akan terjadi jika Anda membuang data yang tidak teridentifikasi. Anda tidak ingin melakukan itu! Anda benar, Cale, bahwa ada informasi dalam nilai-nilai yang disensor ini dan mencurigai bahwa ada beberapa cara standar untuk menganalisanya (dan perangkap bagi yang tidak waspada). Tetapi untuk memberikan jawaban yang baik kita perlu tahu jenis analisis apa yang Anda cari. Secara khusus, perlakuan terhadap data ini secara fundamental berbeda tergantung pada apakah mereka muncul sebagai variabel dependen atau independen dalam suatu regresi. Mungkin Anda bisa menguraikan ini?
whuber

1
Detail kecil yang tidak terkait dengan pertanyaan statistik yang ada tetapi mungkin berguna untuk mengetahui: Data jenis ini biasanya disebut data "psikofisik", bukan "psikofisiologis" (yang mencakup hal-hal seperti detak jantung atau ukuran konduktansi kulit tetapi tidak penilaian subjektif tentang sensasi ). Ini juga dapat membantu Anda mencari literatur tentang bagaimana orang biasanya memperlakukan tipe data ini.
Gala

Jawaban:


2

Saya suka menggunakan Model Campuran heterogen untuk menggambarkan efek gabungan dari sumber yang berbeda secara fundamental.

Anda mungkin melihat sesuatu seperti model "Zero Inflated Poisson" dalam gaya Diane Lambert. " Regresi Poisson Nol-Inflated, Dengan Aplikasi untuk Cacat dalam Manufaktur ", Diane Lambert, Technometrics, Vol. 34, Iss. 1, 1992

Saya menemukan ide ini sangat menyenangkan karena tampaknya bertentangan dengan anggapan bahwa penerapan desain statistik percobaan untuk pengobatan tidak dapat sepenuhnya menyembuhkan penyakit. Di balik gagasan tersebut terdapat gagasan bahwa metode ilmiah tidak dapat menyelesaikan tujuannya dalam kedokteran berasal dari gagasan bahwa tidak ada data penyakit dari individu yang sehat "sempurna" sehingga data tersebut tidak dapat memberi informasi mengenai pengobatan penyakit. Tanpa pengukuran tidak ada ruang untuk meningkatkan.

Menggunakan sesuatu seperti model zero-inflated memungkinkan seseorang untuk mengekstrak informasi berguna dari data yang sebagian "bebas kesalahan". Menggunakan wawasan ke dalam proses untuk mengambil informasi yang dapat dianggap sebagai "diam" dan membuatnya berbicara. Bagi saya ini adalah hal yang Anda coba lakukan.

Sekarang saya tidak bisa mulai menyatakan kombinasi model mana yang akan digunakan. Saya menduga Anda dapat menggunakan Gaussian Mixture Model (GMM) nol-inflasi untuk pemula. GMM adalah sedikit pendekatan universal empiris untuk PDF berkelanjutan - seperti sepupu PDF dari pendekatan Fourier Series, tetapi dengan dukungan teorema batas pusat untuk meningkatkan penerapan global dan memungkinkan banyak komponen yang lebih sedikit untuk membuat " bagus "aproksimasi.

Semoga berhasil.

EDIT:

Lebih lanjut tentang model tanpa inflasi:


0

Mengelompokkan hasil dan mendefinisikan skala mungkin menjadi solusi.

Buat variabel kategori seperti itu (atau berbeda):

  1. Sensitivitas tinggi
  2. Sensitivitas normal
  3. Sensitivitas rendah
  4. Tidak peka (yang tidak sesuai dengan kasus Anda)

Anda bisa menggunakan variabel ini untuk melakukan analisis, tetapi apakah hasilnya bermakna tergantung pada seberapa baik Anda mendefinisikan kategori.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.