Seorang rekan kerja menganalisis beberapa data biologis untuk disertasinya dengan beberapa Heteroscedasticity jahat (gambar di bawah). Dia menganalisanya dengan model campuran tetapi masih mengalami masalah dengan residu.
Mentransformasi variabel-variabel respons membersihkan semuanya dan berdasarkan umpan balik terhadap pertanyaan ini, ini tampaknya merupakan pendekatan yang tepat. Awalnya, bagaimanapun, kami berpikir ada masalah dalam menggunakan variabel yang diubah dengan model campuran. Ternyata kami telah salah menafsirkan pernyataan dalam SAS Littell & Milliken (2006) untuk Model Campuran yang menunjukkan mengapa tidak tepat untuk mengubah data jumlah dan kemudian menganalisisnya dengan model campuran linier normal (kutipan lengkap di bawah) .
Pendekatan yang juga meningkatkan residu adalah dengan menggunakan model linier umum dengan distribusi Poisson. Saya telah membaca bahwa distribusi Poisson dapat digunakan untuk memodelkan data kontinu (misalnya, seperti yang dibahas dalam posting ini ), dan paket statistik memungkinkannya, tetapi saya tidak mengerti apa yang terjadi ketika model tersebut sesuai.
Untuk memahami bagaimana perhitungan yang mendasarinya dibuat, pertanyaan saya adalah: Ketika Anda memasukkan distribusi Poisson ke data kontinu, 1) apakah data dibulatkan ke bilangan bulat terdekat 2) apakah ini mengakibatkan hilangnya informasi dan 3) Kapan, jika pernah, apakah pantas untuk menggunakan model Poisson untuk data kontinu?
Littel & Milliken 2006, hal 529 "mentransformasikan data [hitung] mungkin kontraproduktif. Misalnya, transformasi dapat mendistorsi distribusi efek model acak atau linearitas model. Lebih penting lagi, mengubah data masih meninggalkan kemungkinan terbuka dari jumlah prediksi negatif. Akibatnya, kesimpulan dari model campuran menggunakan data yang ditransformasikan sangat mencurigakan. "