Latar Belakang: Saya seorang ahli biostatistik yang saat ini bergulat dengan dataset tingkat ekspresi seluler. Penelitian ini mengekspos sejumlah sel, dikumpulkan dalam kelompok dari berbagai donor, ke peptida tertentu. Sel mengekspresikan biomarker tertentu sebagai respons, atau tidak. Tingkat respons kemudian dicatat untuk setiap kelompok donor. Tingkat respons (dinyatakan sebagai persentase) adalah hasil yang menarik, dan paparan peptida adalah prediktornya.
Perhatikan bahwa pengamatan dikelompokkan dalam donor.
Karena saya hanya memiliki data ringkasan, saya memperlakukan tingkat respons yang bijaksana dari donor sebagai data yang berkelanjutan (setidaknya untuk saat ini).
Komplikasi muncul dari kenyataan bahwa saya memiliki banyak nol dalam data saya. Terlalu banyak untuk diabaikan. Saya sedang mempertimbangkan model gamma nol-meningkat untuk menangani fakta bahwa saya telah condong data kontinu ditambah dengan melimpahnya angka nol. Saya juga mempertimbangkan model Tobit, tetapi ini tampaknya lebih rendah karena mengasumsikan sensor pada batas bawah, yang bertentangan dengan nol asli (ahli ekonometrika mungkin mengatakan perbedaannya diperdebatkan).
Pertanyaan: Secara umum, kapan tepat menggunakan model gamma nol-inflasi? Artinya, apa saja asumsinya? Dan bagaimana seseorang mengartikan kesimpulannya? Saya akan berterima kasih atas tautan ke makalah yang membahas ini, jika Anda punya.
Saya telah menemukan tautan pada SAS-L di mana Dale McLerran memberikan kode NLMIXED untuk model gamma nol-inflasi, sehingga tampaknya memungkinkan. Meskipun demikian, saya akan benci untuk menyerang balik secara membabi buta.