Ada berbagai solusi untuk kasus distribusi kontinu nol-meningkat (semi-):
- Regresi Tobit : mengasumsikan bahwa data berasal dari satu distribusi Normal yang mendasarinya, tetapi nilai negatif disensor dan ditumpuk pada nol (mis. Paket censReg )
- model rintangan atau "dua tahap": gunakan model binomial untuk memprediksi apakah nilainya 0 atau> 0, kemudian gunakan model linier (atau Gamma, atau terpotong Normal, atau log-Normal) untuk memodelkan nilai bukan nol yang diamati
- 1<p<2x>0
Atau, jika struktur data Anda cukup sederhana, Anda bisa menggunakan model linier dan menggunakan tes permutasi atau pendekatan kuat lainnya untuk memastikan bahwa kesimpulan Anda tidak dikacaukan oleh distribusi data yang menarik.
Ada paket R / solusi yang tersedia untuk sebagian besar kasus ini.
Ada pertanyaan lain di SE tentang data kontinu nol-inflated (semi) (misalnya di sini , di sini , dan di sini ), tetapi mereka tampaknya tidak menawarkan jawaban umum yang jelas ...
Lihat juga Min & Agresti, 2002, Pemodelan Data Nonnegatif dengan Clumping at Zero: A Survey untuk ikhtisar.