Saya punya dataset tentang uji coba pertanian. Variabel respons saya adalah rasio respons: log (pengobatan / kontrol). Saya tertarik pada apa yang memediasi perbedaan, jadi saya menjalankan RE meta-regresi (tidak berbobot, karena tampaknya cukup jelas bahwa ukuran efek tidak berkorelasi dengan varian perkiraan).
Setiap studi melaporkan hasil gabah, hasil biomassa, atau keduanya. Saya tidak bisa menyalahkan hasil gabah dari penelitian yang melaporkan hasil biomassa saja, karena tidak semua tanaman yang dipelajari bermanfaat untuk gabah (tebu dimasukkan, misalnya). Tetapi setiap tanaman yang menghasilkan biji-bijian juga memiliki biomassa.
Untuk kovariat yang hilang, saya telah menggunakan imputasi regresi berulang (mengikuti bab buku Andrew Gelman). Tampaknya memberikan hasil yang masuk akal, dan keseluruhan proses umumnya intuitif. Pada dasarnya saya memprediksi nilai-nilai yang hilang, dan menggunakan nilai-nilai yang diprediksi untuk memprediksi nilai-nilai yang hilang, dan loop melalui setiap variabel sampai masing-masing variabel kira-kira konvergen (dalam distribusi).
Apakah ada alasan mengapa saya tidak dapat menggunakan proses yang sama untuk menghubungkan data hasil yang hilang? Saya mungkin dapat membentuk model imputasi yang relatif informatif untuk rasio respons biomassa mengingat rasio respons biji-bijian, jenis tanaman, dan kovariat lainnya yang saya miliki. Saya kemudian akan rata-rata koefisien dan VCV, dan menambahkan koreksi MI sesuai praktik standar.
Tetapi apa yang diukur koefisien ini ketika hasil itu sendiri diperhitungkan? Apakah interpretasi koefisien berbeda dari MI standar untuk kovariat? Memikirkan hal itu, saya tidak dapat meyakinkan diri saya bahwa ini tidak berhasil, tetapi saya tidak begitu yakin. Pikiran dan saran untuk bahan bacaan dipersilahkan.