Saya akan membedakan analisis menggunakan model berbasis versus kesalahan standar yang kuat dengan merujuk yang terakhir sebagai "GEE" yang sebenarnya merupakan definisi yang dapat dipertukarkan. Selain penjelasan fantastis Scortchi:
GEE dapat "bias" dalam sampel kecil, yaitu 10-50 subjek: (Lipsitz, Laird, dan Harrington, 1990; Emrich dan Piedmonte, 1992; Sharples dan Breslow, 1992; Lipsitz et al., 1994; Qu, Piedmonte, dan Williams, 1994; Gunsolley, Getchell, dan Chinchilli, 1995; Sherman dan le Cessie, 1997.) Ketika saya mengatakan bahwa GEE bias apa yang saya maksudkan adalah bahwa perkiraan kesalahan standar dapat berupa konservatif atau antikonservatif karena jumlah sel yang kecil atau nol , tergantung pada nilai-nilai yang cocok menunjukkan perilaku ini dan seberapa konsisten mereka dengan tren keseluruhan dari model regresi.
Secara umum, ketika model parametrik ditentukan dengan benar, Anda masih mendapatkan perkiraan kesalahan standar yang benar dari CI berbasis model, tetapi seluruh titik penggunaan GEE adalah untuk mengakomodasi "jika" yang sangat besar. GEE memungkinkan ahli statistik untuk hanya menentukan model probabilitas kerja untuk data, dan parameter (alih-alih ditafsirkan dalam kerangka parametrik ketat) dianggap sebagai jenis "saringan" yang dapat menghasilkan nilai yang dapat direproduksi terlepas dari yang mendasari, pembuatan data yang tidak diketahui mekanisme. Ini adalah jantung dan jiwa dari analisis semi-parametrik, yang menjadi contoh GEE.
GEE juga menangani sumber kovarisasi yang tidak terukur dalam data, bahkan dengan spesifikasi matriks korelasi independen. Ini karena penggunaan matriks kovarians berbasis empiris daripada model. Dalam pemodelan Poisson, misalnya, Anda mungkin tertarik pada tingkat kesuburan salmon sampel dari berbagai aliran. Ova yang dipanen dari ikan betina mungkin memiliki distribusi Poisson yang mendasarinya, tetapi variasi genetik yang terdiri dari heretibilitas bersama dan sumber daya yang tersedia di aliran tertentu mungkin membuat ikan di dalam aliran tersebut lebih mirip daripada di antara aliran lainnya. GEE akan memberikan perkiraan kesalahan standar populasi yang benar selama laju pengambilan sampel konsisten dengan proporsi populasi mereka (atau dengan cara lain distratifikasi).