Sampel biasanya diasumsikan homogen dalam arti bahwa istilah kesalahan ϵsaya dalam persamaan ysaya=β0+β1x1+β2x2+ ... +ϵsaya satisify kondisi berikut:
- Semua memiliki nilai nol: E (ϵsaya) = 0 untuk semua saya,
- Tidak berkorelasi: C o v (ϵsaya,ϵj) = 0 untuk i ≠ j,
- Semua memiliki varian yang sama: C o v (ϵsaya) =σ2 untuk semua saya.
Ini dikenal sebagai kondisi Gauss-Markov dan memastikan bahwa penaksir kuadrat terkecil biasa berkinerja baik (tidak memihak, penaksir tidak bias linier terbaik ...).
Perhatikan bahwa kondisi ini dapat dipenuhi bahkan jika Anda memiliki pengamatan dari kelompok yang berbeda. Seringkali, itu tidak terjadi. Jika ada perbedaan rata-rata antara kelompok, kondisi pertama dan kedua dilanggar. Jika ada korelasi dalam kelompok, kondisi kedua dilanggar. Jika grup berbeda dalam varians, yang ketiga dilanggar.
Pelanggaran kondisi Gauss-Markov dapat menyebabkan segala macam masalah. Untuk beberapa konsekuensi dari varian yang tidak konstan, lihat halaman Wikipedia tentang heteroskedastisitas .
Transformasi dapat bermanfaat ketika kondisi ketiga tidak terpenuhi, tetapi jika grup yang berbeda menyebabkan masalah dengan kondisi satu dan dua, tampaknya lebih masuk akal untuk menambahkan variabel dummy grup atau menggunakan ANCOVA.