Saya pertama kali menemukan ANOVA ketika saya menjadi mahasiswa Master di Oxford pada tahun 1978. Pendekatan modern, dengan mengajarkan variabel kontinu dan kategoris bersama-sama dalam model regresi berganda, mempersulit para ahli statistik muda untuk memahami apa yang sedang terjadi. Jadi dapat membantu untuk kembali ke masa yang lebih sederhana.
Dalam bentuk aslinya, ANOVA adalah latihan aritmatika di mana Anda memecah jumlah total kuadrat menjadi potongan-potongan yang terkait dengan perawatan, blok, interaksi, apa pun. Dalam pengaturan yang seimbang, jumlah kuadrat dengan makna intuitif (seperti SSB dan SST) menambah hingga jumlah total kuadrat yang disesuaikan. Semua ini bekerja berkat Teorema Cochran . Menggunakan Cochran, Anda dapat menghitung nilai yang diharapkan dari istilah-istilah ini di bawah hipotesis nol yang biasa, dan statistik F mengalir dari sana.
Sebagai bonus, setelah Anda mulai berpikir tentang Cochran dan jumlah kuadrat, masuk akal untuk terus mengiris dan mencelupkan jumlah pengobatan kuadrat menggunakan kontras ortogonal. Setiap entri dalam tabel ANOVA harus memiliki interpretasi yang menarik bagi ahli statistik dan menghasilkan hipotesis yang dapat diuji.
Baru-baru ini saya menulis jawaban di mana perbedaan antara metode MOM dan ML muncul. Pertanyaan itu muncul pada estimasi model efek acak. Pada titik ini, pendekatan ANOVA tradisional benar-benar memisahkan perusahaan dengan estimasi kemungkinan maksimum, dan perkiraan dampaknya tidak lagi sama. Ketika desain tidak seimbang, Anda tidak mendapatkan statistik F yang sama juga.
σ2pσ2σ2+nσ2pnσ2b^. ANOVA menghasilkan metode estimator momen untuk varians efek acak. Sekarang, kita cenderung menyelesaikan masalah seperti itu dengan model efek campuran dan komponen varians diperoleh melalui estimasi kemungkinan maksimum atau REML.
ANOVA bukan merupakan metode prosedur momen. Ini berubah dengan memecah jumlah kuadrat (atau lebih umum, bentuk kuadrat dari respons) menjadi komponen yang menghasilkan hipotesis yang bermakna. Ini sangat tergantung pada normalitas karena kami ingin jumlah kuadrat untuk memiliki distribusi chi-kuadrat untuk tes F untuk bekerja.
Kerangka kerja kemungkinan maksimum lebih umum dan berlaku untuk situasi seperti model linier umum di mana jumlah kuadrat tidak berlaku. Beberapa perangkat lunak (seperti R) mengundang kebingungan dengan menentukan metode anova untuk uji rasio kemungkinan dengan distribusi chi-squared asimptotik. Orang dapat membenarkan penggunaan istilah "anova", tetapi secara tegas, teori di baliknya berbeda.