Hanya untuk memperkuat - saya adalah pemohon terbaru, saya percaya.
Dalam komentar spesifik tentang poin Mike:
Jelas benar bahwa perbedaan I / II / III hanya berlaku dengan prediktor berkorelasi (di mana desain yang tidak seimbang adalah contoh paling umum, tentu saja dalam ANOVA faktorial) - tetapi bagi saya ini tampaknya merupakan argumen yang menolak analisis situasi yang tidak seimbang. (dan karenanya setiap debat Tipe I / II / III). Ini mungkin tidak sempurna, tetapi itulah yang terjadi (dan dalam banyak konteks, biaya pengumpulan data lebih besar daripada masalah statistik, meskipun peringatan).
Ini benar-benar adil dan mewakili daging sebagian besar argumen "II lawan III, mendukung II" yang saya temui. Ringkasan terbaik yang saya temui adalah Langsrud (2003) "ANOVA untuk data yang tidak seimbang: Gunakan Tipe II sebagai ganti jumlah kuadrat Tipe III", Statistik dan Komputasi 13: 163-167 (Saya memiliki PDF jika dokumen asli sulit ditemukan ). Dia berpendapat (mengambil kasus dua faktor sebagai contoh dasar) bahwa jika ada interaksi, ada interaksi, jadi pertimbangan efek utama biasanya tidak berarti (titik yang jelas adil) - dan jika tidak ada interaksi, analisis Tipe II dari efek utama lebih kuat daripada Tipe III (tidak diragukan lagi), jadi Anda harus selalu menggunakan Tipe II. Saya telah melihat argumen lain (misalnya Venables,
Dan saya setuju dengan ini: jika Anda memiliki interaksi tetapi memiliki beberapa pertanyaan tentang efek utama juga, maka Anda mungkin ke wilayah do-it-yourself.
Jelas ada orang-orang yang hanya ingin Tipe III karena SPSS melakukannya, atau referensi lain untuk otoritas yang lebih tinggi secara statistik. Saya tidak sepenuhnya menentang pandangan ini, jika menyangkut pilihan banyak orang yang bertahan dengan SPSS (yang saya hadapi beberapa hal, yaitu waktu, uang, dan kondisi kadaluwarsa lisensi) dan Tipe III SS, atau banyak orang yang beralih ke R dan Tipe III SS. Namun, argumen ini jelas lemah secara statistik.
Namun, argumen yang saya temukan lebih substansial dalam mendukung Tipe III adalah yang dibuat secara independen oleh Myers & Well (2003, "Desain Penelitian dan Analisis Statistik", hal. 323, 626-629) dan Maxwell & Delaney (2004, " Merancang Eksperimen dan Menganalisis Data: Perspektif Perbandingan Model ", hlm. 324-328, 332-335). Itu adalah sebagai berikut:
- jika ada interaksi, semua metode memberikan hasil yang sama untuk jumlah interaksi kuadrat
- Tipe II mengasumsikan bahwa tidak ada interaksi untuk pengujian efek utamanya; tipe III tidak
- Beberapa (misalnya Langsrud) berpendapat bahwa jika interaksi tidak signifikan, maka Anda dibenarkan dengan asumsi bahwa tidak ada, dan melihat efek utama Tipe II yang lebih kuat.
- Tetapi jika tes interaksi kurang bertenaga, namun ada interaksi, interaksi mungkin keluar "tidak signifikan" namun masih mengarah pada pelanggaran asumsi uji efek utama Tipe II, yang bias tes tersebut menjadi terlalu liberal .
- Myers & Well mengutip Appelbaum / Cramer sebagai pendukung utama pendekatan Tipe II, dan lanjutkan [p323]: "... Kriteria yang lebih konservatif untuk tidak signifikannya interaksi dapat digunakan, seperti mensyaratkan bahwa interaksi tidak signifikan pada tingkat 0,25, tetapi ada pemahaman yang tidak memadai tentang konsekuensi dari bahkan pendekatan ini.Sebagai aturan umum, jumlah Tipe II dari sqaures tidak boleh dihitung kecuali ada alasan apriori yang kuat untuk menganggap tidak ada efek interaksi, dan interaksi yang jelas tidak signifikan jumlah kotak. " Mereka mengutip [p629] Secara keseluruhan, Lee & Hornick 1981 sebagai demonstrasi bahwa interaksi yang tidak mendekati signifikansi dapat membiaskan pengujian efek utama. Maxwell & Delaney [p334] menganjurkan pendekatan Tipe II jika interaksi populasi adalah nol, untuk kekuasaan, dan pendekatan Tipe III jika tidak [untuk interpretabilitas cara yang berasal dari pendekatan ini]. Mereka juga menganjurkan penggunaan Tipe III dalam situasi kehidupan nyata (ketika Anda membuat kesimpulan tentang keberadaan interaksi dari data) karena masalah membuat kesalahan tipe 2 [kurang bertenaga] dalam tes interaksi dan dengan demikian secara tidak sengaja melanggar asumsi pendekatan Tipe II SS; mereka kemudian membuat poin lebih lanjut yang serupa dengan Myers & Well, dan perhatikan debat panjang tentang masalah ini! membuat kesimpulan tentang adanya interaksi dari data) karena masalah membuat kesalahan tipe 2 [kurang bertenaga] dalam tes interaksi dan dengan demikian secara tidak sengaja melanggar asumsi pendekatan SS Tipe II; mereka kemudian membuat poin lebih lanjut yang serupa dengan Myers & Well, dan perhatikan debat panjang tentang masalah ini! membuat kesimpulan tentang adanya interaksi dari data) karena masalah membuat kesalahan tipe 2 [kurang bertenaga] dalam tes interaksi dan dengan demikian secara tidak sengaja melanggar asumsi pendekatan SS Tipe II; mereka kemudian membuat poin lebih lanjut yang serupa dengan Myers & Well, dan perhatikan debat panjang tentang masalah ini!
Jadi interpretasi saya (dan saya bukan ahli!) Adalah bahwa ada banyak Otoritas Statistik Tinggi di kedua sisi argumen; bahwa argumen yang biasa diajukan bukan tentang situasi biasa yang akan menimbulkan masalah (situasi itu menjadi yang biasa menafsirkan efek utama dengan interaksi yang tidak signifikan); dan bahwa ada alasan-alasan yang wajar untuk khawatir tentang pendekatan Tipe II dalam situasi itu (dan itu mengarah pada kekuatan versus potensi over-liberalisme).
Bagi saya, itu sudah cukup untuk mengharapkan opsi Tipe III di ezANOVA, dan juga Tipe II, karena (untuk uang saya) itu adalah antarmuka yang luar biasa untuk sistem ANOVA R. R adalah beberapa cara dari menjadi mudah digunakan untuk pemula, dalam pandangan saya, dan paket "ez", dengan ezANOVA dan fungsi merencanakan efek yang agak indah, berjalan jauh menuju membuat R dapat diakses oleh khalayak penelitian yang lebih umum. Beberapa pemikiran saya sedang dalam proses (dan hack jahat untuk ezANOVA) ada di http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Akan tertarik mendengar pikiran semua orang!