Logika di balik ANOVA F-test dalam regresi linier sederhana

Saya mencoba memahami logika di balik ANOVA F-test dalam Analisis Regresi Linier Sederhana. Pertanyaan yang saya miliki adalah seperti berikut. Ketika nilai F, yaitu MSR/MSEbesar, kami menerima model sebagai signifikan. Apa logika di balik ini?

regression anova

— Tidak tahu
sumber

@ Can'tTell Anda dapat menemukan bantuan tentang pemformatan di sini: stats.stackexchange.com/editing-help

Dalam kasus paling sederhana, ketika Anda hanya memiliki satu prediktor (regresi sederhana), katakanlah , -test memberi tahu Anda apakah termasuk menjelaskan sebagian besar varian yang diamati dalam dibandingkan dengan model nol (intersep saja). Idenya adalah untuk menguji apakah varians yang dijelaskan ditambahkan (total varians, TSS, minus varians residual, RSS) cukup besar untuk dianggap sebagai "kuantitas signifikan". Kami di sini membandingkan model dengan satu prediktor, atau variabel penjelas, dengan baseline yang hanya "noise" (tidak ada kecuali grand mean). $X_1$ $F$ $X_1$ $Y$

Demikian juga, Anda dapat menghitung statistik dalam pengaturan regresi berganda: Dalam kasus ini, ini merupakan tes semua prediktor yang termasuk dalam model, yang di bawah kerangka kerja HT berarti bahwa kami bertanya-tanya apakah ada di antara mereka yang berguna dalam memprediksi respons. variabel. Ini adalah alasan mengapa Anda mungkin menghadapi situasi di mana uji untuk seluruh model adalah signifikan sedangkan beberapa uji atau terkait dengan masing-masing koefisien regresi tidak. $F$ $F$ $t$ $z$

The statistik terlihat seperti $F$

F = \frac{(TSS - RSS) / (p - 1)}{RSS / (n - p)},

$F = \frac{(\text{TSS}-\text{RSS})/(p-1)}{\text{RSS}/(n-p)},$

di mana adalah jumlah parameter model dan jumlah pengamatan. Kuantitas ini harus dirujuk ke distribusi untuk nilai kritis atau . Ini berlaku untuk model regresi sederhana juga, dan jelas memiliki analogi dengan kerangka kerja ANOVA klasik. $p$ $n$ $F_{p-1,n-p}$ $p$

Sidenote. Ketika Anda memiliki lebih dari satu prediktor, maka Anda mungkin bertanya-tanya apakah mempertimbangkan hanya sebagian dari prediktor tersebut "mengurangi" kualitas kecocokan model. Ini sesuai dengan situasi di mana kami mempertimbangkan model bersarang . Ini persis situasi yang sama dengan yang di atas, di mana kami membandingkan model regresi yang diberikan dengan model nol (tidak termasuk prediktor). Untuk menilai pengurangan varian yang dijelaskan, kita dapat membandingkan jumlah residu kuadrat (RSS) dari kedua model (yaitu, apa yang dibiarkan tidak dijelaskan setelah Anda memperhitungkan efek dari prediktor yang ada dalam model). Biarkan dan menunjukkan model dasar (dengan $\mathcal{M}_0$ $\mathcal{M}_1$ $p$ parameter) dan model dengan prediktor tambahan ( parameter ), maka jika adalah kecil, kami akan mempertimbangkan bahwa model yang lebih kecil memiliki performa yang sama baiknya dengan yang lebih besar. Statistik yang baik untuk digunakan adalah perbandingan SS, , diberi bobot berdasarkan derajat kebebasannya ( untuk pembilang, dan untuk penyebut). Seperti yang telah dikatakan, dapat ditunjukkan bahwa jumlah ini mengikuti distribusi (atau Fisher-Snedecor) dengan derajat kebebasan dan . Jika diamati $q=p+1$ $\text{RSS}_{\mathcal{M}_1}-\text{RSS}_{\mathcal{M}_0}$ $(\text{RSS}_{\mathcal{M}_1}-\text{RSS}_{\mathcal{M}_0})/\text{RSS}_{\mathcal{M}_0}$ $p-q$ $n-p$ $F$ $p-q$ $n-p$ $F$ lebih besar dari quantile yang bersesuaian pada diberikan (biasanya, ), maka kita akan menyimpulkan bahwa model yang lebih besar membuat "pekerjaan yang lebih baik". (Ini sama sekali tidak menyiratkan bahwa model itu benar, dari sudut pandang praktis!) $F$ $\alpha$ $\alpha=0.05$

Generalisasi dari ide di atas adalah uji rasio kemungkinan .

Jika Anda menggunakan R, Anda dapat bermain dengan konsep di atas seperti ini:

df <- transform(X <- as.data.frame(replicate(2, rnorm(100))), 
                                   y = V1+V2+rnorm(100))
## simple regression
anova(lm(y ~ V1, df))         # "ANOVA view"
summary(lm(y ~ V1, df))       # "Regression view"
## multiple regression
summary(lm0 <- lm(y ~ ., df))
lm1 <- update(lm0, . ~ . -V2) # reduced model
anova(lm1, lm0)               # test of V2

— chl
sumber

@ chl - Pertama-tama, jawaban yang bagus! Ini mungkin menjamin pertanyaan itu sendiri, jadi beri tahu saya ... tetapi uraian yang saya baca tentang tabel ANOVA untuk model regresi biasanya merujuk pada tiga baris dalam tabel: prediktor, kesalahan, dan total. Namun, anova()fungsi dalam R mengembalikan baris individual untuk setiap prediktor dalam model. Misalnya, anova(lm0)di atas mengembalikan baris untuk V1, V2dan Residuals(dan tidak ada total). Dengan demikian, kami mendapatkan dua statistik F * untuk model ini. Bagaimana ini mengubah interpretasi statistik F * yang dilaporkan dalam tabel ANOVA?

— Chase

@Chase Ya, Tabel ANOVA yang ada dalam pikiran saya diatur dengan cara ini juga. Jangan ragu untuk bertanya; Saya ingin mendengar pendapat pengguna lain tentang itu. Saya biasanya menggunakan anova()perbandingan GLM. Ketika diterapkan pada objek lmatau aov, itu menampilkan efek terpisah (SS) untuk setiap istilah dalam model dan tidak menunjukkan TSS. (Dulu saya menerapkan ini sebaliknya, yaitu setelah pas dengan ANOVA aov(), saya bisa gunakan summary.lm()untuk mendapatkan ide tentang kontras pengobatan.) Namun, ada masalah halus antara summary.lm()dan summary.aov(), terutama terkait dengan pemasangan berurutan.

— chl

@Chase Saya baru saja menemukan kembali respons yang sangat bagus dari @Gavin tentang hasil Interpretasi dari lm () .

— chl

@ chl - Sedikit nitpicking dari saya. Ini adalah jawaban yang bagus tentang intuisi di balik uji-F, dan bagaimana "menuju ke arah yang benar". Tapi itu tidak menjelaskan logika mengapa Anda harus memilih tes khusus ini. Misalnya, mengapa kita tidak menggunakan statistik PRESS? Anda mengisyaratkan rasio kemungkinan - yang memang memiliki justifikasi logis - maka penerapannya untuk semua model, tidak seperti F-test.

— probabilityislogic

@probabilityislogic Poin bagus. Ide saya awalnya untuk menunjukkan logika di balik perbandingan model, di mana model regresi sederhana hanya kasus tertentu (dibandingkan dengan model "sangat nol"), yang juga memotivasi catatan cepat tentang LRT. Saya setuju dengan Anda, jika kami bekerja di sepanjang garis pendekatan Neyman-Pearson murni untuk HT. Namun, saya terutama berpikir dalam hal Teori LMs, di mana SS memiliki interpretasi geometris langsung dan di mana perbandingan model atau uji-F tunggal untuk ANOVA satu arah (...)

— chl