Uji Wald dalam regresi (OLS dan GLM): t-vs z-distribusi


22

Saya mengerti bahwa uji Wald untuk koefisien regresi didasarkan pada properti berikut yang berlaku secara asimptotik (mis. Wasserman (2006): Semua Statistik , halaman 153, 214-215): Di mana menunjukkan estimasi koefisien regresi, menunjukkan kesalahan standar dari koefisien regresi dan adalah nilai bunga ( biasanya 0 untuk menguji apakah koefisien tersebut adalah berbeda secara signifikan dari 0). Jadi ukuran Wald test adalah: tolak saatβ^se(β)β0β0αH0| W| >zα/2

(β^β0)se^(β^)N(0,1)
β^se^(β^)β0β0αH0|W|>zα/2 mana
W=β^se^(β^).

Tetapi ketika Anda melakukan regresi linier dengan lmdalam R, nilai- bukan nilai- digunakan untuk menguji apakah koefisien regresi berbeda secara signifikan dari 0 (dengan ). Selain itu, output dalam R terkadang memberikan - dan terkadang nilai sebagai statistik uji. Rupanya, -values ​​digunakan ketika parameter dispersi diasumsikan diketahui dan -values ​​digunakan ketika parameter dispersi diperkirakan (lihat tautan ini ).z z t z ttzsummary.lmglmztzt

Bisakah seseorang menjelaskan, mengapa distribusi- kadang-kadang digunakan untuk uji Wald meskipun rasio koefisien dan kesalahan standarnya diasumsikan didistribusikan sebagai standar normal?t

Edit setelah pertanyaan dijawab

Posting ini juga memberikan informasi yang berguna untuk pertanyaan itu.


2
Apa yang membuat Anda berpikir bahwa statistik uji yang dilaporkan adalah tes Wald?
Glen_b -Reinstate Monica

3
Karena - atau nilai selalu koefisien dibagi dengan kesalahan standar dalam dan . tztlmglm
COOLSerdash

Jawaban:


20

Output dari glmmenggunakan distribusi Poisson memberikan nilai- karena dengan distribusi Poisson, parameter rata-rata dan variansnya sama. Dalam model Poisson, Anda hanya perlu memperkirakan satu parameter ( λ ). Di tempat Anda harus memperkirakan parameter rata-rata dan dispersi, Anda harus melihat distribusi- t yang digunakan.zλglmt

Untuk regresi linier standar, Anda menganggap istilah kesalahan didistribusikan secara normal. Di sini, parameter varians harus diperkirakan - maka penggunaan distribusi untuk statistik uji. Jika Anda entah bagaimana tahu varians populasi untuk istilah kesalahan, Anda bisa menggunakan statistik z -test.tz

Seperti yang Anda sebutkan di pos Anda, distribusi tes normal asimptotik. The -Distribusi adalah asimtotik normal, sehingga dalam sampel yang besar, perbedaan akan diabaikan.t


3

Dalam rangka GLM, secara umum, W uji statistik yang Anda sebutkan adalah asimtotik normal didistribusikan, itu sebabnya Anda lihat dalam R z nilai-nilai.

Selain itu, ketika berhadapan dengan model linear, yaitu GLM dengan variabel respon didistribusikan Normal, distribusi statistik uji adalah sebuah t Student , sehingga dalam R Anda memiliki t nilai-nilai.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.