Nilai yang diharapkan dari


12

Saya ingin tahu tentang pernyataan yang dibuat di bagian bawah halaman pertama dalam teks ini mengenai penyesuaianRadjusted2

Radjusted2=1(1R2)(n1nm1).

Teks menyatakan:

Logika penyesuaian adalah sebagai berikut: dalam regresi berganda biasa, prediktor acak menjelaskan rata-rata proporsi dari variasi respons, sehingga m prediktor acak menjelaskan bersama, rata-rata, m / (n - 1) variasi tanggapan; dengan kata lain, nilai yang diharapkan dari R ^ 2 adalah \ mathbb {E} (R ^ 2) = m / (n - 1) . Menerapkan rumus [ R ^ 2_ \ mathrm {adjusted} ] ke nilai itu, di mana semua prediktor acak, memberikan R ^ 2_ \ mathrm {adjusted} = 0. "m m / ( n - 1 ) R 2 E ( R 2 ) = m / ( n - 1 ) R 2 a d j u s t e d R 2 a d j u s t e d = 01/(n1)mm/(n1)R2E(R2)=m/(n1)Radjusted2Radjusted2=0

Ini tampaknya menjadi motivasi yang sangat sederhana dan dapat ditafsirkan untuk Radjusted2 . Namun, saya belum dapat menemukan bahwa E(R2)=1/(n1) untuk prediktor acak tunggal (yaitu tidak berkorelasi).

Bisakah seseorang mengarahkan saya ke arah yang benar di sini?


Jika tautannya mati di masa mendatang, dapatkah Anda memberikan referensi lengkap? Terima kasih.
Richard Hardy

Jawaban:


10

Ini adalah statistik matematika yang akurat. Lihat posting ini untuk derivasi dari distribusi bawah hipotesis bahwa semua regressor (batalkan istilah konstan) tidak berkorelasi dengan variabel dependen ("prediktor acak").R2

Distribusi ini Beta, dengan adalah jumlah prediktor tanpa menghitung jangka konstan, dan ukuran sampel,nmn

R2Beta(m2,nm12)

dan sebagainya

E(R2)=m/2(m/2)+[(nm1)/2]=mn1

Ini tampaknya menjadi cara yang pintar untuk "membenarkan" logika di balik disesuaikan : jika memang semua regresi tidak berkorelasi, maka disesuaikan adalah "rata-rata" nol.R 2R2R2


2
Hanya sedikit informasi yang saya butuhkan! Terima kasih! Dan pertukaran Stack hidup lama!
gregory_britten

1
Saya akan tertarik pada kasus di mana tidak semua regressor tidak berkorelasi dengan variabel dependen. Apakah Anda punya referensi tentang ini?
Olivier

@ Olivier Tidak, saya rasa tidak. Lihat di bawah "F-test untuk signifikansi regresi, distribusi di bawah alternatif", atau sesuatu seperti itu.
Alecos Papadopoulos
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.