Mengapa melaporkan R kuadrat?


8

Jika R kuadrat yang disesuaikan lebih baik daripada R kuadrat, lalu mengapa perangkat lunak statistik terus melaporkan yang terakhir? Apakah ada situasi ketika peneliti lebih suka menggunakan R kuadrat daripada R kuadrat yang disesuaikan?


Jenis regresi apa yang Anda hadapi? Jika saya tidak salah, untuk regresi linier, tidak ada perbedaan antara R-squared dan R-squared yang disesuaikan. Jadi dalam hal ini sangat tepat untuk menggunakan nilai R-kuadrat polos.
alesc

Yang linear. Tetapi paket statistik menyediakan kedua langkah tersebut. Itu sebabnya saya bertanya-tanya mengapa.
Mike Senin

Menurut Wiki , persamaannya sedikit berbeda bahkan untuk regresi linier ( p=1). Tetapi seluruh titik penyesuaian R-squared adalah " Penggunaan R2 yang disesuaikan adalah upaya untuk memperhitungkan fenomena R2 secara otomatis dan palsu meningkat ketika variabel penjelas tambahan ditambahkan ke model. ". Regresi linier tidak memiliki variabel penjelas tambahan, karena merupakan jenis regresi yang paling primitif.
alesc

@alesc, saya tahu itu. Apa yang saya tidak tahu adalah mengapa melaporkan kedua nilai.
Mike Senin

Apa yang Anda coba buktikan dengan nilai R-squared Anda? Apakah Anda membandingkan model regresi yang berbeda? Jika Anda membandingkan model regresi linier dan non-linear, maka masuk akal untuk menggunakan R-squared yang disesuaikan, jika tidak, R-square polos akan cukup. Tetapi sekali lagi, Anda juga dapat menggunakan R-squared yang disesuaikan bahkan untuk regresi linier :) Saya pribadi tidak akan melaporkan kedua nilai. Jadi pilih satu metrik dan laporkan hanya nilai itu (baik R-square atau R-square yang disesuaikan).
alesc

Jawaban:


5

Dalam kondisi misalnya dijelaskan di sini ,R2mengukur proporsi varian dalam variabel dependen yang dijelaskan oleh regresi, yang merupakan ukuran alami. DisesuaikanR2 tidak memiliki interpretasi ini, karena memodifikasi R2 nilai.

Jadi sambil disesuaikan R2 memiliki keuntungan yang tidak terbantahkan yaitu tidak bertambah secara otomatis ketika jumlah regresi naik, Anda membayar harga dalam hal bagaimana Anda dapat menginterpretasikan ukuran tersebut.

Catatan Saya tidak menganjurkan penggunaan satu atau yang lain, hanya memberikan kemungkinan alasan mengapa orang masih menggunakan standar R2.


Pertanyaan cepat: apakah mungkin itu benar Radj.2 adalah penduga yang konsisten dari populasi R2dalam beberapa kondisi, misalnya model yang ditentukan dengan baik? Maka masuk akal untuk melaporkanRadj.2 di tempat R2.
Richard Hardy

3
Ya, tapi seperti yang bisa kita tulis Radj.2=1n1nK+n1nKR2 dan, tentu saja, n1nK1 (setidaknya ketika, seperti yang diasumsikan kebanyakan, K tetap tetap sebagai n), kita memilikinya Radj.2R2=op(1), sehingga sepertinya tidak menjadi alasan untuk lebih menyukai yang satu daripada yang lain.
Christoph Hanck

Ktentu saja jumlah regresi
Christoph Hanck

1
Baiklah ... apakah kita mendefinisikan populasi R2 sebagai 1σ2/Var(y)? Jika demikian, tulislahRadj.2=1s2i(yy¯)2/(n1) (s2 estimasi varians yang disesuaikan-df dibagi dengan nK) menunjukkan bahwa kedua penaksir varians kesalahan dalam pembilang dan varians dari y dalam penyebut tidak bias untuk parameter populasi masing-masing, E(s2)=σ2 dan E[i(yy¯)2/(n1)]=Var(y). Tapi itu tidak membuat rasio sebagai penaksir yang tidak bias dari rasio parameter, karena operator ekspektasi tidak melewati fungsi nonlinier secara umum.
Christoph Hanck

1
Terima kasih. Mungkin saya seharusnya memposting komentar saya sebagai pertanyaan terpisah, maka saya bisa mengangkat jawaban Anda. Karena saya menduga hal serupa telah ditanyakan, saya hanya berharap untuk konfirmasi pendek / disconfirmation, gaya komentar. Anda lebih eksplisit dari itu, saya menghargainya!
Richard Hardy

1

Adjusted R-squared berguna untuk membandingkan model regresi yang berbeda. Tugas ini tidak dapat diselesaikan oleh R-kuadrat yang, seperti yang telah dikatakan orang lain, memiliki tujuan informatif lain, yaitu mengekspresikan proporsi varian dari variabel dependen yang dijelaskan oleh model regresi yang sedang diselidiki.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.