Saya tertarik untuk mendapatkan estimasi tidak bias dalam regresi linier berganda.
Pada refleksi, saya dapat memikirkan dua nilai yang berbeda yang estimasi yang tidak bias dari mungkin berusaha mencocokkan.
- Dari sampel : r-square yang akan diperoleh jika persamaan regresi yang diperoleh dari sampel ) yang diterapkan untuk jumlah tak terbatas data eksternal untuk sampel tetapi dari proses menghasilkan data yang sama.
- Populasi : R-square yang akan diperoleh jika sampel tak terbatas diperoleh dan model dipasang pada sampel tak terbatas tersebut (yaitu, ) atau sebagai alternatif hanya R-square yang tersirat oleh proses pembuatan data yang diketahui.
Saya mengerti bahwa disesuaikan dirancang untuk mengkompensasi Overfitting diamati dalam sampel . Meskipun demikian, tidak jelas apakah disesuaikan R 2 sebenarnya perkiraan berisi dari R 2 , dan jika itu adalah berisi perkiraan, yang di atas dua definisi R 2 itu bertujuan untuk memperkirakan.
Jadi, pertanyaan saya:
- Berapakah estimasi yang tidak bias dari apa yang saya sebut di atas dari sampel ?
- Apa perkiraan tak bias dari apa yang saya sebut di atas populasi ?
- Apakah ada referensi yang memberikan simulasi atau bukti ketidakberpihakan lainnya?