Saya baru saja mendapat salinan The Elements of Statistics Learning oleh Hastie, Tibshirani, dan Friedman. Dalam bab 2 (Ikhtisar Pembelajaran yang Dibimbing) bagian 4 (Teori Keputusan Statistik), ia memberikan derivasi dari fungsi regresi.
Misalkan menunjukkan vektor input acak bernilai nyata, dan variabel output acak bernilai nyata, dengan distribusi gabungan . Kami mencari fungsi untuk memprediksi nilai yang diberikan dari input . Teori ini membutuhkan fungsi kerugian untuk menghukum kesalahan dalam prediksi, dan sejauh ini yang paling umum dan nyaman adalah hilangnya kesalahan kuadrat: . Ini membawa kita ke kriteria untuk memilih ,
yang diharapkan (kuadrat) kesalahan prediksi.
Saya benar-benar memahami pengaturan dan motivasi. Kebingungan pertama saya adalah: apakah maksudnya atau ? Kedua, saya belum pernah melihat notasi . Bisakah seseorang yang telah menjelaskan artinya kepada saya? Apakah hanya itu ? Sayangnya kebingungan saya tidak berakhir di sana,
Dengan mengkondisikan , kita dapat menulis sebagai
Saya kehilangan koneksi antara dua langkah ini, dan saya tidak terbiasa dengan definisi teknis "pengkondisian". Beritahu saya jika saya bisa mengklarifikasi apa saja! Saya pikir sebagian besar kebingungan saya muncul dari notasi asing; Saya yakin bahwa, jika seseorang dapat memecah derivasi ini menjadi bahasa Inggris biasa, saya akan mendapatkannya. Terima kasih stats.SE!