Saya telah menemukan kemungkinan definisi yang bertentangan untuk statistik validasi silang (CV) dan untuk statistik validasi silang umum (GCV) yang terkait dengan model linier (dengan vektor kesalahan homoseksual yang normal ).
Di satu sisi, Golub, Heath & Wahba mendefinisikan estimasi GCV sebagai (hlm. 216)
minimizer dari diberikan oleh
mana
Di sisi lain, Efron mendefinisikan konsep yang sama dengan (hal. 24), namun ia menghubungkan pengenalan konsep ini dengan Craven & Wahba, di mana definisinya (hal. 377) pada dasarnya sama. seperti definisi Golub, Heath & Wahba yang disebutkan di atas.
Apakah ini berarti meminimalkan ?
Demikian pula, Golub, Heath & Wahba mendefinisikan estimasi CV (p. 217) sebagai minimizer dari
di mana adalah taksiran
dari dengan titik data k y_i dihilangkan.
Penulis menghubungkan pengenalan estimasi CV (juga disebut estimasi PRESS) ke Allen ("PRESS Allen", ibid.) Namun dalam makalah Allen, estimasi PRESS didefinisikan (hlm. 126) sebagai (dalam artikel Efron didefinisikan sebagai (hlm. 24)).
Sekali lagi, apakah ini berarti meminimalkan ?
Allen, David M. Hubungan Antara Seleksi Variabel dan Agumentasi Data dan Metode untuk Prediksi. Technometrics, Vol. 16, No. 1 (Februari, 1974), hlm. 125-127
Craven, Peter dan Wahba, Grace. Menghaluskan Data Bising dengan Fungsi Spline. Numerische Mathematik 31, (1979), hlm. 377-403
Efron, Bradley. Seberapa Bias Apakah Tingkat Kesalahan yang Jelas dari Regresi Logistik? Laporan teknis no. 232. Departemen Statistik, Universitas Stanford (April 1985)
Golub, Gene H., Heath dan Grace Wahba. Validasi Lintas Umum sebagai Metode untuk Memilih Parameter Ridge yang Baik. Technometrics, Vol. 21, No. 2 (Mei, 1979), hlm. 215-223