Derajat kebebasan tidak bilangan bulat dalam sejumlah konteks. Memang dalam beberapa keadaan Anda dapat menetapkan bahwa derajat kebebasan untuk mencocokkan data untuk beberapa model tertentu harus antara beberapa nilai dan .kk + 1
Kami biasanya menganggap derajat kebebasan sebagai jumlah parameter gratis, tetapi ada situasi di mana parameter tidak sepenuhnya bebas dan mereka kemudian bisa sulit untuk dihitung. Ini bisa terjadi ketika perataan / pengatur, misalnya.
Kasus-kasus dari metode regresi / kernel tertimbang secara lokal dan splines smoothing adalah contoh dari situasi seperti itu - sejumlah parameter bebas bukanlah sesuatu yang dapat Anda hitung dengan menambahkan prediktor, sehingga diperlukan gagasan derajat kebebasan yang lebih umum.
Dalam Generalized Additive Model yang gam
sebagian didasarkan, Hastie dan Tibshirani (1990) [1] (dan memang dalam banyak referensi lain) untuk beberapa model di mana kita dapat menulis , derajat kebebasan kadang-kadang dianggap (mereka juga membahas atau ). Yang pertama konsisten dengan pendekatan yang lebih umum di mana keduanya bekerja (misalnya dalam regresi, di mana dalam situasi normal akan menjadi dimensi kolom ), tetapi ketika simetris dan idempoten, ketiganya rumusnya sama.y^= A ytr(A )tr( A AT)tr( 2 A - A AT)tr( A )XSEBUAH
[Saya tidak memiliki referensi ini berguna untuk memeriksa cukup detail; alternatif oleh penulis yang sama (ditambah Friedman) yang mudah didapat adalah Elemen Pembelajaran Statistik [2]; lihat misalnya persamaan 5.16, yang mendefinisikan derajat kebebasan efektif spline pemulusan sebagai (dalam notasi saya)]tr( A )
Lebih umum lagi, Ye (1998) [3] mendefinisikan derajat kebebasan yang digeneralisasi sebagai , yang merupakan jumlah dari kepekaan nilai yang dipasang pada pengamatan yang sesuai. Pada gilirannya, ini konsisten dengan tempat definisi itu bekerja. Untuk menggunakan definisi Ye, Anda hanya perlu dapat menghitung dan untuk mengacaukan data dengan jumlah kecil (untuk menghitung numerik). Ini membuatnya sangat luas berlaku.∑saya∂y^saya∂ysayatr( A )y^∂y^saya∂ysaya
Untuk model seperti yang dipasang oleh gam
, berbagai ukuran tersebut umumnya tidak bilangan bulat.
(Saya sangat merekomendasikan membaca diskusi referensi ini tentang masalah ini, meskipun ceritanya bisa menjadi lebih rumit dalam beberapa situasi. Lihat, misalnya [4])
[1] Hastie, T. dan Tibshirani, R. (1990),
Generalized Additive Models
London: Chapman and Hall.
[2] Hastie, T., Tibshirani, R. dan Friedman, J. (2009),
Elemen Pembelajaran Statistik: Penambangan Data, Inferensi, dan Prediksi , 2ndEd
Springer-Verlag.
https://statweb.stanford.edu/~tibs/ElemStatLearn/
[3] Ye, J. (1998),
"Tentang Mengukur dan Mengoreksi Efek Penambangan Data dan Pemilihan Model"
Jurnal Asosiasi Statistik Amerika , Vol. 93, No. 441, pp 120-131
[4] Janson, L., Fithian, W., dan Hastie, T. (2013),
"Derajat Kebebasan Efektif: Metafora yang Cacat"
https://arxiv.org/abs/1312.7851