Ada beberapa aturan penilaian yang tepat dan sangat tepat untuk menghitung data yang dapat Anda gunakan. Aturan penilaian adalah penalti diperkenalkan dengan sebagai distribusi prediktif dan nilai yang diamati. Mereka memiliki sejumlah properti yang diinginkan, pertama dan terutama bahwa perkiraan yang lebih dekat dengan probabilitas sebenarnya akan selalu menerima lebih sedikit penalti dan ada ramalan terbaik (unik) dan itulah ketika probabilitas yang diprediksi bertepatan dengan probabilitas yang sebenarnya. Dengan demikian meminimalkan ekspektasi berarti melaporkan probabilitas sebenarnya. Lihat juga Wikipedia .P y s ( y , P )s ( y, P)Pys ( y, P)
Seringkali seseorang mengambil rata-rata dari semua nilai prediksi sebagai
S= 1n∑ni = 1s ( y( i ), P( i ))
Aturan mana yang harus diambil tergantung pada tujuan Anda, tetapi saya akan memberikan karakterisasi kasar ketika masing-masing bagus untuk digunakan.
Dalam apa yang berikut saya menggunakan untuk fungsi massa probabilitas prediktif dan fungsi distribusi kumulatif prediktif. A menjalankan seluruh dukungan dari distribusi jumlah (yaitu, ). menunjukkan fungsi indikator. dan adalah mean dan standar deviasi dari distribusi prediktif (yang biasanya secara langsung diestimasi jumlah dalam model data hitung). Pr ( Y = y ) F ( y ) ∑ k 0 , 1 , … , ∞ I μ σf( y)Pr ( Y= y)F( y)∑k0 , 1 , ... , ∞sayaμσ
Aturan pemberian skor yang benar-benar tepat
- Skor Brier : (stabil untuk ketidakseimbangan ukuran dalam prediktor kategoris)s ( y, P) = - 2 f( y) + ∑kf2( k )
- Skor Dawid-Sebastiani : (baik untuk pilihan model prediksi umum; stabil untuk ketidakseimbangan ukuran dalam prediktor kategoris)s ( y, P) = ( y- μσ)2+ 2 logσ
- Skor penyimpangan : ( adalah istilah normalisasi yang hanya bergantung pada , dalam model Poisson biasanya dianggap sebagai penyimpangan jenuh; baik untuk digunakan dengan perkiraan dari kerangka kerja ML)g y ys ( y, P) = - 2 logf( y) + gygyy
- Skor logaritmik : (sangat mudah dihitung; stabil untuk ketidakseimbangan ukuran dalam prediktor kategoris)s ( y, P) = - logf( y)
- Skor probabilitas peringkat : (baik untuk membedakan berbagai prediksi dari jumlah yang sangat tinggi; rentan terhadap ketidakseimbangan ukuran dalam prediktor kategoris)s ( y, P) = ∑k{ F( k ) - I( y≤ k ) }2
- Skor bola : (stabil untuk ketidakseimbangan ukuran dalam prediktor kategori)s ( y, P) = f( y)∑kf2( k )√
Aturan penilaian lainnya (tidak terlalu tepat tetapi sering digunakan)
- Skor kesalahan absolut :(tidak tepat)s ( y, P) = | y- μ |
- Skor kesalahan kuadrat : (tidak sepenuhnya tepat; rentan terhadap outlier; rentan terhadap ketidakseimbangan ukuran dalam prediktor kategoris)s ( y, P) = ( y- μ )2
- Skor kesalahan kuadrat dinormalisasi Pearson : (tidak sepenuhnya tepat; rentan terhadap pencilan; dapat digunakan untuk memeriksa jika model memeriksa apakah skor rata-rata sangat berbeda dari 1; stabil untuk ketidakseimbangan ukuran dalam prediksi kategori)s ( y, P) = ( y- μσ)2
Contoh kode R untuk aturan yang benar-benar tepat:
library(vcdExtra)
m1 <- glm(Freq ~ mental, family=poisson, data=Mental)
# scores for the first observation
mu <- predict(m1, type="response")[1]
x <- Mental$Freq[1]
# logarithmic (equivalent to deviance score up to a constant)
-log(dpois(x, lambda=mu))
# quadratic (brier)
-2*dpois(x,lambda=mu) + sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) })
# spherical
- dpois(x,mu) / sqrt(sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) }))
# ranked probability score
sum(ppois((-1):(x-1), mu)^2) + sum((ppois(x:10000,mu)-1)^2)
# Dawid Sebastiani
(x-mu)^2/mu + log(mu)