@ cardinal telah mengirim telegram jawaban dalam komentar. Mari kita menyempurnakannya. Maksudnya adalah bahwa meskipun model linier umum (seperti yang diterapkan oleh lm
dan, dalam hal ini, glmRob
) tampaknya dimaksudkan untuk mengevaluasi hubungan antar variabel, mereka dapat menjadi alat yang kuat untuk mempelajari variabel tunggal, juga. Triknya bergantung pada fakta bahwa regresi data terhadap konstanta hanyalah cara lain untuk memperkirakan nilai rata-rata ("lokasi") .
Sebagai contoh, hasilkan beberapa data yang didistribusikan Poisson:
set.seed(17)
x <- rpois(10, lambda=2)
Dalam hal ini, R
akan menghasilkan vektor(1,5,2,3,2,2,1,1,3,1)nilai-nilai x
dari dari distribusi Poisson rata-rata2. Perkirakan lokasinya dengan glmRob
:
library(robust)
glmrob(x ~ 1, family=poisson())
Responsnya memberi tahu kami bahwa intersep diperkirakan sebesar0.7268. Tentu saja, siapa pun yang menggunakan metode statistik perlu tahu cara kerjanya: ketika Anda menggunakan model linier umum dengan keluarga Poisson, fungsi "tautan" standar adalah logaritma. Ini berarti intersep adalah logaritma dari perkiraan lokasi. Jadi kami menghitung
exp(0.7268)
Hasil, 2.0685, Nyaman dekat dengan 2: prosedur tampaknya berhasil. Untuk melihat apa yang dilakukannya, plot data:
plot(x, ylim=c(0, max(x)))
abline(exp(0.7268), 0, col="red")
Garis yang dipasang murni horizontal dan karenanya memperkirakan nilai tengah vertikal: data kami. Hanya itu yang terjadi.
Untuk memeriksa ketahanan, mari kita buat outlier yang buruk dengan menempelkan beberapa nol pada nilai pertama x
:
x[1] <- 100
Kali ini, untuk fleksibilitas yang lebih besar dalam pasca-pemrosesan, kami akan menghemat output dari glmRob
:
m <- glmrob(x ~ 1, family=poisson())
Untuk mendapatkan perkiraan rata-rata kami dapat meminta
exp(m$coefficients)
Nilai kali ini sama dengan 2.496: sedikit off, tetapi tidak terlalu jauh, mengingat bahwa nilai rata-rata x
(diperoleh sebagai mean(x)
) adalah12. Itulah arti di mana prosedur ini "kuat." Informasi lebih lanjut dapat diperoleh melalui
summary(m)
Outputnya menunjukkan kepada kita, antara lain, bahwa bobot terkait dengan nilai outlying dari 100di x[1]
adil0.02179hampir 0, menunjukkan outlier yang dicurigai.