Saya relatif baru untuk R, dan saya mencoba menyesuaikan model dengan data yang terdiri dari kolom kategoris dan kolom numerik (integer). Variabel dependen adalah bilangan kontinu.
Data memiliki format berikut:
predCateg, predIntNum, ResponseVar
Data terlihat seperti ini:
ranking, age_in_years, wealth_indicator
category_A, 99, 1234.56
category_A, 21, 12.34
category_A, 42, 234.56
....
category_N, 105, 77.27
Bagaimana saya memodelkan ini (mungkin, menggunakan GLM), dalam R?
[[Sunting]]
Baru saja terpikir oleh saya (setelah menganalisis data lebih teliti), bahwa variabel independen kategoris sebenarnya dipesan. Karena itu saya telah memodifikasi jawaban yang diberikan sebelumnya sebagai berikut:
> fit2 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years, data=amort2)
>
> fit2
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years,
data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q ordered(ranking).C age_in_years
0.0578500 -0.0055454 -0.0013000 0.0007603 0.0036818
Degrees of Freedom: 39 Total (i.e. Null); 35 Residual
Null Deviance: 0.004924
Residual Deviance: 0.00012 AIC: -383.2
>
> fit3 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years + ordered(ranking)*age_in_years, data=amort2)
> fit3
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years +
ordered(ranking) * age_in_years, data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q
0.0578500 -0.0018932 -0.0039667
ordered(ranking).C age_in_years ordered(ranking).L:age_in_years
0.0021019 0.0036818 -0.0006640
ordered(ranking).Q:age_in_years ordered(ranking).C:age_in_years
0.0004848 -0.0002439
Degrees of Freedom: 39 Total (i.e. Null); 32 Residual
Null Deviance: 0.004924
Residual Deviance: 5.931e-05 AIC: -405.4
Saya agak bingung dengan apa ordered(ranking).C
, ordered(ranking).Q
dan ordered(ranking).L
maksud dalam output, dan akan sangat menghargai bantuan dalam memahami output ini, dan bagaimana menggunakannya untuk memprediksi variabel respon.
factor(ranking)
dan tidakas.factor(ranking)
?