Ketika menghitung model regresi dengan R, saya secara teratur menggunakan fungsi relevel untuk mendapatkan model saya untuk memberi saya hasil untuk tingkat lain juga. Saya perhatikan bahwa kadang-kadang, tetapi tidak sering, ini mengubah model dalam arti bahwa tingkat faktor-faktor lain yang signifikan sebelum rilis tidak lagi. Apakah ini melekat pada rilis atau luar biasa dan mungkin karena beberapa masalah dengan data saya? Apakah ini menunjukkan bahwa data saya kemungkinan tidak memenuhi salah satu prasyarat model linier?
Terkait dengan itu, apakah boleh jika saya menggunakan relevel, menghitung ulang model saya, dan kemudian melaporkan nilai signifikansi dari kedua model dalam artikel saya? Jika signifikansi berbeda antara dua model untuk faktor tertentu, saya kira saya harus pergi dengan yang kurang optimis?
Saya kira pertanyaan saya mengkhianati bahwa saya tidak cukup tahu tentang saya untuk memahami kebutuhan akan tingkat dasar. Saya pikir saya memahaminya dengan cukup baik;) Entah bagaimana tidak ada perkenalan yang saya baca menjelaskan hal itu, atau saya terlalu bodoh untuk memahami itu. Jadi, jika seseorang dapat mengarahkan saya ke sebuah situs di mana titik memiliki level dasar dalam lm dijelaskan atau dijelaskan sendiri, itu akan menjadi hebat juga!
Sunting: Ini contoh minimal:
library(datasets)
sprays<-OrchardSprays
model<-lm(decrease~treatment+rowpos+colpos,data=sprays)
summary(model)
Bagian dari ringkasan mengatakan
treatmentC 20.625 9.731 2.120 0.03866 *
Jadi jika pengobatan == C ini memiliki pengaruh positif yang signifikan terhadap 'penurunan'. Sekarang saya merilis 'pengobatan' ke B untuk mengetahui apa yang mempengaruhi pengobatan == A:
sprays$treatment<-relevel(sprays$treatment,"B")
summary(model)
Dan sekarang perawatan == C tidak signifikan dalam model baru ini:
treatmentC 17.625 9.731 1.811 0.07567 .
Maaf karena memposting di tempat yang salah! Bisakah saya memindahkan pertanyaan saya ke stats statexchange atau haruskah saya membuka yang baru di sana?
d <- data.frame(y=runif(300),f=factor(rep(LETTERS[1:3],each=100)); lm(y~f,data=d)
akan memberi Anda permulaan, meskipun tentu saja tidak akan ada perubahan signifikan dalam kasus itu (meskipun estimasi parameter dan nilai-p pasti akan berubah ketika Anda merilis).