Dalam R, saya memiliki sampel 348 tindakan, dan ingin tahu apakah saya dapat berasumsi bahwa itu didistribusikan secara normal untuk tes di masa mendatang.
Pada dasarnya mengikuti jawaban Stack lain , saya melihat plot kepadatan dan plot QQ dengan:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
Saya tidak memiliki pengalaman yang kuat dalam Statistik, tetapi mereka terlihat seperti contoh distribusi normal yang saya lihat.
Lalu saya menjalankan tes Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
Jika saya menafsirkannya dengan benar, itu memberitahu saya aman untuk menolak hipotesis nol, yaitu bahwa distribusinya normal.
Namun, saya telah menemui dua posting Stack (di sini , dan di sini ), yang sangat merusak kegunaan tes ini. Sepertinya jika sampelnya besar (apakah 348 dianggap besar?), Akan selalu dikatakan bahwa distribusinya tidak normal.
Bagaimana saya harus menafsirkan semua itu? Haruskah saya tetap dengan plot QQ dan menganggap distribusi saya normal?