Saya punya pertanyaan tentang bagaimana seorang ahli statistik biasanya menafsirkan output anova. Katakanlah saya memiliki output anova dari R.
> summary(fitted_data)
Call:
lm(formula = V1 ~ V2)
Residuals:
Min 1Q Median 3Q Max
-2.74004 -0.33827 0.04062 0.44064 1.22737
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.11405 0.32089 6.588 1.3e-09 ***
V2 0.03883 0.01277 3.040 0.00292 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6231 on 118 degrees of freedom
Multiple R-squared: 0.07262, Adjusted R-squared: 0.06476
F-statistic: 9.24 on 1 and 118 DF, p-value: 0.002917
> anova(fit)
Analysis of Variance Table
Response: V1
Df Sum Sq Mean Sq F value Pr(>F)
V2 1 3.588 3.5878 9.2402 0.002917 **
Residuals 118 45.818 0.3883
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Dari penjelasan di atas, saya kira nilai paling penting adalah Pr (> F), bukan? Jadi Pr ini, kurang dari 0,05 (tingkat 95%). Bagaimana seharusnya saya "menjelaskan" ini? Apakah saya menjelaskannya dalam "asosiasi", yaitu, V2 dan V1 terkait (atau tidak)? atau dalam hal "signifikansi"? Saya selalu merasa bahwa saya tidak dapat mengerti ketika orang mengatakan "Nilai ini penting ....". Jadi apa yang "signifikan"? Apakah ada bentuk penjelasan yang lebih intuitif? seperti "Saya 95% yakin bahwa ....".
Juga, apakah nilai Pr satu-satunya informasi penting? atau dapatkah saya juga melihat residu dan sisa output untuk "menjelaskan" hasilnya? Terima kasih
fitted_data