Saya khawatir pertanyaan terkait tidak menjawab pertanyaan saya. Kami mengevaluasi kinerja> 2 pengklasifikasi (pembelajaran mesin). Hipotesis Null kami adalah bahwa kinerja tidak berbeda. Kami melakukan tes parametrik (ANOVA) dan non-parametrik (Friedman) untuk mengevaluasi hipotesis ini. Jika signifikan, kami ingin mencari tahu pengklasifikasi mana yang berbeda dalam pencarian pasca-hoc.
Pertanyaan saya ada dua:
1) Apakah koreksi nilai p setelah beberapa pengujian perbandingan diperlukan? Situs Wikipedia bahasa Jerman di "Alphafehler Kumulierung" mengatakan bahwa masalahnya hanya terjadi jika beberapa hipotesis diuji pada data yang sama. Ketika membandingkan pengklasifikasi (1,2), (1,3), (2,3), data hanya tumpang tindih sebagian. Apakah masih diperlukan untuk memperbaiki nilai-p?
2) Koreksi nilai-P sering digunakan setelah pengujian berpasangan dengan uji-t. Apakah itu juga perlu ketika melakukan tes khusus post-hoc, seperti Nemenyi (non-parametrik) atau tes HSD Tukey? Jawaban ini mengatakan "tidak" untuk Tukey's HSD: Apakah tes Tukey HSD benar untuk beberapa perbandingan? . Apakah ada aturan atau saya harus mencari ini untuk setiap tes post-hoc potensial?
Terima kasih!