Peringatan: Jawaban ini mengasumsikan bahwa pertanyaannya adalah tentang menafsirkan nilai-p dan CI yang di-bootstrap. Perbandingan antara nilai-p tradisional (tidak bootstrap) dan CI bootstrap akan menjadi masalah yang berbeda.
Dengan uji-t tradisional (bukan bootstrap), CI 95% dan posisi nilai-p relatif terhadap batas 0,05 untuk signifikansi akan selalu memberi tahu Anda hal yang sama. Itu karena keduanya didasarkan pada informasi yang sama: distribusi t untuk derajat kebebasan Anda dan kesalahan rata-rata dan standar yang diamati dalam sampel Anda (atau perbedaan antara rata-rata dan kesalahan standar, dalam kasus t-sampel dua sampel). uji). Jika CI Anda tidak tumpang tindih dengan 0, maka nilai-p Anda harus <0,05 --- kecuali, tentu saja, ada bug dalam perangkat lunak atau kesalahan pengguna dalam implementasi atau interpretasi tes.
Dengan uji-t bootstrap, nilai CI dan p keduanya dihitung langsung dari distribusi empiris yang dihasilkan oleh bootstrap: nilai p adalah berapa persen perbedaan kelompok bootstrap yang lebih ekstrem daripada perbedaan yang diamati semula; 95% CI adalah 95% tengah perbedaan kelompok bootstrap. Bukan tidak mungkin nilai-p dan CI tidak setuju tentang signifikansi dalam tes bootstrap.
Apakah Anda menerima atau menolak hipotesis nol?
Dalam konteks tes bootstrap, nilai-p (dibandingkan dengan CI) lebih langsung mencerminkan semangat uji hipotesis, sehingga paling masuk akal untuk mengandalkan nilai itu untuk memutuskan apakah akan menolak nol atau tidak pada alpha yang Anda inginkan (umumnya .05). Jadi dalam kasus Anda, di mana nilai p kurang dari 0,05 tetapi CI 95% mengandung nol, saya sarankan menolak hipotesis nol .
Semua ini melompati ide-ide besar tentang betapa pentingnya "signifikansi" seharusnya dan apakah pengujian hipotesis nol atau tidak benar-benar berguna dari suatu alat. Secara singkat, saya selalu merekomendasikan memuji setiap analisis pengujian signifikansi dengan estimasi ukuran efek (untuk uji dua sampel, estimasi ukuran efek terbaik mungkin adalah Cohen d ), yang dapat memberikan beberapa konteks tambahan untuk membantu Anda memahami hasil Anda.
Posting bermanfaat terkait: Apa arti dari interval kepercayaan yang diambil dari contoh bootstrap?