Nilai-p adalah probabilitas untuk memperoleh statistik yang setidaknya sama ekstrimnya dengan yang diamati dalam data sampel ketika mengasumsikan bahwa hipotesis nol () adalah benar.
Secara grafis ini sesuai dengan area yang ditentukan oleh statistik sampel di bawah distribusi sampling yang akan diperoleh ketika mengasumsikan :
Namun, karena bentuk dari distribusi yang diasumsikan ini sebenarnya didasarkan pada data sampel, maka dipusatkan pada sepertinya pilihan yang aneh bagi saya.
Jika seseorang akan menggunakan distribusi sampling dari statistik, yaitu memusatkan distribusi pada statistik sampel, maka pengujian hipotesis akan sesuai dengan memperkirakan probabilitas diberi sampel.
Dalam hal ini, nilai-p adalah probabilitas untuk memperoleh statistik paling tidak ekstrim diberikan data alih-alih definisi di atas.
Selain itu, interpretasi semacam itu memiliki keuntungan terkait dengan konsep interval kepercayaan:
Tes hipotesis dengan tingkat signifikansi akan sama dengan memeriksa apakah termasuk dalam interval kepercayaan dari distribusi sampling.
Dengan demikian saya merasa memusatkan distribusi bisa menjadi komplikasi yang tidak perlu.
Adakah pembenaran penting untuk langkah ini yang tidak saya pertimbangkan?


