Pengujian hipotesis mirip dengan masalah Klasifikasi. Jadi katakanlah, kami memiliki 2 label yang memungkinkan untuk pengamatan (subjek) - Bersalah vs. Tidak Bersalah. Biarkan Non-Bersalah menjadi Hipotesis nol. Jika kita melihat masalah dari sudut pandang Klasifikasi, kita akan melatih Klasifikasi yang akan memprediksi probabilitas subjek yang termasuk dalam masing-masing dari 2 Kelas, mengingat Data. Kami kemudian akan memilih Kelas dengan probabilitas tertinggi. Dalam hal 0,5 kemungkinan akan menjadi ambang alami. Kami mungkin memvariasikan ambang jika kami menetapkan biaya yang berbeda untuk kesalahan False Positive vs False Negative. Tetapi jarang kita akan menjadi sangat ekstrim seperti menetapkan ambang batas pada 0,05, yaitu menetapkan subjek ke Kelas "Bersalah" hanya jika probabilitasnya 0,95 atau lebih tinggi. Tetapi jika saya mengerti dengan baik, inilah yang kami lakukan sebagai praktik standar ketika kami melihat masalah yang sama dengan masalah pengujian Hipotesis. Dalam kasus terakhir ini, kami tidak akan menugaskan label "Tidak Bersalah" - sama dengan menugaskan label "Bersalah" - hanya jika probabilitas "Tidak Bersalah" kurang dari 5%. Dan mungkin ini masuk akal jika kita benar-benar ingin menghindari menghukum orang yang tidak bersalah. Tetapi mengapa aturan ini berlaku di semua Domain dan semua kasus?
Memutuskan Hipotesis mana yang akan diadopsi adalah setara dengan mendefinisikan Penaksir Kebenaran yang diberikan Data. Dalam Estimasi Kemungkinan Maksimum, kami menerima Hipotesis yang lebih mungkin diberikan pada Data - meskipun tidak selalu jauh lebih mungkin. Lihat grafik di bawah ini:
Dengan menggunakan pendekatan Maximum Likelihood kami akan mendukung Hipotesis Alternatif dalam contoh ini jika nilai Predictor di atas 3, misalnya 4, meskipun kemungkinan nilai ini berasal dari Hipotesis Null akan lebih besar dari 0,05.
Dan sementara contoh yang saya mulai posting mungkin dibebankan secara emosional, kita bisa memikirkan kasus-kasus lain, misalnya perbaikan teknis. Mengapa kita harus memberikan keuntungan seperti itu kepada Status Quo ketika Data memberi tahu kita bahwa probabilitas bahwa solusi baru adalah peningkatan lebih besar daripada probabilitas bahwa itu bukan?