Latar belakang saya terutama dalam pembelajaran mesin dan saya mencoba mempelajari apa arti pengujian Hipotesis Bayesian. Saya setuju dengan interpretasi bayesian tentang probabilitas dan saya akrab dengannya dalam konteks model grafis probabilistik. Namun, yang membingungkan saya adalah apa arti kata "Hipotesis" dalam konteks inferensi statistik.
Saya pikir saya sebagian besar menjadi bingung tentang kosa kata yang saya terbiasa dengan pembelajaran mesin vs apa yang biasanya digunakan dalam statistik dan kesimpulan.
Dalam konteks pembelajaran terawasi , saya biasanya menganggap hipotesis sebagai fungsi prediktif yang memetakan contoh ke labelnya yaitu . Namun, bagi saya tampaknya istilah hipotesis, dalam bacaan yang saya lakukan tidak memiliki makna yang sama. Biarkan saya menempelkan ekstrak bacaan yang saya baca:
Jika Anda membaca dengan seksama, itu juga mengatakan:
ada model yang berbeda untuk data yang diamati ...
apakah mereka menggunakan model kata. Bagi saya model kata membuat saya berpikir tentang serangkaian fungsi jika kita memilih fungsi prediksi tertentu. yaitu kelas fungsi hipotesis. Sebagai contoh, bisa menjadi kelas hipotesis fungsi kuadratik (polinomial derajat 2). Namun, bagi saya tampaknya mereka menggunakan model kata dan hipotesis sebagai sinonim dalam ekstrak ini (di mana bagi saya mereka kata-kata yang sama sekali berbeda).
Kemudian disebutkan bahwa kita dapat menempatkan prior ke hipotesis (hal yang sepenuhnya masuk akal untuk dilakukan dalam pengaturan bayesian):
kami juga dapat mengkarakterisasi data dengan hipotesis saat ini:
dan memperbarui kepercayaan kami saat ini dengan diberikan beberapa data (dan aturan Baye):
Namun, saya kira saya lebih terbiasa menempatkan perkiraan bayesian ke parameter tertentu (katakanlah ) dari kelas hipotesis daripada ke seluruh kelas hipotesis. Pada dasarnya karena tampaknya "hipotesis" ini bukan hipotesis yang sama dari konteks pembelajaran mesin yang saya gunakan, tampaknya bagi saya bahwa hipotesis ini lebih mirip dengan parameter spesifik daripada dengan kelas hipotesis.
Pada titik ini saya yakin bahwa "hipotesis" memiliki arti yang sama seperti pada fungsi prediktif (parametrized oleh parameter , misalnya), tetapi saya pikir saya salah ...
Untuk membuat kebingungan saya lebih buruk, kemudian pembacaan yang sama ini dilakukan untuk menentukan "hipotesis" tertentu untuk setiap contoh pelatihan yang mereka amati. Biarkan saya menempelkan ekstrak yang saya maksud:
alasan mengapa hal ini membingungkan saya adalah bahwa, jika saya menafsirkan hipotesis sebagai parameter, maka bagi saya tidak masuk akal untuk menentukan parameter spesifik untuk setiap nilai sampel yang kita lihat. Pada titik ini saya menyimpulkan bahwa saya benar-benar tidak tahu apa yang mereka maksud dengan hipotesis, jadi saya memposting pertanyaan ini.
Namun, saya tidak sepenuhnya menyerah, saya meneliti hipotesis apa artinya dalam statistik sering dan menemukan video akademi khan berikut . Video itu benar-benar masuk akal bagi saya (mungkin Anda seorang yang sering! :) . Namun, tampaknya mereka mendapatkan banyak data (seperti beberapa "set sampel") dan berdasarkan pada properti set sampel, mereka memutuskan apakah akan menerima atau menolak hipotesis nol tentang data. Namun, dalam konteks Bayesian yang saya baca, menurut saya, untuk setiap vektor [titik] data yang diamati, mereka "memberi label" dengan hipotesis dengan "Uji rasio kemungkinan":
Cara mereka menetapkan hipotesis untuk setiap sampel data, bahkan sepertinya pengaturan pembelajaran yang diawasi adalah kita menempelkan label pada setiap rangkaian pelatihan. Namun, saya tidak berpikir itulah yang mereka lakukan dalam konteks ini. Apa yang mereka lakukan? Apa artinya menetapkan hipotesis untuk setiap sampel data? Apa arti dari sebuah hipotesis? Apa arti kata model?
Pada dasarnya, setelah penjelasan panjang tentang kebingungan saya, apakah ada yang tahu apa artinya pengujian hipotesis bayesian dalam konteks ini?
Jika Anda memerlukan klarifikasi atau apa pun untuk meningkatkan pertanyaan saya atau agar pertanyaan itu masuk akal, saya akan dengan senang hati membantu :)
Dalam pencarian saya untuk jawaban saya menemukan beberapa hal berguna yang berkaitan dengan pengujian hipotesis statistik:
Ini membahas pengantar yang bagus untuk topik ini jika Anda berasal dari latar belakang CS (seperti saya):
Apa pengantar yang baik untuk pengujian hipotesis statistik untuk para ilmuwan komputer?
Pada titik tertentu saya bertanya tentang "parameter default" (yang seharusnya saya mendefinisikan apa yang saya maksud. Saya pikir itu adalah istilah standar tetapi tidak, jadi di sini saya akan mengatasinya) dan saya pikir apa yang saya maksud sebenarnya adalah bagaimana Anda menentukan parameter untuk setiap hipotesis yang Anda miliki. Misalnya, bagaimana Anda memutuskan hipotesis nol dan parameternya. Ada pertanyaan terkait itu: