Apa perbedaan makna antara notasi dan yang umum digunakan di banyak buku dan makalah?
Apa perbedaan makna antara notasi dan yang umum digunakan di banyak buku dan makalah?
Jawaban:
Saya percaya bahwa asal mula dari ini adalah paradigma kemungkinan (meskipun saya belum memeriksa kebenaran historis yang sebenarnya di bawah ini, ini adalah cara yang masuk akal untuk memahami bagaimana hal itu terjadi).
Katakanlah dalam pengaturan regresi, Anda akan memiliki distribusi: p (Y | x, beta) Yang berarti: distribusi Y jika Anda tahu (tergantung pada) nilai x dan beta.
Jika Anda ingin memperkirakan beta, Anda ingin memaksimalkan kemungkinan: L (beta; y, x) = p (Y | x, beta) Pada dasarnya, Anda sekarang melihat ekspresi p (Y | x, beta) sebagai fungsi beta, tetapi selain itu, tidak ada perbedaan (untuk ekspresi matematika yang benar yang dapat Anda peroleh dengan benar, ini adalah suatu keharusan --- meskipun dalam praktiknya tidak ada yang mengganggu).
Kemudian, dalam pengaturan bayesian, perbedaan antara parameter dan variabel lainnya segera memudar, sehingga Anda mulai menggunakan kedua notasi secara intermixedly.
Jadi, pada intinya: tidak ada perbedaan nyata: keduanya menunjukkan distribusi kondisional dari benda di sebelah kiri, bersyarat pada benda di sebelah kanan.
adalah kerapatan variabel acak X pada titik x , dengan θ menjadi parameter distribusi. f ( x , θ ) adalah kerapatan gabungan X dan Θ pada titik ( x , θ ) dan hanya masuk akal jika Θ adalah variabel acak. f ( x | θ ) adalah distribusi bersyarat dari X yang diberikan Θ , dan sekali lagi, hanya masuk akal jika adalah variabel acak. Ini akan menjadi lebih jelas ketika Anda masuk lebih jauh ke dalam buku dan melihat analisis Bayesian.
sama dengan , hanya berarti adalah parameter tetap dan fungsi adalah fungsi . , OTOH, adalah elemen keluarga (atau set) fungsi, di mana elemen diindeks oleh . Perbedaan yang halus, mungkin, tetapi yang penting, esp. ketika tiba saatnya untuk memperkirakan parameter yang tidak diketahui berdasarkan data yang diketahui ; pada saat itu, bervariasi dandiperbaiki, menghasilkan "fungsi kemungkinan". Penggunaan lebih umum di kalangan ahli statistik, sementara di antara ahli matematika.
Meskipun tidak selalu seperti ini, hari ini umumnya digunakan ketika d , w bukan variabel acak (yang tidak mengatakan bahwa mereka dikenal, tentu saja). P ( z | d , w ) menunjukkan pengkondisian pada nilai d , w . Pengkondisian adalah operasi pada variabel acak dan dengan demikian menggunakan notasi ini ketika d , w bukan variabel acak yang membingungkan (dan tragisnya umum).
Seperti yang ditunjukkan oleh @Nick Sabbe adalah notasi umum untuk distribusi sampling dari data yang diamati y . Beberapa frequentist akan menggunakan notasi ini tetapi bersikeras bahwa Θ bukan variabel acak, yang merupakan IMO penyalahgunaan. Tetapi mereka tidak memiliki monopoli di sana; Saya telah melihat orang Bayesian melakukannya juga, memasang hiperparameter tetap pada akhir kondisi.