Jika Anda menggunakan pengembalian log, maka Anda membuat kesalahan biasing sedikit tetapi jika Anda menggunakan nilai masa depan dibagi dengan nilai sekarang maka kemungkinan Anda salah. Sebenarnya, kemungkinan Anda salah dalam kedua kasus tersebut. Cukup salah untuk masalah.
Pertimbangkan bahwa statistik adalah fungsi data apa pun. Pengembalian bukan data, mereka adalah transformasi data. Mereka adalah nilai masa depan dibagi dengan nilai sekarang. Harga adalah data. Harga harus memiliki fungsi distribusi, tetapi fungsi distribusi untuk pengembalian harus semata-mata bergantung pada sifat harga.
halthalt + 1
halt + 1halt- 1.
1πσσ2+ ( y- β1x1- β2x2⋯ - βnxn- α )2.
OLS memaksakan kesesuaian terbaik terhadap data yang diamati bahkan jika itu adalah solusi yang salah. Metode Bayesian berusaha untuk menemukan fungsi menghasilkan data melalui kemungkinan. Kemungkinan Anda salah, sehingga tidak dapat menemukannya.
Saya punya makalah tentang ini jika Anda memerlukan informasi tambahan.
EDIT
Saya pikir Anda salah paham. Jika Anda akan mengubah kemungkinan menjadi fungsi kepadatan dan mengambil harapan, Anda akan menemukan bahwa itu tidak memilikinya. Dengan bukti oleh Augustin Cauchy pada tahun 1852 atau mungkin tahun 1851, segala bentuk solusi kuadrat terkecil sangat tidak tepat. Itu akan selalu gagal. Bukannya Anda harus menggunakan regresi standar karena Bayesian sensitif terhadap kemungkinan, itu adalah bahwa Bayes adalah satu-satunya solusi yang tersedia yang dapat diterima, dengan beberapa pengecualian khusus untuk beberapa kasus khusus yang tidak biasa.
Dalam melakukan pengujian empiris tentang ini, dan sebelum saya membaca cukup banyak matematika, saya dengan naif berpikir bahwa solusi Bayesian dan Frequentist harus cocok. Ada, kira-kira, sebuah teorema yang mengatakan bahwa ketika sampel menjadi cukup besar, keduanya akan bertemu. Saya menggunakan semua perdagangan akhir hari di alam semesta CRSP dari 1925-2013 untuk mengujinya. Namun bukan itu yang dikatakan teorema. Saya salah paham aturan.
Saya juga mencoba masalah dalam log, dan masih tidak cocok. Jadi saya menyadari sesuatu, semua distribusi adalah bentuk, dan saya membangun solusi geometris untuk menentukan solusi mana yang benar. Saya memperlakukannya sebagai masalah geometri murni untuk menentukan jawaban aljabar yang cocok dengan data.
Yang Bayesian cocok. Ini membawa saya ke jalur yang sangat matematis karena saya tidak tahu mengapa penaksir yang tidak memihak begitu salah. Sebagai catatan, menggunakan pengembalian terpilah selama periode 1925-2013 dan menghapus perusahaan shell, dana tertutup dan sebagainya, perbedaan antara pusat lokasi adalah 2% dan ukuran risiko dikecilkan oleh 4% untuk pengembalian tahunan . Perbedaan ini berlaku di bawah transformasi log, tetapi untuk alasan yang berbeda. Mungkin berbeda untuk masing-masing indeks atau subset data.
Alasan perbedaan adalah dua kali lipat. Yang pertama adalah bahwa distribusi yang terlibat tidak memiliki statistik yang memadai. Untuk jenis masalah tertentu, ini tidak masalah. Untuk keperluan proyektif, seperti prediksi atau alokasi, bagaimanapun, mereka cukup penting. Alasan kedua adalah bahwa estimator yang tidak bias selalu merupakan versi rata-rata, tetapi distribusinya tidak memiliki rata-rata.
Kepadatan di atas bukan anggota dari keluarga eksponensial sebagaimana distribusi normal atau gamma. Dengan teorema Pitman – Koopman – Darmois, tidak ada statistik titik yang memadai untuk parameter. Ini menyiratkan bahwa setiap upaya untuk membuat penduga titik harus membuang informasi. Ini bukan masalah untuk solusi Bayesian karena posterior adalah seluruh kepadatan dan jika Anda memang membutuhkan estimasi titik, Anda dapat menemukan kepadatan prediktif dan meminimalkan fungsi biaya di atasnya untuk menguranginya menjadi satu titik. Kemungkinan Bayesian selalu minimal memadai.
Penaksir tidak bias varians minimum untuk fungsi di atas adalah untuk menjaga pusat 24,6% dari data, menemukan rata-rata yang dipangkas, dan untuk membuang sisa data. Itu berarti lebih dari 75% data hilang, dan informasinya hilang. Hanya sebuah catatan, mungkin 24,8%, karena saya bekerja dari memori. Anda dapat menemukan kertas Rothenberg di:
Rothenberg, TJ dan FM Fisher, dan CB Tilanus, Catatan tentang Estimasi dari Sampel Cauchy, Jurnal Asosiasi Statistik Amerika, 1964, vol 59 (306), hlm. 460-463
Masalah kedua mengejutkan bagi saya. Sampai saya mengerjakan geometri, saya tidak menyadari apa penyebabnya. Pengembalian terikat di bagian bawah di -100%. Ini menggeser median sebesar 2% dan rentang interkuartil digeser sebesar 4% meskipun setengah-massa masih pada titik yang sama. Setengah-massa adalah ukuran skala yang tepat, tetapi setengah-lebar tidak. Jika tidak ada pemotongan, maka setengah-lebar dan setengah-massa akan berada di titik yang sama. Demikian juga, median dan mode akan tetap pada titik yang sama. Median adalah pengembalian untuk aktor rata-rata atau setidaknya perdagangan rata-rata. Karena itu, selalu lokasi MVUE dan rata-rata log.
Pemahaman yang benar tentang teorema adalah bahwa semua estimator Bayesian adalah estimator yang dapat diterima. Penaksir frekuensi adalah penaksir yang dapat diterima jika salah satu dari dua syarat diperoleh. Yang pertama adalah bahwa dalam setiap sampel, solusi Frequentist dan Bayesian identik. Yang kedua adalah bahwa jika solusi pembatas dari metode Bayesian cocok dengan solusi Frequentist, maka solusi Frequentist dapat diterima.
Semua penduga yang dapat diterima bertemu dengan solusi yang sama setelah ukuran sampel cukup besar. Estimator Frequentist mengandaikan bahwa modelnya adalah model yang benar dan datanya acak. Bayesian menganggap data itu benar, tetapi modelnya acak. Jika Anda memiliki jumlah data yang tak terbatas, maka model subjektif harus menyatu dengan kenyataan. Jika Anda memiliki jumlah data yang tak terbatas, tetapi model yang salah, maka model Frequentist akan menyatu dengan kenyataan dengan probabilitas nol.
Dalam hal ini, solusi Bayesian, di bawah prior prior, akan secara stokastik mendominasi setiap estimator Frequentist karena pemotongan dan hilangnya informasi untuk membuat estimator.
Dalam log, fungsi kemungkinan adalah distribusi sekan hiperbolik. Ini memiliki varian yang terbatas, tetapi tidak ada kovarians. Matriks kovarians yang ditemukan menggunakan OLS adalah artefak dari data dan tidak menunjuk ke parameter yang ada dalam data yang mendasarinya. Seperti halnya bentuk mentah, tidak ada dalam bentuk log kovari, tetapi tidak ada yang independen juga. Alih-alih, ada hubungan yang jauh lebih kompleks yang melanggar definisi kovarians, tetapi di mana mereka dapat berkembang.
Markowitz dan Usman hampir menemukannya dalam pekerjaan mereka pada distribusi, tetapi distribusi garis potong hiperbolik tidak dalam keluarga Pearson dan mereka salah mengartikan data dengan tidak memperhatikan bahwa ketika Anda mengubah distribusi dari data mentah ke data log Anda juga mengubah sifat statistiknya . Mereka pada dasarnya menemukan ini tetapi ketinggalan karena mereka tidak punya alasan untuk mencarinya dan mereka tidak menyadari konsekuensi yang tidak diinginkan dari menggunakan log.
Saya tidak memiliki Markowitz dan Usman mengutip di mana saya berada, tetapi mereka melakukan salah satu dari beberapa pekerjaan yang sangat baik dalam memperkirakan distribusi yang ada di luar sana.
Bagaimanapun, saya tidak menggunakan JAGS. Saya tidak tahu bagaimana melakukannya. Saya kode semua pekerjaan MCMC saya dengan tangan.
Saya memiliki makalah yang jauh lebih lengkap dan akurat tentang topik ini di:
Harris, DE (2017) Distribusi Pengembalian. Jurnal Keuangan Matematika, 7, 769-804.
Ini akan memberi Anda metode untuk membangun distribusi untuk setiap kelas aset atau liabilitas, juga rasio akuntansi.
Saya bertele-tele, tetapi saya bisa melihat Anda salah memahami hubungan antara Bayes dan metode Pearson-Neyman. Anda membuatnya terbalik. Bayes selalu bekerja, tetapi Anda terjebak dengan kepadatan sebelumnya yang akan mengganggu solusi Anda. Dengan tepat sebelum Anda dijamin penaksir yang bias dan untuk jenis fungsi kemungkinan ini, saya yakin Anda harus menggunakan yang tepat sebelum menjamin integrasi ke kesatuan. Metode yang sering dilakukan cepat dan biasanya berfungsi. Mereka tidak bias, tetapi mungkin tidak valid.