Interval kepercayaan kembali ditransformasikan


11

Setelah menemukan diskusi ini, saya mengajukan pertanyaan tentang konvensi interval kepercayaan yang ditransformasikan kembali.

Menurut artikel ini , cakupan nominal back-transformed CI untuk rata-rata variabel acak log-normal adalah:

LCL(X)=exp(Y+var(Y) UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n1))  LCL(X)=exp(Y+var(Y)2zvar(Y)n+var(Y)22(n1))

/ dan bukan exp naif ( ( Y ) + z /exp((Y)+zvar(Y))

Sekarang, apa itu CI untuk transformasi berikut:

  1. danx 1 / 3xx1/3
  2. arcsin(x)
  3. log(x1x)
  4. 1/x

Bagaimana dengan interval toleransi untuk variabel acak itu sendiri (maksud saya nilai sampel tunggal diambil secara acak dari populasi)? Apakah ada masalah yang sama dengan interval back-transformed, atau akankah mereka memiliki cakupan nominal?


1
Lihat ekspansi Taylor untuk momen-momen fungsi rv , dan metode Delta . Tapi perawatan dibutuhkan. Lihat misalnya diskusi di sini dan [di sini] (stats.stackexchange.com/questions/41896/varx-is-known-how-to-calculate-var1-x/). Pencarian di seri taylor akan menyajikan beberapa contoh dan diskusi yang bermanfaat.
Glen_b -Reinstate Monica

Saya telah mengedit substansi formula Anda. Silakan periksa saya tidak salah satu dari mereka. Pada komentar saya sebelumnya (maaf tentang tautan yang tidak diformat dengan benar di sana) - juga lihat komentar pencegahan di bawah jawaban di sini
Glen_b -Reinstate Monica

Terima kasih. Meskipun saya hampir tidak dapat memposting sesuatu tanpa diedit dengan ekspresi mewah itu.
Germaniawerks

Jawaban:


6

Mengapa Anda melakukan transformasi balik sama sekali? Itu penting untuk menjawab pertanyaan Anda karena dalam beberapa kasus transformasi naif adalah jawaban yang tepat. Bahkan, saya pikir saya akan berdebat bahwa, jika transformasi naif bukanlah jawaban yang tepat maka Anda tidak boleh mengubah sama sekali.

Saya menemukan masalah umum transformasi kembali sangat bermasalah dan sering dipenuhi dengan pemikiran yang kacau. Melihat artikel yang Anda kutip, apa yang membuat mereka berpikir bahwa itu adalah pertanyaan yang masuk akal bahwa CI yang ditransformasikan kembali tidak menangkap maksud aslinya? Ini adalah interpretasi yang salah dari nilai-nilai yang diubah kembali. Mereka berpikir bahwa cakupan harus untuk analisis langsung di ruang yang ditransformasikan kembali. Dan kemudian mereka membuat transformasi balik untuk memperbaiki kesalahan itu alih-alih interpretasi mereka.

Jika Anda melakukan analisis pada nilai log maka estimasi dan kesimpulan Anda berlaku untuk nilai log tersebut. Selama Anda mempertimbangkan kembali mengubah representasi dari bagaimana analisis log terlihat di ruang eksponensial, dan hanya seperti itu, maka Anda baik-baik saja dengan pendekatan naif. Bahkan, itu akurat. Itu benar dari setiap transformasi.

Melakukan apa yang mereka lakukan memecahkan masalah mencoba membuat CI menjadi sesuatu yang bukan, CI dari nilai-nilai yang diubah. Ini penuh dengan masalah. Pertimbangkan ikatan yang Anda hadapi sekarang, dua kemungkinan CI, satu di ruang transformasi di mana Anda melakukan analisis Anda, dan satu kembali berubah, membuat pernyataan yang sangat berbeda tentang di mana kemungkinan mu berada di ruang lain. Transformasi balik yang disarankan menciptakan lebih banyak masalah daripada yang dipecahkan.

Hal terbaik untuk dikeluarkan dari makalah itu adalah bahwa ketika Anda memutuskan untuk mengubah data itu memiliki dampak yang lebih dalam dari yang diharapkan pada arti estimasi dan kesimpulan Anda.


Bisakah Anda jelaskan lebih lanjut? Sepertinya saya masalah menjadi CI naif memberikan bahwa dari rata-rata geometris, daripada aritmatika. Yang akan menyiratkannya menjadi lebih kecil, seperti yang mereka katakan, dan karenanya inkonsistensi dan cakupan yang buruk.
Germaniawerks

Inkonsistensi dengan apa? Jika Anda akan menganalisis distribusi eksponensial Anda secara langsung dan ingin mengetahui rata-rata arithemtic maka ya, itu cakupan yang buruk untuk itu. Tetapi jika Anda ingin melakukan itu maka Anda harus melakukan itu. Jika Anda akan log mentransformasikan distribusi Anda dan menganalisis eksponen maka cakupan yang tepat untuk itu.
John

Saya tidak mengerti mengapa Anda keberatan dengan metode dalam artikel ini. Simulasi menunjukkan itu berfungsi dengan baik, sementara metode naif melakukan lebih buruk daripada "pendekatan batas pusat".
Germaniawerks

1
Mereka menunjukkan itu melakukan lebih baik untuk apa yang mereka inginkan. Metode naif bekerja dengan baik untuk apa itu. Lihatlah simulasi di bagian 5. Mereka mengatur distribusi rata-rata lnorm 5, yang memiliki eksponen 148,4. Kemudian mereka melanjutkan untuk membahas cakupan rata-rata 244,6 !! Itu hanya penting jika Anda akan memodelkan rata-rata distribusi asli, BUKAN log. Mereka mencoba membuatnya menjadi sesuatu yang bukan. Perhitungan naif memiliki cakupan yang sangat baik atas rata-rata log, 5. Tidak ada CI lain yang 95% CI dari nilai itu dan itulah yang Anda analisis.
John
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.