Saya mengalami masalah besar dengan masalah konseptual yang saya temukan.
Katakanlah sebuah perusahaan memiliki distribusi yang sangat miring. Sesuatu yang mirip dengan eksponensial atau lognormal hanya lebih ekstrem. Sekarang berpura-pura distribusi sangat miring sehingga rata-rata distribusi lebih tinggi dari 99% Persentil dari distribusi. (Aka 1-2 nilai ekstrem yang lebih tinggi menyebabkan rata-rata sangat tinggi dibandingkan dengan distribusi lainnya).
Menurut definisi, jika distribusi ini digunakan untuk memperkirakan nilai masa depan (alias sampel acak dari distribusi) apakah benar bahwa rata-rata tidak akan berada dalam interval Prediksi 95%?
Di otak saya, interval predisi 95% adalah rentang yang 95% dari semua nilai masa depan akan jatuh di antara. Untuk distribusi apa pun, ini harus persis sama dengan 0,025 Persentil pada batas bawah, dan persentil 0,975 pada batas atas ... Jika rerata lebih tinggi dari 0,975 Persentil, maka rerata tidak akan berada dalam '95% interval prediksi '.
Apakah saya salah memikirkan hal ini? Tampaknya aneh melaporkan perkiraan sebagai
- Nilai Perkiraan Rata-rata: 6,000,0000
- Interval Prediksi 95%: [400.5000].