Daripada menghitung probabilitas, mengapa tidak memprediksi berapa banyak produk yang gagal?
Membuat Model Pengamatan
Ada produk di lapangan dan sedang dipertimbangkan. Asumsikan kegagalan mereka semuanya independen dan konstan dengan probabilitas .m = 10.000 pn=100000m=10000p
Kami dapat memodelkan situasi ini dengan percobaan Binomial: di luar kotak tiket dengan proporsi yang tidak diketahui dari tiket "gagal" dan tiket "sukses" , menarik tiket (dengan penggantian, sehingga kemungkinan kegagalan tetap sama). Menghitung kegagalan di antara yang pertama tiket - biarkan itu menjadi --dan count kegagalan di antara sisa tiket, menyebut bahwa .1 - p m + n = 110000 n X m Yp1−pm+n=110000nXmY
Membingkai Pertanyaan
Pada prinsipnya, dan bisa berupa apa saja. Apa yang kita tertarik adalah kesempatan yang diberikan bahwa (dengan sejumlah di ). Karena kegagalan dapat terjadi di mana saja di antara semua tiket , dengan setiap konfigurasi yang memungkinkan memiliki peluang yang sama, hal ini ditemukan dengan membagi jumlah -subjek hal-hal dengan jumlah subset dari semua hal-hal :0 ≤ Y ≤ m Y = u X + Y = u u { 0 , 1 , … , m } n + m u m u n + m0≤X≤n0≤Y≤mY=u X+Y=uu{0,1,…,m}n+mumun+m
p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m−1)⋯(m−u+1)(n+m)(n+m−1)⋯(n+m−u+1).
Rumus yang sebanding dapat digunakan untuk perhitungan ketikaX=1,2,….
Sebuah atas batas prediksi1−α (UPL) untuk jumlah kegagalan pada mereka lalu tiket, , diberikan oleh terkecil (tergantung ) yang .mtα(X;n,m)uXp(u;n,m)≤α
Interpretasi
UPL harus ditafsirkan dalam hal risiko menggunakan , seperti yang dievaluasi sebelum atau diamati. Dengan kata lain, anggaplah itu satu tahun yang lalu dan Anda diminta untuk merekomendasikan prosedur untuk memprediksi jumlah kegagalan dalam produk berikutnya setelah pertama diamati. Klien Anda bertanyatαXYmn
Bagaimana kemungkinan prosedur Anda akan lebih rendah dari ? Saya tidak bermaksud di masa depan setelah Anda memiliki lebih banyak data; Maksud saya saat ini, karena saya harus membuat keputusan sekarang dan satu-satunya peluang saya akan tersedia bagi saya adalah orang-orang yang dapat dihitung pada saat ini. "Y
Respons Anda bisa,
Saat ini peluangnya tidak lebih besar dari , tetapi jika Anda berencana untuk menggunakan prediksi yang lebih kecil, peluangnya akan melebihi .αα
Hasil
Untuk , , dan kita dapat menghitungnyan=105m=104X=0
p(0,n,m)=1; p(1,n,m)=111≈0.091; p(2,n,m)=909109999≈0.0083;…
Jadi, setelah mengamatiX=0 ,
Untuk hingga kepercayaan (yaitu, ketika ), prediksi ada paling banyak kegagalan dalam produk berikutnya .1−α=90.9%9.1%≤αtα(0;n,m)=110,000
Untuk hingga kepercayaan (yaitu, ketika ), prediksi ada paling banyak kegagalan dalam produk berikutnya .99.2%0.8%≤α<9.1%tα(0;n,m)=210,000
Dll
Komentar
Kapan dan mengapa pendekatan ini berlaku? Misalkan perusahaan Anda membuat banyak produk yang berbeda. Setelah mengamati kinerja masing-masing di lapangan, ia suka menghasilkan jaminan, seperti "lengkap tanpa biaya penggantian setiap kegagalan dalam satu tahun." Dengan memiliki batas prediksi jumlah kegagalan Anda dapat mengontrol total biaya karena harus mendukung jaminan tersebut. Karena Anda membuat banyak produk, dan mengharapkan kegagalan disebabkan oleh keadaan acak di luar kendali Anda, pengalaman setiap produk akan independen. Masuk akal untuk mengendalikan risiko Anda dalam jangka panjangn. Sekali-sekali Anda mungkin harus membayar lebih banyak klaim daripada yang diharapkan, tetapi sebagian besar waktu Anda akan membayar lebih sedikit. Jika membayar lebih dari yang diumumkan dapat merusak, Anda akan menetapkan menjadi sangat kecil (dan Anda kemungkinan akan menggunakan model kegagalan yang lebih canggih juga!). Kalau tidak, jika biayanya kecil, maka Anda bisa hidup dengan kepercayaan rendah (high ). Perhitungan ini menunjukkan cara menyeimbangkan kepercayaan dan risiko.αα
Perhatikan bahwa kita tidak harus menghitung prosedur lengkap . Kami menunggu sampai diamati dan kemudian hanya melakukan perhitungan untuk tertentu (di sini, ), seperti yang ditunjukkan di atas. Namun pada prinsipnya, kami bisa melakukan perhitungan untuk semua nilai pada awalnya.tXXX=0X
Pendekatan Bayesian (dijelaskan dalam jawaban lain) menarik dan akan bekerja dengan baik asalkan hasilnya tidak terlalu bergantung pada sebelumnya. Sayangnya, ketika tingkat kegagalan sangat rendah sehingga sangat sedikit (atau tidak ada kegagalan) yang diamati, hasilnya sensitif terhadap pilihan sebelumnya.