Bagaimana cara mengetahui probabilitas kegagalan jika tidak ada kegagalan?


50

Saya bertanya-tanya apakah ada cara untuk mengetahui kemungkinan sesuatu gagal (suatu produk) jika kita memiliki 100.000 produk di lapangan selama 1 tahun dan tanpa kegagalan? Berapa probabilitas salah satu dari 10.000 produk berikutnya gagal terjual?


4
Sesuatu memberi tahu saya ini bukan masalah keandalan yang sebenarnya. Tidak ada produk dengan tingkat kegagalan yang rendah.
Aksakal

Anda memerlukan model untuk distribusi kemungkinan tingkat kegagalan / keberhasilan sebelum Anda dapat menyimpulkan apa pun dari statistik hingga probabilitas untuk tingkat keberhasilan / kegagalan aktual. Deskripsi Anda memberikan dasar yang sangat sedikit untuk menyimpulkan / menganggap distribusi tersebut.
RBarryYoung

1
@RBarryYoung silakan periksa jawaban yang diberikan - mereka memberikan beberapa pendekatan yang menarik dan valid untuk masalah ini. Jika Anda tidak setuju dengan pendekatan itu, jangan ragu untuk berkomentar atau memberikan jawaban Anda sendiri.
Tim

2
@Aksakal - tingkat kegagalan yang rendah sepertinya tidak mungkin jika produk sederhana dengan nilai tinggi dan risiko tinggi jika terjadi kegagalan (seperti instrumen bedah) yang melewati tingkat pengujian dan inspeksi (dan mungkin independen sertifikasi) sebelum rilis. Tentu saja, kebalikannya mungkin benar, produk tersebut dapat memiliki nilai rendah sehingga pengguna akhir tidak melaporkan masalah dengan produk yang cacat (pasti produsen tolol memiliki tingkat cacat kurang dari 1/100000 yang dilaporkan?), Konsumen hanya membuang dan coba yang baru.
Johnny

@ Johnny, ketika Motorola membuat mereka dulu menyombongkan diri bahwa ada 3 kegagalan per 100 juta produk, atau sesuatu seperti itu. 6σ
Aksakal

Jawaban:


43

Probabilitas bahwa suatu produk akan gagal tentunya adalah fungsi dari waktu dan penggunaan. Kami tidak memiliki data tentang penggunaan, dan dengan hanya satu tahun tidak ada kegagalan (selamat!). Dengan demikian, aspek ini (disebut fungsi survival ), tidak dapat diperkirakan dari data Anda.

Anda dapat menganggap kegagalan dalam satu tahun sebagai penarikan dari distribusi binomial . Anda masih tidak mengalami kegagalan, tetapi ini sekarang merupakan masalah umum. Solusi sederhana adalah dengan menggunakan aturan 3 , yang akurat dengan besar (yang tentunya Anda miliki). Secara khusus, Anda bisa mendapatkan atas terikat dari satu sisi 95% confidence interval (yaitu, batas bawah adalah ) pada probabilitas benar kegagalan dalam satu tahun sebagai . Dalam kasus Anda, Anda yakin 95% bahwa kurang dari . 0 3 / N 0,00003N03/N0.00003

Anda juga bertanya bagaimana menghitung probabilitas bahwa satu atau lebih dari 10k berikutnya gagal. Cara cepat dan sederhana (meskipun ekstrem) untuk memperluas analisis di atas adalah dengan hanya menggunakan batas atas sebagai probabilitas yang mendasari dan menggunakan CDF binomial yang sesuai untuk mendapatkan probabilitas bahwa tidak akan ada kegagalan. Dengan menggunakan kode, kita bisa melakukan :, yang menghasilkan peluang untuk melihat satu atau lebih kegagalan dalam produk 10k berikutnya. Dengan menggunakan batas atas, ini bukan estimasi titik optimal dari kemungkinan memiliki setidaknya satu kegagalan, tetapi Anda dapat mengatakan bahwa kemungkinan kegagalan lebih dari1 26 % ( F + 1 ) / ( N + 2 ) F p = 9,9998 × 10 - 06 1 +10 %0R1-pbinom(0, size=10000, prob=0.00003)0.2591851126%(mengakui bahwa ini adalah framing 'bergelombang tangan'). Kemungkinan lain adalah dengan menggunakan saran @ amoeba tentang estimasi dari aturan suksesi Laplace . Aturan suksesi menyatakan bahwa estimasi probabilitas kegagalan adalah , di mana adalah jumlah kegagalan. Dalam hal itu, , dan perhitungan untuk probabilitas yang diprediksi dari kegagalan pada 10.000 berikutnya adalah , menghasilkan , atau . (F+1)/(N+2)Fp^=9.9998×10061+1-pbinom(0, size=10000, prob=9.9998e-06)0.0951612210%


3
+1. Saya belum pernah mendengar tentang "aturan 3" sebelumnya. Saya ingin tahu apakah ada hubungan antara aturan 3 dan "aturan suksesi Laplace"? Menurut yang terakhir (jika saya menerapkannya dengan benar), probabilitas kegagalan dapat diperkirakan sebagai . 1/(N+2)
Amuba mengatakan Reinstate Monica

14
@amoeba Aturan 3 ini adalah batas kepercayaan satu sisi 95%. Asumsikan jumlah kegagalan memiliki distribusi Binomial . Maka peluang untuk tidak melihat kegagalan adalah . Untuk membuatnya lebih besar dari , pecahkan untuk . Menggunakan untuk kecil , solusinya adalah . Karena , kami memperoleh . Itulah "aturan 3." Perlu diketahui karena sekarang Anda tahu cara memvariasikan "3" jika Anda ingin menyesuaikan tingkat kepercayaan dan Anda juga dapat membalikkannya untuk menemukan minimum diperlukan untuk mendeteksi tingkat( 1 - p ) n 5 % ( 1 - p ) n0,05 p log ( 1 - p ) - p p p - log ( 0,05 ) / n 0,05 = 1 / 20 e 3 p 3 / n n p(n,p)(1p)n5%(1p)n0.05plog(1p)ppplog(0.05)/n0.05=1/20e3p3/nnp atau lebih besar.
whuber

1
@amoeba seperti yang saya sebutkan, saya mengambil seragam sebelum probabilitas kegagalan. Saya percaya bahwa prior yang berbeda akan menghasilkan hasil yang sangat berbeda.
Yair Daon

1
Hasil edit Anda adalah kemajuan yang baik (+1). Namun, hal itu menimbulkan masalah interpretasi. Kami tidak "yakin" peluangnya tidak lebih dari karena kami tidak sepenuhnya yakin akan peluang mendasar yang sebenarnya. Kami tidak memiliki "batas atas" pada , tetapi hanya batas kepercayaan atas. Saat Anda memberikan prediksi untuk acara mendatang, Anda perlu (a) memperkirakannya dan (b) memberikan batasan padanya. Lihatlah seperti ini: beri kami batasan pada ketika , secara independen, tergantung pada . Mereka batas adalah interval prediksi untuk berdasarkan .p Y X Binomial ( n , p ) Y Binomial ( m , p ) X = 0 Y X26%pYXBinomial(n,p)YBinomial(m,p)X=0YX
Whuber

2
Yay untuk "Aturan tiga". Saya kepalan melihatnya bertahun-tahun yang lalu dalam sebuah catatan singkat ke "Journal of American Medical Association" jama.jamanetwork.com/article.aspx?articleid=385438
DWin

25

Anda dapat mengambil pendekatan bayesian. menunjukkan probabilitas kegagalan oleh dan menganggapnya sebagai variabel acak. A priori, sebelum Anda melihat hasil percobaan, Anda mungkin percaya bahwa . Jika Anda memercayai para insinyur untuk membuat produk ini andal, mungkin Anda bisa mengambil atau lebih. Ini terserah kamu. Kemudian, Anda dapat menggunakan teorema Bayes untuk menghitung distribusi posterior . Mendenotasikan acara yang Anda telah mengamati ( percobaan dengan nol kegagalan).Θ U ( 0 , 1 ) Θ U ( 0 , 0.1 ) θ A nΘΘU(0,1)ΘU(0,0.1)θAn

Θp(θ)np(A|θ)nθ

p(Θ=θ|A)=p(A|Θ=θ)p(Θ=θ)p(A)=p(A|θ)p(θ)p(A|θ)p(θ)dθ.
Semuanya sederhana: seragam, jadi konstan. Karena Anda menjalankan percobaan, hanya probabilitas tidak ada kegagalan dalam percobaan bernouli dengan probabilitas kegagalan .Θp(θ)np(A|θ)nθ

Setelah Anda memiliki Anda adalah emas: Anda dapat menghitung probabilitas setiap peristiwa dengan integrasi:B P ( B ) = p ( B | θ ) p ( θ | A ) d θp(θ|A)BP(B)=p(B|θ)p(θ|A)dθ

Di bawah ini, saya bekerja melalui solusi terperinci, mengikuti pendekatan di atas. Saya akan mengambil beberapa cara pintas standar.

Biarkan yang sebelumnya menjadi . Kemudian: Konstanta normalisasi ditemukan - lihat halaman wikipedia fungsi beta dan distribusi beta . Jadi, , yang merupakan distribusi beta dengan parameter .p ( θ | A ) p ( A | θ ) 1 = ( 1 - θ ) n . p ( A ) = p ( A | θ ) p ( θ ) d θ B ( 1 , n + 1 ) p ( θ | A )U(0,1)

p(θ|A)p(A|θ)1=(1θ)n.
p(A)=p(A|θ)p(θ)dθB(1,n+1) 1,n+1p(θ|A)=(1θ)nB(1,n+1)1,n+1

Menyatakan probabilitas tidak ada kegagalan dalam produk di tahun depan oleh . Probabilitas setidaknya satu kegagalan adalah . Kemudian B 1 - P ( B ) 1 - P ( B ) = 1 - ( 1 - θ ) m ( 1 - θ ) nmB1P(B)

1P(B)=1(1θ)m(1θ)nB(1,n+1)dθ=B(1,n+m+1)B(1,n+1)

yang kira-kira , menggunakan . Tidak terlalu mengesankan? Saya mengambil distribusi yang seragam tentang kemungkinan kegagalan. Mungkin Anda memiliki keyakinan sebelumnya yang lebih baik pada insinyur Anda.n = 100 , 000 , m = 10 , 0000.1n=100,000,m=10,000


3
Tampaknya aneh untuk jatuh begitu pendek dari solusi aktual untuk masalah yang begitu sederhana, terutama ketika metode ini terlihat sangat menjanjikan. Apakah Anda menyarankan perhitungannya sulit?
whuber

2
@whuber saya tidak melupakannya, saya pikir langkah terakhir ini jelas. Apa yang saya maksud dengan "tidak menekan" adalah bahwa 10% kemungkinan kegagalan masih besar, jika dibandingkan dengan tidak ada kegagalan dalam 100.000 berjalan pertama. Juga, terima kasih atas komentar mengenai pasangan konjugasi, saya pikir itu akan membingungkan OP dan mengalihkan mereka dari apa yang penting, karenanya dihilangkan.
Yair Daon

3
Jelas, ya - tetapi ketika Anda berakhir dengan nilai 0,9, itulah jumlah yang akan dilihat orang, hampir tidak peduli apa yang Anda katakan tentang hal itu dalam teks sebelumnya. Agar Anda tidak disalahpahami, selalu membantu untuk secara eksplisit tentang jawaban yang Anda tawarkan. (+1 untuk jawaban yang ditingkatkan, BTW)
whuber

3
Memang, terlepas dari kepercayaan Anda pada insinyur Anda, itu tidak benar-benar sangat mengejutkan bahwa, jika Anda mengamati percobaan tanpa kegagalan, Anda harus rata-rata berharap tentang kegagalan dalam uji coba berikutnya , dan dengan demikian harus mengharapkan setidaknya satu kegagalan dengan probabilitas , yang kira-kira untuk kecil . Dengan demikian, 100.000 percobaan yang berhasil menghasilkan probabilitas sekitar 10% yang diharapkan dari setidaknya satu kegagalan dalam 10.000 percobaan berikutnya. k k n 1 - e - k k kn1kkn1ekkk
Ilmari Karonen

2
@whuber Asumsi Anda bahwa prior tidak masalah tidak benar dalam kasus zero-failure. Ini sangat tergantung pada kemiringan mendekati nol, misalnya prior seragam datar (beta 1,1) dan Jeffrey sebelum (beta 0,5, 0,5) akan memberikan posterior yang jauh berbeda.
Erik

12

Daripada menghitung probabilitas, mengapa tidak memprediksi berapa banyak produk yang gagal?

Membuat Model Pengamatan

Ada produk di lapangan dan sedang dipertimbangkan. Asumsikan kegagalan mereka semuanya independen dan konstan dengan probabilitas .m = 10.000 pn=100000m=10000p

Kami dapat memodelkan situasi ini dengan percobaan Binomial: di luar kotak tiket dengan proporsi yang tidak diketahui dari tiket "gagal" dan tiket "sukses" , menarik tiket (dengan penggantian, sehingga kemungkinan kegagalan tetap sama). Menghitung kegagalan di antara yang pertama tiket - biarkan itu menjadi --dan count kegagalan di antara sisa tiket, menyebut bahwa .1 - p m + n = 110000 n X m Yp1pm+n=110000nXmY

Membingkai Pertanyaan

Pada prinsipnya, dan bisa berupa apa saja. Apa yang kita tertarik adalah kesempatan yang diberikan bahwa (dengan sejumlah di ). Karena kegagalan dapat terjadi di mana saja di antara semua tiket , dengan setiap konfigurasi yang memungkinkan memiliki peluang yang sama, hal ini ditemukan dengan membagi jumlah -subjek hal-hal dengan jumlah subset dari semua hal-hal :0 Y m Y = u X + Y = u u { 0 , 1 , , m } n + m u m u n + m0Xn0YmY=u X+Y=uu{0,1,,m}n+mumun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

Rumus yang sebanding dapat digunakan untuk perhitungan ketikaX=1,2,.

Sebuah atas batas prediksi1α (UPL) untuk jumlah kegagalan pada mereka lalu tiket, , diberikan oleh terkecil (tergantung ) yang .mtα(X;n,m)uXp(u;n,m)α

Interpretasi

UPL harus ditafsirkan dalam hal risiko menggunakan , seperti yang dievaluasi sebelum atau diamati. Dengan kata lain, anggaplah itu satu tahun yang lalu dan Anda diminta untuk merekomendasikan prosedur untuk memprediksi jumlah kegagalan dalam produk berikutnya setelah pertama diamati. Klien Anda bertanyatαXYmn

Bagaimana kemungkinan prosedur Anda akan lebih rendah dari ? Saya tidak bermaksud di masa depan setelah Anda memiliki lebih banyak data; Maksud saya saat ini, karena saya harus membuat keputusan sekarang dan satu-satunya peluang saya akan tersedia bagi saya adalah orang-orang yang dapat dihitung pada saat ini. "Y

Respons Anda bisa,

Saat ini peluangnya tidak lebih besar dari , tetapi jika Anda berencana untuk menggunakan prediksi yang lebih kecil, peluangnya akan melebihi .αα

Hasil

Untuk , , dan kita dapat menghitungnyan=105m=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

Jadi, setelah mengamatiX=0 ,

  • Untuk hingga kepercayaan (yaitu, ketika ), prediksi ada paling banyak kegagalan dalam produk berikutnya .1α=90.9%9.1%αtα(0;n,m)=110,000

  • Untuk hingga kepercayaan (yaitu, ketika ), prediksi ada paling banyak kegagalan dalam produk berikutnya .99.2%0.8%α<9.1%tα(0;n,m)=210,000

  • Dll


Komentar

Kapan dan mengapa pendekatan ini berlaku? Misalkan perusahaan Anda membuat banyak produk yang berbeda. Setelah mengamati kinerja masing-masing di lapangan, ia suka menghasilkan jaminan, seperti "lengkap tanpa biaya penggantian setiap kegagalan dalam satu tahun." Dengan memiliki batas prediksi jumlah kegagalan Anda dapat mengontrol total biaya karena harus mendukung jaminan tersebut. Karena Anda membuat banyak produk, dan mengharapkan kegagalan disebabkan oleh keadaan acak di luar kendali Anda, pengalaman setiap produk akan independen. Masuk akal untuk mengendalikan risiko Anda dalam jangka panjangn. Sekali-sekali Anda mungkin harus membayar lebih banyak klaim daripada yang diharapkan, tetapi sebagian besar waktu Anda akan membayar lebih sedikit. Jika membayar lebih dari yang diumumkan dapat merusak, Anda akan menetapkan menjadi sangat kecil (dan Anda kemungkinan akan menggunakan model kegagalan yang lebih canggih juga!). Kalau tidak, jika biayanya kecil, maka Anda bisa hidup dengan kepercayaan rendah (high ). Perhitungan ini menunjukkan cara menyeimbangkan kepercayaan dan risiko.αα

Perhatikan bahwa kita tidak harus menghitung prosedur lengkap . Kami menunggu sampai diamati dan kemudian hanya melakukan perhitungan untuk tertentu (di sini, ), seperti yang ditunjukkan di atas. Namun pada prinsipnya, kami bisa melakukan perhitungan untuk semua nilai pada awalnya.tXXX=0X

Pendekatan Bayesian (dijelaskan dalam jawaban lain) menarik dan akan bekerja dengan baik asalkan hasilnya tidak terlalu bergantung pada sebelumnya. Sayangnya, ketika tingkat kegagalan sangat rendah sehingga sangat sedikit (atau tidak ada kegagalan) yang diamati, hasilnya sensitif terhadap pilihan sebelumnya.


+1, tetapi tampaknya tidak benar. p(0,n,m)=1
Amuba mengatakan Reinstate Monica

1
@COOLSerdash, karena , dan istilah untuk tidak sama dengan nol. up(u,n,m)=1u=1,2...
Amuba kata Reinstate Monica

1
Alasan Anda mendapatkan , seperti yang dicatat oleh @amoeba, adalah karena select sebenarnya bukan , melainkan (dan dengan demikian harus dilambangkan misalnya sebagai atau sesuatu seperti itu). Saya mengalami beberapa kesulitan untuk mengikuti persis apa yang Anda lakukan dengan itu nanti, tetapi saya cukup yakin bahwa, apa pun itu, sayangnya itu bukan solusi yang tepat untuk masalah yang ditanyakan. up(u;n,m)>1p(u;n,m)=(mu)(n+mu)Pr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)
Ilmari Karonen

1
@IlmariKaronen Terima kasih atas komentar Anda. Anda benar bahwa saya seharusnya mengkarakterisasi sedikit lebih jelas, karena ini bukan distribusi probabilitas atas itu adalah probabilitas bersyarat - tetapi saya yakin jawabannya sendiri tetap benar dan saya Saya sangat yakin bahwa pendekatan ini untuk menghitung batas prediksi benar dan konvensional. Saya akan mengedit posting ini untuk mengklarifikasi poin-poin ini. p(u;n,m)u
Whuber

1
@Ilmari Saya sudah membuat edit - Anda bisa melihatnya di histori edit. Saya menganggap tidak ada prior dan hanya menerapkan definisi interval prediksi untuk masalah ini. Jika Anda ingin menantang apakah itu "bermakna secara statistik," maka Anda akan mendapati diri Anda secara quixotically menantang konstruksi standar ini. Lihat, misalnya, Hahn & Meeker, Interval Statistik (J. Wiley 1991).
whuber

9

Berikut ini adalah jawaban Bayesian untuk "Dari 10.000 produk baru, berapa banyak yang diharapkan gagal jika semua 100.000 yang diproduksi sebelumnya tidak gagal?", Tetapi Anda harus mempertimbangkan sensitivitas terhadap berbagai harga.

Misalkan bersyarat bebas dan terdistribusi secara identik, diberikan , sehingga , dan menggunakan konjugat sebelumnya , dengan .X1,,XnΘ=θX1Θ=θBernoulli(θ)ΘBeta(a,b)a,b>0

Untuk , kita memiliki m<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

Untuk , kita memiliki di mana kami menggunakan .m+1in

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ΘX1=0,,Xm=0Beta(a,m+b)

Memasukkan angka-angka Anda, dengan seragam sebelumnya ( ) Anda mengharapkan tingkat kegagalan sekitar , sementara sebelumnya seperti Jeffreys ( ) memberi Anda tingkat kegagalan mendekati .a=1,b=110%a=1/2,b=1/25%

Harapan prediktif ini tidak terlihat seperti ringkasan yang baik, karena distribusi prediktif sangat condong. Kita bisa melangkah lebih jauh dan menghitung distribusi prediktif. Karena mengkondisikan seperti yang kita lakukan sebelum kita memiliki untuk .

i=m+1nXi|Θ=θBin(nm+2,θ),
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

Aku akan menyelesaikannya nanti komputasi prediksi interval.95%


3
+1 untuk menunjukkan bahwa hasilnya peka terhadap bentuk sebelum dekat 0. (Perlu dicatat bahwa, karena fungsi kemungkinan sangat terkonsentrasi di dekat nol ketika besar, itulah satu-satunya bagian dari sebelum yang benar-benar penting. Untuk contoh, untuk sebelumnya, ekspektasi kira-kira sebanding dengan , tetapi hampir independen dari . Demikian pula, untuk sebelumnya seragam, tidak terlalu penting apakah yang sebelumnya adalah atau , tetapi hal-hal akan berubah secara dramatis jika kita mengasumsikan sebelumnya seperti .)mBeta(a,b)am+a+bamabU(0,1)U(0,0.01)U(0.01,1)
Ilmari Karonen

6

Menggunakan pendekatan masalah matahari terbit Laplace , kami mendapatkan probabilitas bahwa suatu produk akan gagal dalam satu tahun . Selanjutnya, probabilitas bahwa dari produk baru tidak ada yang gagal dalam satu tahun adalah Oleh karena itu, probabilitas bahwa setidaknya satu produk akan gagal pada tahun berikutnya adalah Untuk nilainya adalah . Dalam kasus whuber , sebenarnya cukup tinggi.

p=1100000+1
n
(1p)n
n
1(11100001)n
n=10000P100000.095P2000000.87

Tentu saja, Anda harus terus memperbarui data Anda saat lebih banyak produk dijual, pada akhirnya satu akan gagal.


Jawaban ini tampaknya salah: perhitungan untuk satu matahari terbit di masa depan tidak meluas hanya melalui penggandaan. Lagi pula, anggaplah angka diganti dengan . Apakah Anda menegaskan probabilitas kegagalan adalah ?? Anda harus membandingkan jawaban Anda dengan analisis dalam jawaban Yair Daon dan komentar terkait. 10,000200,000200000/1000012
whuber

@whuber, perbaiki
Aksakal

1
(1) Entah Anda salah hitung atau "200000" Anda adalah kesalahan ketik untuk "20000". (Anda harus mendapatkan sekitar .) (2) Analisis Anda sekarang mereproduksi bagian dari kesimpulan Yair Daon, tetapi tanpa manfaat menghasilkan distribusi posterior penuh. 0.865
Whuber

@whuber, ya itu kurang satu nol
Aksakal

5

Beberapa jawaban yang baik diberikan untuk pertanyaan ini, tetapi baru-baru ini saya memiliki kesempatan untuk meninjau beberapa sumber pada topik ini dan jadi saya memutuskan untuk membagikan hasilnya.

Ada beberapa kemungkinan penaksir untuk data kegagalan nol. Mari kita menyatakan sebagai jumlah kegagalan dan sebagai ukuran sampel. Penaksir kemungkinan maksimum untuk kemungkinan kegagalan mengingat data ini adalahk=0n

(1)P(K=k)=kn=0

Perkiraan seperti itu agak tidak memuaskan karena fakta bahwa kami mengamati tidak ada kegagalan dalam sampel kami hampir tidak membuktikan bahwa mereka secara umum tidak mungkin. Pengetahuan out-of-data menunjukkan bahwa ada beberapa kemungkinan kegagalan bahkan jika tidak diamati (belum). Memiliki pengetahuan apriori menuntun kita untuk menggunakan metode Bayesian yang ditinjau oleh Bailey (1997), Razzaghi (2002), Basu et al (1996), dan Ludbrook dan Lew (2009).

Di antara penaksir sederhana "penilai atas" penaksir yang mengasumsikan (Bailey, 1997)

bahwa tidak akan logis untuk estimator untuk P dalam kasus nol-kegagalan untuk menghasilkan probabilitas lebih dari yang diprediksi oleh estimator kemungkinan maksimum dalam kasus satu-kegagalan, batas atas yang wajar

didefinisikan sebagai

(2)1n

bisa disebutkan. Sebagaimana ditinjau oleh Ludbrook dan Lew (2009), kemungkinan lain adalah "aturan bertiga" (lih. Di sini , Wikipedia , atau Eypasch et al, 1995)

(3)3n

atau variasi lain:

(4)3n+1

"rule of 3.7" oleh Newcombe dan Altman (atau oleh 3.6):

(5)3.7n

"aturan baru empat":

(6)4n+4

tetapi seperti yang disimpulkan oleh Ludbrook dan Lew (2009) "aturan bertiga" adalah "di samping tidak berguna" dan "aturan 3,6" (dan 3,7) "memiliki batasan serius - mereka sangat tidak akurat jika ukuran sampel awal kurang dari 50" dan mereka tidak merekomendasikan metode (3) - (6), menyarankan untuk menggunakan penduga Bayesian yang tepat (lihat di bawah).

Di antara penaksir Bayesian beberapa yang berbeda dapat disebutkan. Penaksir pertama seperti yang disarankan oleh Bailey (1997) adalah

(7)10.51n

untuk memperkirakan median di bawah seragam sebelumnya

(8)10.51n+1

atau untuk memperkirakan rata-rata di bawah sebelumnya

(9)1n+2

namun pendekatan lain dengan asumsi pola kegagalan eksponensial dengan tingkat kegagalan konstan (distribusi Poisson) menghasilkan

(10)1/3n

jika kita menggunakan beta sebelumnya dengan parameter dan kita dapat menggunakan rumus (lihat Razzaghi, 2002):bab

(11)aa+b+n

bahwa di bawah mengarah ke seragam sebelumnya (9). Dengan asumsi Jeffreys sebelumnya dengan itu mengarah kea = b = 0,5a=b=1a=b=0.5

(12)12(n+1)

Umumnya, formula Bayesian (7) - (12) direkomendasikan. Basu et al (1996) merekomendasikan (11) dengan informatif sebelumnya, ketika beberapa pengetahuan a priori tersedia. Karena tidak ada metode terbaik yang ada saya sarankan meninjau literatur sebelum analisis Anda, terutama ketika kecil.n


Bailey, RT (1997). Estimasi dari data nol-kegagalan. Analisis Risiko, 17 , 375-380.

Razzaghi, M. (2002). Pada estimasi probabilitas keberhasilan binomial dengan nol kejadian dalam sampel. Jurnal Metode Statistik Terapan Modern, 1 (2), 41.

Ludbrook, J., & Lew, MJ (2009). Memperkirakan risiko komplikasi langka: apakah 'aturan tiga' cukup baik ?. Jurnal operasi ANZ, 79 (7-8), 565-570.

Eypasch, E., Lefering, R., Kum, CK, dan Troidl, H. (1995). Kemungkinan kejadian buruk yang belum terjadi: Pengingat statistik. BMJ 311 (7005): 619–620.

Basu, AP, Gaylor, DW, & Chen, JJ (1996). Memperkirakan kemungkinan terjadinya tumor untuk kanker langka dengan nol kejadian dalam sampel. Toksikologi dan Farmakologi Regulasi, 23 (2), 139-144.


1
Ulasan yang sangat baik tentang apa yang ada di luar sana!
AlefSin

Untuk komentar yang dimulai dengan "Di antara penaksir Bayesian beberapa ...", umumnya tidak jelas apakah komentar yang diberikan berkaitan dengan rumus di atasnya atau di bawahnya. Bisakah Anda membuatnya lebih jelas?
gung - Reinstate Monica

2

Anda benar-benar harus kembali ke perancang produk Anda. Ini adalah masalah teknik mendasar bukan masalah statistik observasional. Mereka akan memiliki gagasan tentang probabilitas kegagalan masing-masing komponen dan dari itu probabilitas kegagalan bersih dari total produk yang dirakit. Mereka dapat memberi Anda jumlah kegagalan yang diharapkan selama seluruh umur desain produk.

Seorang insinyur sipil merancang jembatan untuk memiliki umur desain 120 tahun. Setiap komponen jembatan memiliki sedikit kemungkinan gagal. Setiap pemuatan memiliki sedikit peluang terlampaui. Untuk membuat jembatan ekonomis untuk dibangun, keruntuhan total hanya akan terjadi sekali dalam 2400 tahun yang jauh lebih lama dari jembatan yang akan dipertahankan. Tidak mengherankan bahwa jembatan tidak gagal pada tahun 1, atau tahun 2 hingga tahun 120. Itu belum runtuh hanya memberi tahu Anda sedikit. Berbagai kemungkinan kegagalan seiring waktu hanya dapat diperkirakan oleh para desainer asli.


0

Ini mirip dengan masalah yang saya hadapi ketika kami memperkenalkan proses manufaktur baru untuk menghilangkan kegagalan dalam produksi.

Sistem baru tidak menghasilkan kegagalan sehingga orang mengajukan pertanyaan yang sama: bagaimana kita memprediksi tingkat kegagalan? Dalam kasus Anda, karena Anda telah menetapkan periode di mana kegagalan dapat terjadi tanpa mempedulikan kapan kegagalan terjadi dalam periode itu, efek temporal telah dihapus. Dan itu hanyalah kasus apakah sesuatu gagal atau tidak. Dengan itu ditentukan - terus dengan jawaban saya.

Secara intuitif, tampaknya kita membutuhkan setidaknya satu kegagalan untuk dapat menghitung tingkat kegagalan. Namun, asumsi ini memiliki kesalahan implisit di dalamnya. Kami tidak akan pernah menghitung tingkat kegagalan. Itu karena kita berurusan dengan sampel. Jadi kita hanya bisa memperkirakan kisaran tingkat kegagalan yang mungkin terjadi. Cara untuk melakukan ini adalah menemukan distribusi untuk tingkat kegagalan. Distribusi yang melakukan pekerjaan dalam hal ini adalah distribusi Beta di mana parameternya adalah: α = n + 1 dan β = N - n + 1

Catatan: N adalah ukuran sampel dan n adalah jumlah kegagalan (dalam kasus Anda 0)

Untuk skenario Anda, distribusi tingkat kegagalan ditunjukkan di bawah ini. masukkan deskripsi gambar di sini .

Anda kemudian akan memasukkan distribusi itu ke formula probabilitas binomial masing-masing untuk mendapatkan distribusi untuk probabilitas satu unit gagal (bisa dilakukan secara analitis atau menggunakan Monte Carlo). Saya menduga bahwa jumlahnya akan sangat rendah.

Perhatikan bahwa proses ini berlaku terlepas dari jumlah kegagalan dalam set kepalan tangan Anda.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.