Perkiraan ML dari distribusi eksponensial (dengan data yang disensor)

Dalam Analisis Kelangsungan Hidup, Anda menganggap waktu kelangsungan hidup rv untuk didistribusikan secara eksponensial. Mempertimbangkan sekarang bahwa saya memiliki "hasil" dari iid rv's . Hanya sebagian dari hasil ini yang sebenarnya "sepenuhnya terwujud", yaitu pengamatan yang tersisa masih "hidup". $X_i$ $x_1,\dots,x_n$ $X_i$

Jika saya ingin melakukan estimasi ML untuk parameter tingkat dari distribusi, bagaimana saya bisa menggunakan pengamatan yang tidak disadari dengan cara yang koheren / tepat? Saya percaya mereka masih mengandung informasi yang berguna untuk estimasi. $\lambda$

Bisakah seseorang membimbing saya ke literatur tentang topik ini? Saya yakin itu ada. Namun saya kesulitan menemukan kata kunci / istilah pencarian yang bagus untuk topik tersebut.

— Guy yang baik, Mike
sumber

Jadi, Anda mengatakan bahwa dari

variabel acak yang Anda ukur, katakanlah

pengamatan mewakili "waktu penyelesaian" (karena, variabel acak yang terkait "mati" pada waktu pengukuran), sedangkan sisanya

pengamatan apakah panjang kelangsungan hidup dari variabel acak yang "masih hidup" pada saat pengukuran? (

)

n

$n$

n_{1} < n

$n_1 < n$

n_{2} < n

$n_2 <n$

n_{1} + n_{2} = n

$n_1+n_2 = n$

— Alecos Papadopoulos

ini adalah model terpotong, variabel acak "hidup" terpotong pada saat pengamatan berhenti.

— Xi'an

Lihat model Tobit untuk data terpotong dan sumber terkait (misalnya di sini ).

— Richard Hardy

Anda tampaknya memiliki data tersensor, seperti kehidupan, di mana beberapa orang meninggal, tetapi beberapa masih hidup, taht seperti Anda hanya tahu bahwa, katakanlah,

untuk beberapa konstan dikenal

x_{i} > t_{i}

$x_i > t_i$

t_{i}

$t_i$

— kjetil b halvorsen

Waspadalah terhadap perbedaan yang terkadang kentara antara kedua situasi. Tidak jarang pemotongan menjadi bingung untuk menyensor, dan sebaliknya.

— Alecos Papadopoulos

Anda masih dapat memperkirakan parameter dengan menggunakan kemungkinan secara langsung. Biarkan pengamatan menjadi dengan distribusi eksponensial dengan laju dan tidak diketahui. Fungsi kerapatan adalah , fungsi distribusi kumulatif dan fungsi ekor $x_1, \dots, x_n$ $\lambda>0$ $f(x;\lambda)= \lambda e^{-\lambda x}$ $F(x;\lambda)=1-e^{-\lambda x}$ . Asumsikan pengamatanpertamasepenuhnya diamati, sedangkan untuk kita hanya tahu bahwa untuk beberapa konstanta positif yang diketahui . Seperti biasa, kemungkinannya adalah "probabilitas data yang diamati", untuk pengamatan yang disensor, yang diberikan oleh $G(x;\lambda)=1-F(x;\lambda) = e^{-\lambda x}$ $r$ $x_{r+1}, \dots, x_n$ $x_j > t_j$ $t_j$ , jadi fungsi kemungkinan penuh adalah Loglikelihood fungsi kemudian menjadi $P(X_j > t_j) = G(t_j;\lambda)$

L (λ) = \prod_{i = 1}^{r} f (x_{i}; λ) \cdot \prod_{i = r + 1}^{n} G (t_{j}; λ)

$L(\lambda) = \prod_{i=1}^r f(x_i;\lambda) \cdot \prod_{i=r+1}^n G(t_j;\lambda)$

yang memiliki bentuk yang sama dengan kemungkinan log untuk kasus yang diamati secara penuh, kecuali dari istilah

sebagai ganti

. Menulis

untuk rata-rata observasi dan menyensor kali, estimator maksimum kemungkinan

menjadi

l (λ) = r \log λ - λ (x_{1} + \dots + x_{r} + t_{r + 1} + \dots + t_{n})

$l(\lambda) = r\log\lambda -\lambda(x_1+\dots+x_r+t_{r+1}+\dots+ t_n)$

r \log λ

$r\log\lambda$

n \log λ

$n\log\lambda$

T

$T$

λ

$\lambda$

, yang Anda sendiri dapat membandingkannya dengan kasus yang diamati sepenuhnya.

\hat{λ} = \frac{r}{n T}

$\hat{\lambda}=\frac{r}{nT}$

 EDIT

$r=0$

l (λ) = - n T λ

$l(\lambda) = -nT \lambda$

λ

$\lambda$

λ = 0

$\lambda=0$

λ

$\lambda$

λ

$\lambda$

Tetapi, bagaimanapun, kesimpulan nyata dari data dalam kasus itu adalah bahwa kita harus menunggu lebih banyak waktu sampai kita mendapatkan beberapa peristiwa ...

$\lambda$ $e^{-\lambda n T}$ $p^n$ $p$ $[\underset{\bar{}}{p}, 1]$ $\lambda$ $\log p = -\lambda T$

$p$

P (X = n) = p^{n} \geq 0.95 (say)

$P(X=n) = p^n \ge 0.95 ~~~~\text{(say)}$

n \log p \geq \log 0.95

$n\log p \ge \log 0.95$

λ

$\lambda$

λ \leq \frac{- \log 0.95}{n T} .

$\lambda \le \frac{-\log 0.95}{n T}.$

— kjetil b halvorsen
sumber

x_{j} > t_{j}

$x_j > t_j$