Apa distribusi kesalahan di sekitar data pertumbuhan logistik?

Dalam ekologi, kita sering menggunakan persamaan pertumbuhan logistik:

N_{t} = \frac{K N_{0} e^{r t}}{K + N_{0} e^{r t - 1}}

$N_t = \frac{ K N_0 e^{rt} }{K + N_0 e^{rt-1}}$

atau

N_{t} = \frac{K N_{0}}{N_{0} + (K - N_{0}) e^{- r t}}

$N_t = \frac{ K N_0}{N_0 + (K -N_0)e^{-rt}}$

di mana adalah daya dukung (kepadatan maksimum tercapai), adalah kepadatan awal, adalah tingkat pertumbuhan, adalah waktu sejak awal. $K$ $N_0$ $r$ $t$

Nilai memiliki batas atas lunak dan batas bawah , dengan batas bawah yang kuat pada . $N_t$ $(K)$ $(N_0)$ $0$

Lebih jauh lagi, dalam konteks spesifik saya, pengukuran dilakukan dengan menggunakan kerapatan optik atau fluoresensi, yang keduanya memiliki maksimum teoretis, dan dengan demikian merupakan batas atas yang kuat. $N_t$

Kesalahan di sekitar mungkin paling baik dijelaskan oleh distribusi terbatas. $N_t$

Pada nilai kecil , distribusi mungkin memiliki kemiringan positif yang kuat, sedangkan pada nilai mendekati K, distribusi mungkin memiliki kemiringan negatif yang kuat. Distribusi dengan demikian mungkin memiliki parameter bentuk yang dapat dihubungkan ke . $N_t$ $N_t$ $N_t$

Varians juga dapat meningkat dengan . $N_t$

Berikut adalah contoh grafisnya

masukkan deskripsi gambar di sini

dengan

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

yang dapat diproduksi sesuai dengan

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")

Apa yang akan menjadi distribusi kesalahan teoretis di sekitar (dengan mempertimbangkan model dan informasi empiris yang diberikan)? $N_t$
Bagaimana parameter distribusi ini berhubungan dengan nilai atau waktu (jika menggunakan parameter, mode tidak dapat secara langsung dikaitkan dengan mis. normal)? $N_t$ $N_t$
Apakah distribusi ini memiliki fungsi kerapatan yang diimplementasikan dalam ? $R$

Petunjuk yang dieksplorasi sejauh ini:

Dengan asumsi normalitas di sekitar (mengarah ke lebih dari perkiraan ) $N_t$ $K$
Logit distribusi normal sekitar , tetapi kesulitan dalam menyesuaikan parameter bentuk alpha dan beta $N_t/max$
Distribusi normal di sekitar logika $N_t/max$

r distributions pdf ecology

— Etienne Low-Décarie
sumber

Dengan berfokus pada distribusi kesalahan, pertanyaan ini mencerminkan pemikiran canggih tentang suatu model, tetapi harap dicatat bahwa distribusi kesalahan untuk bentuk fungsional tidak harus memiliki hubungan apa pun dengan formulir itu sendiri. Bahan-bahan dari jawaban yang valid sebaliknya dapat ditemukan dalam informasi tentang bagaimana pertumbuhan terjadi, tentang variasi alami dalam dan dari waktu ke waktu (yang tentu akan diserap dalam kesalahan), tentang kemungkinan mis-spesifikasi model, dan bagaimana ( dan ) diukur.

K

$K$

r

$r$

N_{t}

$N_t$

t

$t$

— Whuber

@whuber, saya mencoba membahas beberapa komentar Anda dalam edit terbaru.

— Etienne Low-Décarie

5 berpikir bahwa jika Anda dapat mengkarakterisasi properti dari distribusi noise seperti yang Anda miliki maka Anda dapat memilih bentuk parametrik dengan properti tersebut. Saya pikir untuk meringkas keluarga harus 1. didefinisikan pada interval terbatas, 2. memungkinkan condong ke kiri, condong ke kanan dan simetri. dan 3. memiliki varian yang meningkat dengan meningkatnya Nt. Distribusi beta sesuai dengan tagihan untuk 1 dan 2. Interval tetap adalah [0, 1]. Jadi untuk memungkinkan varians meningkat kita bisa menambahkan parameter c yang menyebarkan distribusi ke intervsl [0, c].

— Michael R. Chernick

Jawaban:

Seperti yang ditunjukkan Michael Chernick, distribusi beta berskala sangat sesuai untuk hal ini. Namun, untuk semua tujuan praktis, dan berharap Anda TIDAK PERNAHdapatkan model dengan benar, Anda akan lebih baik hanya memodelkan mean melalui regresi nonlinier sesuai dengan persamaan pertumbuhan logistik Anda dan membungkusnya dengan kesalahan standar yang kuat untuk heteroskedastisitas. Menempatkan ini dalam konteks kemungkinan maksimum akan menciptakan perasaan keliru yang sangat akurat. Jika teori ekologi menghasilkan distribusi, Anda harus sesuai dengan distribusi itu. Jika teori Anda hanya menghasilkan prediksi untuk mean, Anda harus tetap berpegang pada interpretasi ini dan jangan mencoba untuk menghasilkan sesuatu yang lebih dari itu, seperti distribusi penuh. (Sistem kurva Pearson sangat disukai 100 tahun yang lalu, tetapi proses acak tidak mengikuti persamaan diferensial untuk menghasilkan kurva kepadatan, yang merupakan motivasinya dengan kurva kepadatan ini - lebih tepatnya, $N_t$ sendiri - Saya berpikir tentang distribusi Poisson sebagai contoh - dan saya tidak sepenuhnya yakin bahwa efek ini akan ditangkap oleh distribusi beta berskala; sebaliknya, akan dikompres ketika Anda menarik rata-rata menuju batas atas teoretisnya, yang mungkin harus Anda lakukan. Jika perangkat pengukuran Anda memiliki batas atas pengukuran, itu tidak berarti bahwa proses Anda sebenarnyaharus memiliki batas atas; Saya lebih suka mengatakan bahwa kesalahan pengukuran yang diperkenalkan oleh perangkat Anda menjadi kritis ketika proses mencapai batas atas yang diukur secara akurat. Jika Anda mengacaukan pengukuran dengan proses yang mendasarinya, Anda harus mengenalinya secara eksplisit, tetapi saya akan membayangkan Anda memiliki minat yang lebih besar pada proses tersebut daripada dalam menjelaskan cara kerja perangkat Anda. (Prosesnya akan ada 10 tahun dari sekarang; perangkat pengukuran baru mungkin tersedia, sehingga pekerjaan Anda akan menjadi usang.)

— Tugas
sumber

Terima kasih banyak! Saya setuju bahwa pemisahan proses dan ukuran itu menarik. Namun saya akan menyarankan bahwa sebagian besar metode pengukuran memiliki batas atas yang kuat ini, tetapi mungkin penting untuk mengisolasi ini. Jika saya harus menggunakan beta berskala, terlepas dari peringatan Anda tentang kepercayaan pas MLE, ada saran tentang bagaimana menghubungkan parameter bentuk ke sistem ini dengan memodelkan variabel agar MLE?

— Etienne Low-Décarie

Jika Anda yakin bahwa batasan Anda sangat penting dalam aplikasi Anda, Anda bisa tetap menggunakan beta skala ini. Yang saya katakan adalah bahwa saya tidak yakin. Ada model untuk data terpotong, di mana yang Anda tahu adalah bahwa nilai aktual melebihi maksimum yang dapat Anda ukur; mereka kadang-kadang digunakan bersama-sama dengan pengkodean atas pendapatan, sedangkan untuk alasan kerahasiaan pendapatan lebih besar dari katakanlah USD 100 ribu / tahun dipotong menjadi USD 100 ribu / tahun.

— Tugas

@whuber benar bahwa tidak ada hubungan yang diperlukan dari bagian struktural model ini dengan distribusi istilah kesalahan. Jadi tidak ada jawaban untuk pertanyaan Anda untuk distribusi kesalahan teoretis.

Ini tidak berarti bahwa itu bukan pertanyaan yang bagus - hanya saja jawabannya harus sebagian besar bersifat empiris.

Anda tampaknya berasumsi bahwa keacakan itu aditif. Saya tidak melihat alasan (selain kenyamanan komputasi) untuk hal ini. Apakah ada alternatif bahwa ada elemen acak di tempat lain dalam model? Sebagai contoh, lihat berikut ini, di mana keacakan diperkenalkan sebagai Biasanya terdistribusi dengan rata-rata 1, varians satu-satunya hal untuk memperkirakan. Saya tidak punya alasan untuk berpikir ini adalah hal yang benar untuk dilakukan selain dari itu menghasilkan hasil yang masuk akal yang tampaknya cocok dengan apa yang ingin Anda lihat. Apakah akan praktis untuk menggunakan sesuatu seperti ini sebagai dasar untuk memperkirakan model yang saya tidak tahu.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

masukkan deskripsi gambar di sini

— Peter Ellis
sumber

Dalam hal ini, Anda bisa memiliki nilai Nt di bawah nol dan di atas batas atas yang keras. Lebih lanjut, noise diharapkan dalam semua parameter (tidak harus dalam produk parameter dengan waktu), maka noise pada variabel respon. Saya masih akan tertarik pada interpretasi kemungkinan maksimum dari pendekatan Anda.

— Etienne Low-Décarie

Ini tidak memungkinkan distribusi dibatasi untuk masing-masing Nt dan tidak memungkinkan komponen noise menjadi miring. Saya tidak tahu apakah ide saya tentang distribusi beta berskala telah digunakan dalam literatur tetapi memenuhi batasan dengan baik. Saya belum mencobanya tetapi mungkin kemungkinan maksimum dapat dicoba. Saya tidak yakin tapi mungkin akan ada masalah jika c dimasukkan dalam estimasi kemungkinan. Mungkin c dapat diestimasi secara terpisah hanya berdasarkan Nt dan kemudian sisa model dapat disesuaikan dengan kemungkinan maksimum untuk setiap Nt tetap.

— Michael R. Chernick

Saya hanya berpikir keras. Adakah yang mengira masalah ini bisa dijadikan makalah penelitian yang bagus?

— Michael R. Chernick

Sebuah makalah dari tahun 1966 memang sedikit meneliti hal ini, namun saya belum melihat satu lagi. Saya mungkin hal telah berubah sejak itu? jstor.org/discover/10.2307/…

— Etienne Low-Décarie

Tolong beri tahu saya jika Anda memutuskan untuk pergi dengan rute ini.

— Etienne Low-Décarie