Ketika saya memperkirakan jalan acak dengan AR (1), koefisiennya sangat dekat dengan 1 tetapi selalu kurang.
Apa alasan matematika bahwa koefisiennya tidak lebih besar dari satu?
Ketika saya memperkirakan jalan acak dengan AR (1), koefisiennya sangat dekat dengan 1 tetapi selalu kurang.
Apa alasan matematika bahwa koefisiennya tidak lebih besar dari satu?
Jawaban:
Kami memperkirakan dengan OLS model
Untuk sampel ukuran T, estimatornya adalah
Ini kadang-kadang disebut distribusi "Dickey-Fuller", karena ini adalah dasar untuk nilai-nilai kritis yang digunakan untuk melakukan tes Unit-Root dengan nama yang sama.
Saya tidak ingat melihat upaya untuk memberikan intuisi untuk bentuk distribusi sampling. Kami melihat distribusi sampling dari variabel acak
Jika kami menjumlahkan Norma Produk independen kami mendapatkan distribusi yang tetap simetris di sekitar nol. Sebagai contoh:
Tetapi jika kita menjumlahkan Normal Produk yang tidak independen seperti kasus kita, kita dapatkan
yang condong ke kanan tetapi dengan massa probabilitas lebih dialokasikan untuk nilai-nilai negatif. Dan massa tampak semakin terdorong ke kiri jika kita menambah ukuran sampel dan menambahkan lebih banyak elemen yang berkorelasi dengan jumlah.
Kebalikan dari jumlah Gammas non-independen adalah variabel acak non-negatif dengan kemiringan positif.
Ini sebenarnya bukan jawaban tetapi terlalu lama untuk komentar, jadi saya tetap memposting ini.
Saya bisa mendapatkan koefisien lebih besar dari 1 dua kali dari seratus untuk ukuran sampel 100 (menggunakan "R"):
N=100 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~y[-T]) # regress y on its own first lag, with intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1
Realisasi 84 dan 95 memiliki koefisien di atas 1, sehingga tidak selalu di bawah satu. Namun, kecenderungannya jelas memiliki estimasi bias ke bawah. Pertanyaannya tetap, mengapa ?
Sunting: regresi di atas termasuk istilah intersepsi yang tampaknya tidak termasuk dalam model. Setelah intersep dihapus, saya mendapatkan lebih banyak perkiraan di atas 1 (3158 dari 10.000) - tetapi masih jelas di bawah 50% dari semua kasus:
N=10000 # number of trials
T=100 # length of time series
coef=c()
for(i in 1:N){
set.seed(i)
x=rnorm(T) # generate T realizations of a standard normal variable
y=cumsum(x) # cumulative sum of x produces a random walk y
lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1