Derivasi transformasi normalisasi untuk GLM


15

Bagaimana A ( ) = d uV 1 / 3 ( μ )A()=duV1/3(μ) transformasi normalisasi untuk keluarga eksponensial berasal?

Lebih khusus : Saya mencoba mengikuti sketsa ekspansi Taylor di halaman 3, geser 1 di sini tetapi memiliki beberapa pertanyaan. Dengan XX dari keluarga eksponensial, transformasi h ( X )h(X) , dan κ iκi menunjukkan kumulatif i t hith , slide berpendapat bahwa: κ 3 ( h ( ˉ X ) ) h ( μ ) 3 κ 3 ( ˉ X )N 2 +3jam(μ)2jam(μ)σ4N+O(N3),

κ3(h(X¯))h(μ)3κ3(X¯)N2+3h(μ)2h′′(μ)σ4N+O(N3),
dan tetap saja menemukan h(X)h(X) sedemikian rupa sehingga nilai di atas bernilai 0.
  1. Pertanyaan pertama saya adalah tentang aritmatika: ekspansi Taylor saya memiliki koefisien yang berbeda, dan saya tidak dapat membenarkan mereka telah menjatuhkan banyak istilah.

    Since h(x)h(μ)+h(μ)(xμ)+h(x)2(xμ)2, we have:h(ˉX)h(u)h(u))(ˉXμ)+h(x)2(ˉXμ)2E(h(ˉX)h(u))3h(μ)3E(ˉXμ)3+32h(μ)2h(μ)E(ˉXμ)4+34h(μ)h(μ)2E(ˉXμ)5+18h(μ)3E(ˉXμ)6.

    Since h(x)h(X¯)h(u)E(h(X¯)h(u))3h(μ)+h(μ)(xμ)+h′′(x)2(xμ)2, we have:h(u))(X¯μ)+h′′(x)2(X¯μ)2h(μ)3E(X¯μ)3+32h(μ)2h′′(μ)E(X¯μ)4+34h(μ)h′′(μ)2E(X¯μ)5+18h′′(μ)3E(X¯μ)6.

    Saya bisa mendapatkan sesuatu yang serupa dengan mengganti momen-momen sentral dengan ekuivalen kumulansinya, tetapi masih belum cocok.

  2. Pertanyaan kedua: mengapa analisis dimulai dengan ˉXX¯ alih-alih XX , kuantitas yang benar-benar kita pedulikan?


Anda tampaknya memiliki uu beberapa kali di mana yang Anda maksud μμ
Glen_b -Reinstate Monica

Jawaban:


2

Slide yang Anda tautkan agak membingungkan, meninggalkan langkah-langkah dan membuat beberapa kesalahan ketik, tetapi akhirnya benar. Ini akan membantu menjawab pertanyaan 2 terlebih dahulu, kemudian 1, dan akhirnya mendapatkan transformasi yang simetri .A(u)=u1[V(θ)]1/3dθA(u)=u1[V(θ)]1/3dθ

Pertanyaan 2. Kami menganalisis karena rerata sampel ukuran dari variabel acak iid . Ini adalah jumlah yang penting karena mengambil sampel distribusi yang sama dan mengambil mean terjadi sepanjang waktu dalam sains. Kami ingin tahu seberapa dekat dengan rata-rata sebenarnya . Teorema Limit Pusat mengatakan akan konvergen ke sebagai tetapi kami ingin mengetahui varians dan kemiringan dari .ˉXX¯NNX1,...,XNX1,...,XNˉXX¯μμμμNNˉXX¯

Pertanyaan 1. Perkiraan deret Taylor Anda tidak salah, tetapi kami harus berhati-hati dalam melacak vs. dan kekuatan untuk mendapatkan kesimpulan yang sama dengan slide. Kami akan mulai dengan definisi dan momen pusat dan mendapatkan rumus untuk :ˉXX¯XiXiNNˉXX¯XiXiκ3(h(ˉX))κ3(h(X¯))

ˉX=1NNi=1XiX¯=1NNi=1Xi

E[Xi]=μE[Xi]=μ

V(Xi)=E[(Xiμ)2]=σ2V(Xi)=E[(Xiμ)2]=σ2

κ3(Xi)=E[(Xiμ)3]κ3(Xi)=E[(Xiμ)3]

Sekarang, momen utama :ˉXX¯

E[ˉX]=1NNi=1E[Xi]=1N(Nμ)=μE[X¯]=1NNi=1E[Xi]=1N(Nμ)=μ

V(ˉX)=E[(ˉXμ)2]=E[((1NNi=1Xi)μ)2]=E[(1NNi=1(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2V(X¯)=E[(X¯μ)2]=E[((1Ni=1NXi)μ)2]=E[(1Ni=1N(Xiμ))2]=1N2(NE[(Xiμ)2]+N(N1)E[Xiμ]E[Xjμ])=1Nσ2

Langkah terakhir mengikuti sejak , dan . Ini mungkin bukan turunan paling mudah dari , tetapi ini adalah proses yang sama yang perlu kita lakukan untuk menemukan dan , di mana kami memecah produk penjumlahan dan menghitung jumlah istilah dengan kekuatan variabel yang berbeda. Dalam kasus di atas, ada istilah yang berbentuk dan syarat bentuk .E[Xiμ]=0E[Xiμ]=0E[(Xiμ)2]=σ2E[(Xiμ)2]=σ2V(ˉX)V(X¯)κ3(ˉX)κ3(X¯)κ3(h(ˉX))κ3(h(X¯))NN(Xiμ)2(Xiμ)2N(N1)N(N1)(Xiμ)(Xjμ)(Xiμ)(Xjμ)

κ3(ˉX)=E[(ˉXμ)3)]=E[((1NNi=1Xi)μ)3]=E[(1NNi=1(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2κ3(X¯)=E[(X¯μ)3)]=E[((1Ni=1NXi)μ)3]=E[(1Ni=1N(Xiμ))3]=1N3(NE[(Xiμ)3]+3N(N1)E[(Xiμ)E[(Xjμ)2]+N(N1)(N2)E[(Xiμ)]E[(Xjμ)]E[(Xkμ)]=1N2E[(Xiμ)3]=κ3(Xi)N2

Selanjutnya, kami akan memperluas dalam seri Taylor seperti yang Anda miliki:h(ˉX)h(X¯)

h(ˉX)=h(μ)+h(μ)(ˉXμ)+12h(μ)(ˉXμ)2+13h(μ)(ˉXμ)3+...h(X¯)=h(μ)+h(μ)(X¯μ)+12h′′(μ)(X¯μ)2+13h′′′(μ)(X¯μ)3+...

E[h(ˉX)]=h(μ)+h(μ)E[ˉXμ]+12h(μ)E[(ˉXμ)2]+13h(μ)E[(ˉXμ)3]+...=h(μ)+12h(μ)σ2N+13h(μ)κ3(Xi)N2+...E[h(X¯)]=h(μ)+h(μ)E[X¯μ]+12h′′(μ)E[(X¯μ)2]+13h′′′(μ)E[(X¯μ)3]+...=h(μ)+12h′′(μ)σ2N+13h′′′(μ)κ3(Xi)N2+...

Dengan sedikit usaha lagi Anda dapat membuktikan bahwa istilah lainnya adalah . Akhirnya, karena , (yang tidak sama dengan ), kami kembali membuat perhitungan yang serupa:O(N3)O(N3)κ3(h(ˉX))=E[(h(ˉX)E[h(ˉX)])3]κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]E[(h(ˉX)h(μ))3]E[(h(X¯)h(μ))3]

κ3(h(ˉX))=E[(h(ˉX)E[h(ˉX)])3]=E[(h(μ)+h(μ)(ˉXμ)+12h(μ)(ˉXμ)2+O((ˉXμ)3)h(μ)12h(μ)σ2NO(N2))3]κ3(h(X¯))=E[(h(X¯)E[h(X¯)])3]=E[(h(μ)+h(μ)(X¯μ)+12h′′(μ)(X¯μ)2+O((X¯μ)3)h(μ)12h′′(μ)σ2NO(N2))3]

Kami hanya tertarik pada istilah yang menghasilkan urutan , dan dengan kerja ekstra Anda dapat menunjukkan bahwa Anda tidak memerlukan istilah " "atau" "sebelum mengambil kekuatan ketiga, karena mereka hanya akan menghasilkan syarat pemesanan . Jadi, mempermudah, kita dapatkanO(N2)O(N2)O((ˉXμ)3)O((X¯μ)3)O(N2)O(N2)O(N3)O(N3)

κ3(h(ˉX))=E[(h(μ)(ˉXμ)+12h(μ)(ˉXμ)212h(μ)σ2N))3]=E[h(μ)3(ˉXμ)3+18h(μ)3(ˉXμ)618h(μ)3σ6N3+32h(μ)2h(μ)(ˉXμ)4+34h(μ)h(μ)(ˉXμ)532h(μ)2h(μ)(ˉXμ)2σ2N+O(N3)]κ3(h(X¯))=E[(h(μ)(X¯μ)+12h′′(μ)(X¯μ)212h′′(μ)σ2N))3]=E[h(μ)3(X¯μ)3+18h′′(μ)3(X¯μ)618h′′(μ)3σ6N3+32h(μ)2h′′(μ)(X¯μ)4+34h(μ)h′′(μ)(X¯μ)532h(μ)2h′′(μ)(X¯μ)2σ2N+O(N3)]

Saya mengabaikan beberapa istilah yang jelas-jelas dalam produk ini. Anda harus meyakinkan diri sendiri bahwa istilah dan adalah juga. Namun,O(N3)O(N3)E[(ˉXμ)5]E[(X¯μ)5]E[(ˉXμ)6]E[(X¯μ)6]O(N3)O(N3)

E[(ˉXμ)4]=E[1N4(Ni=1(ˉXμ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)E[(X¯μ)4]=E[1N4(i=1N(X¯μ))4]=1N4(NE[(Xiμ)4]+3N(N1)E[(Xiμ)2]E[(Xjμ)2]+0)=3N2σ4+O(N3)

Kemudian mendistribusikan ekspektasi pada persamaan kami untuk , kami memilikiκ3(h(ˉX))κ3(h(X¯))

κ3(h(ˉX))=h(μ)3E[(ˉXμ)3]+32h(μ)2h(μ)E[(ˉXμ)4]32h(μ)2h(μ)E[(ˉXμ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h(μ)σ4N232h(μ)2h(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2+O(N3)κ3(h(X¯))=h(μ)3E[(X¯μ)3]+32h(μ)2h′′(μ)E[(X¯μ)4]32h(μ)2h′′(μ)E[(X¯μ)2]σ2N+O(N3)=h(μ)3κ3(Xi)N2+92h(μ)2h′′(μ)σ4N232h(μ)2h′′(μ)σ4N2+O(N3)=h(μ)3κ3(Xi)N2+3h(μ)2h′′(μ)σ4N2+O(N3)

Ini menyimpulkan derivasi dari . Sekarang, akhirnya, kita akan menurunkan transformasi simetri .κ3(h(ˉX))κ3(h(X¯))A(u)=u1[V(θ)]1/3dθA(u)=u1[V(θ)]1/3dθ

Untuk transformasi ini, penting bahwa berasal dari distribusi keluarga eksponensial, dan khususnya keluarga eksponensial alami (atau telah diubah menjadi distribusi ini), dalam bentukXiXifXi(x;θ)=h(x)exp(θxb(θ))fXi(x;θ)=h(x)exp(θxb(θ))

Dalam hal ini, kumulant distribusi diberikan oleh . Jadi , , dan . Kita dapat menulis parameter sebagai fungsi hanya mengambil kebalikan dari , menulis . Kemudianκk=b(k)(θ)κk=b(k)(θ)μ=b(θ)μ=b(θ)σ2=V(θ)=b(θ)σ2=V(θ)=b′′(θ)κ3=b(θ)κ3=b′′′(θ)θθμμbbθ(μ)=(b)1(μ)θ(μ)=(b)1(μ)

θ(μ)=1b((b)1(μ))=1b(θ))=1σ2θ(μ)=1b′′((b)1(μ))=1b′′(θ))=1σ2

Selanjutnya kita dapat menulis varians sebagai fungsi , dan memanggil fungsi ini :μμˉVV¯

ˉV(μ)=V(θ(μ))=b(θ(μ))V¯(μ)=V(θ(μ))=b′′(θ(μ))

Kemudian

ddμˉV(μ)=V(θ(μ))θ(μ)=b(θ)1σ2=κ3σ2ddμV¯(μ)=V(θ(μ))θ(μ)=b′′′(θ)1σ2=κ3σ2

Jadi sebagai fungsi dari , .μμκ3(μ)=ˉV(μ)ˉV(μ)κ3(μ)=V¯(μ)V¯(μ)

Sekarang, untuk transformasi simetrizing, kami ingin mengurangi kemiringan dengan membuat sehingga adalah . Jadi, kami mauh(ˉX)h(X¯)h(μ)3κ3(Xi)N2+3h(μ)2h(μ)σ4N2=0h(μ)3κ3(Xi)N2+3h(μ)2h′′(μ)σ4N2=0h(ˉX)h(X¯)O(N3)O(N3)

h(μ)3κ3(Xi)+3h(μ)2h(μ)σ4=0h(μ)3κ3(Xi)+3h(μ)2h′′(μ)σ4=0

Mengganti ekspresi kami untuk dan sebagai fungsi dari , kami memiliki:σ2σ2κ3κ3μμ

h(μ)3ˉV(μ)ˉV(μ)+3h(μ)2h(μ)ˉV(μ)2=0h(μ)3V¯(μ)V¯(μ)+3h(μ)2h′′(μ)V¯(μ)2=0

Jadi , mengarah ke .h(μ)3ˉV(μ)+3h(μ)2h(μ)ˉV(μ)=0h(μ)3V¯(μ)+3h(μ)2h′′(μ)V¯(μ)=0ddμ(h(μ)3ˉV(μ))=0ddμ(h(μ)3V¯(μ))=0

Salah satu solusi untuk persamaan diferensial ini adalah:

h(μ)3ˉV(μ)=1h(μ)3V¯(μ)=1 ,

h(μ)=1[ˉV(μ)]1/3h(μ)=1[V¯(μ)]1/3

Jadi, , untuk sembarang konstanta, . Ini memberi kita transformasi simetri , di mana adalah varian sebagai fungsi mean dalam keluarga eksponensial alami.h(μ)=μc1[ˉV(θ)]1/3dθh(μ)=μc1[V¯(θ)]1/3dθccA(u)=u1[V(θ)]1/3dθA(u)=u1[V(θ)]1/3dθVV


1

1.Mengapa saya tidak bisa mendapatkan hasil yang sama dengan memperkirakan dalam hal momen noncentral dan kemudian menghitung momen pusat menggunakan momen noncentral yang mendekati?EˉXkEX¯kE(ˉXEˉX)k

Karena Anda mengubah derivasi secara sewenang-wenang dan menjatuhkan istilah residu yang penting. Jika Anda tidak terbiasa dengan notasi O besar dan hasil yang relevan, referensi yang baik adalah [Casella & Lehmann].

h(ˉX)h(u)h(u)(ˉXμ)+h(x)2(ˉXμ)2+O[(ˉXμ)3]

E[h(ˉX)h(u)]h(u)E(ˉXμ)+h(x)2E(ˉXμ)2+(?)

Tetapi bahkan jika Anda tidak menjatuhkan residu dengan menyatakan bahwa Anda selalu melakukan (yang tidak legal ...), langkah berikut: mengatakan bahwaN\E(h(ˉX)h(u))3h(μ)3\E(ˉXμ)3+32h(μ)2h(μ)\E(ˉXμ)4+34h(μ)h(μ)2\E(ˉXμ)5+18h(μ)3\E(ˉXμ)6.(1)

[h(x)h(x0)]3dx=[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3dx=(1)

jika ini masih belum jelas, kita bisa melihat aljabar untuk memperluas integrand berjalan

[h(x0)(xx0)+12h(x0)(xx0)2+O((xx0)3)]3(2)

Membiarkan , ,A=h(x0)(xx0)B=12h(x0)(xx0)2C=O((xx0)3) (2)=[A+B+C]3 [A3+3A2B+3AB2+B3]=[A+B]3=(1)

Kesalahan Anda adalah menghilangkan residu sebelum ekspansi, yang merupakan kesalahan "klasik" dalam notasi O besar dan kemudian menjadi kritik terhadap penggunaan notasi O besar.

2.Kenapa analisis dimulai dengan alih-alih , jumlah yang benar-benar kita pedulikan?ˉXX

Karena kami ingin mendasarkan analisis kami pada statistik yang cukup dari model eksponensial yang kami perkenalkan. Jika Anda memiliki sampel ukuran 1 maka tidak ada perbedaan apakah Anda menganalisis dengan ATAU .ˉX=1nni=1XiX1

Ini adalah pelajaran yang baik dalam notasi O besar meskipun tidak relevan dengan GLM ...

Referensi [Casella & Lehmann] Lehmann, Erich Leo, dan George Casella. Teori estimasi titik. Springer Science & Business Media, 2006.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.