Jacobian - penentu absolut dari perubahan fungsi variabel - tampak tangguh dan bisa rumit. Namun demikian, mereka adalah bagian penting dan tidak dapat dihindari dari perhitungan perubahan variabel multivariat. Tampaknya tidak ada apa-apa selain menuliskan k+1 dengan k+1 matriks turunan dan melakukan perhitungan.
Ada cara yang lebih baik. Itu ditampilkan di bagian akhir "Solusi". Karena tujuan dari posting ini adalah untuk memperkenalkan para ahli statistik tentang apa yang mungkin menjadi metode baru bagi banyak orang, banyak di antaranya dikhususkan untuk menjelaskan mesin di balik solusi. Ini adalah aljabar bentuk-bentuk diferensial . (Bentuk diferensial adalah hal-hal yang diintegrasikan seseorang dalam berbagai dimensi.) Contoh yang terperinci dan dikerjakan disertakan untuk membantu menjadikan ini lebih akrab.
Latar Belakang
Lebih dari seabad yang lalu, matematikawan mengembangkan teori aljabar diferensial untuk bekerja dengan "turunan orde tinggi" yang terjadi dalam geometri multi-dimensi. Penentu adalah kasus khusus dari objek dasar yang dimanipulasi oleh aljabar semacam itu, yang biasanya merupakan bentuk multinearer bergantian . Keindahan ini terletak pada betapa sederhananya perhitungan itu.
Inilah yang perlu Anda ketahui.
Sebuah diferensial adalah ekspresi dari bentuk " dxi ". Ini adalah gabungan dari " d " dengan nama variabel apa pun.
Satu -bentuk adalah kombinasi linear dari diferensial, seperti atau bahkan x 2 d x 1 - exp ( x 2 ) d x 2 . Artinya, koefisien adalah fungsi dari variabel.dx1+dx2x2dx1−exp(x2)dx2
Formulir dapat "dikalikan" menggunakan produk wedge , tertulis . Produk ini adalah anti-komutatif (juga disebut bolak ): untuk setiap dua satu-bentuk ohm dan η ,∧ωη
ω∧η=−η∧ω.
Perkalian ini linier dan asosiatif: dengan kata lain, ini bekerja dengan cara yang akrab. Konsekuensi langsungnya adalah bahwa , menyiratkan kuadrat dari setiap-bentuk selalu nol. Itu membuat perkalian menjadi sangat mudah!ω∧ω=−ω∧ω
Untuk keperluan memanipulasi integrand yang muncul dalam perhitungan probabilitas, ekspresi seperti dapat dipahami sebagai | d x 1 ∧ d x 2 ∧ ⋯ ∧ d x k + 1 | .dx1dx2⋯dxk+1|dx1∧dx2∧⋯∧dxk+1|
Ketika adalah suatu fungsi, maka diferensialnya diberikan oleh diferensiasi:y=g(x1,…,xn)
dy=dg(x1,…,xn)=∂g∂x1(x1,…,xn)dx1+⋯+∂g∂x1(x1,…,xn)dxn.
Koneksi dengan Jacobian adalah ini: Jacobian dari transformasi , hingga tanda, hanya koefisien d x(y1,…,yn)=F(x1,…,xn)=(f1(x1,…,xn),…,fn(x1,…,xn)) yang muncul dalam komputasidx1∧⋯∧dxn
dy1∧⋯∧dyn=df1(x1,…,xn)∧⋯∧dfn(x1,…,xn)
setelah berkembang masing-masing sebagai kombinasi linear dari d x j dalam aturan (5).dfidxj
Contoh
Kesederhanaan definisi Jacobian ini sangat menarik. Belum yakin itu bermanfaat? Pertimbangkan masalah yang terkenal dari konversi integral dua dimensi dari koordinat Cartesian ke koordinat polar ( r , θ ) , di mana ( x , y ) = ( r cos ( θ ) , r sin ( θ ) ) . Berikut ini adalah aplikasi yang sepenuhnya mekanis dari aturan sebelumnya, di mana " ( ∗ )(x,y)(r,θ)(x,y)=(rcos(θ),rsin(θ))(∗)"digunakan untuk menyingkat ekspresi yang jelas akan menghilang berdasarkan aturan (3), yang menyiratkan .dr∧dr=dθ∧dθ=0
dxdy=|dx∧dy|=|d(rcos(θ))∧d(rsin(θ))|=|(cos(θ)dr−rsin(θ)dθ)∧(sin(θ)dr+rcos(θ)dθ|=|(∗)dr∧dr+(∗)dθ∧dθ−rsin(θ)dθ∧sin(θ)dr+cos(θ)dr∧rcos(θ)dθ|=|0+0+rsin2(θ)dr∧dθ+rcos2(θ)dr∧dθ|=|r(sin2(θ)+cos2(θ))dr∧dθ)|=r drdθ.
Poinnya adalah kemudahan untuk melakukan perhitungan seperti itu, tanpa mengacaukan matriks, determinan, atau objek multi-indikatif lainnya. Anda hanya memperbanyak hal, mengingat wedges adalah anti-komutatif. Lebih mudah dari apa yang diajarkan dalam aljabar sekolah menengah.
Persiapan
Mari kita lihat aljabar diferensial ini dalam aksi. Dalam masalah ini, PDF dari distribusi gabungan adalah produk dari masing-masing PDF (karena X i dianggap independen). Untuk menangani perubahan pada variabel Y i kita harus eksplisit tentang elemen diferensial yang akan diintegrasikan. Ini membentuk istilah d x 1 d x 2 ⋯ d x k + 1(X1,X2,…,Xk+1)XiYidx1dx2⋯dxk+1. Including the PDF gives the probability element
fX(x,α)dx1⋯dxk+1∝(xα1−11exp(−x1))⋯(xαk+1−1k+1exp(−xk+1))dx1⋯dxk+1=xα1−11⋯xαk+1−1k+1exp(−(x1+⋯+xk+1))dx1⋯dxk+1.
(The normalizing constant has been ignored; it will be recovered at the end.)
Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable
Z=X1+X2+⋯+Xk+1,
giving the relationships
Xi=YiZ.
This suggests making the change of variables xi→yiz in the probability element. The intention is to retain the first k variables y1,…,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,
dxi=d(yiz)=yidz+zdyi.
Note that since Y1+Y2+⋯+Yk+1=1, then
0=d(1)=d(y1+y2+⋯+yk+1)=dy1+dy2+⋯+dyk+1.
Consider the one-form
ω=dx1+⋯+dxk=z(dy1+⋯+dyk)+(y1+⋯+yk)dz.
It appears in the differential of the last variable:
dxk+1=zdyk+1+yk+1dz=−z(dy1+⋯+dyk)+(1−y1−⋯yk)dz=dz−ω.
The value of this lies in the observation that
dx1∧⋯∧dxk∧ω=0
because, when you expand this product, there is one term containing dx1∧dx1=0 as a factor, another containing dx2∧dx2=0, and so on: they all disappear. Consequently,
dx1∧⋯∧dxk∧dxk+1=dx1∧⋯∧dxk∧z−dx1∧⋯∧dxk∧ω=dx1∧⋯∧dxk∧z.
Whence (because all products dz∧dz disappear),
dx1∧⋯∧dxk+1=(zdy1+y1dz)∧⋯∧(zdyk+ykdz)∧dz=zkdy1∧⋯∧dyk∧dz.
The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.
Solution
The transformation (x1,…,xk,xk+1)→(y1,…,yk,z) is one-to-one: its inverse is given by xi=yiz for 1≤i≤k and xk+1=z(1−y1−⋯−yk). Therefore we don't have to fuss any more about the new probability element; it simply is
(zy1)α1−1⋯(zyk)αk−1(z(1−y1−⋯−yk))αk+1−1exp(−z)|zkdy1∧⋯∧dyk∧dz|=(zα1+⋯+αk+1−1exp(−z)dz)(yα1−11⋯yαk−1k(1−y1−⋯−yk)αk+1−1dy1⋯dyk).
That is manifestly a product of a Gamma(α1+⋯+αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,…,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1+⋯+αk+1), enabling the PDF to be written
fY(y,α)=Γ(α1+⋯+αk+1)Γ(α1)⋯Γ(αk+1)(yα1−11⋯yαk−1k(1−y1−⋯−yk)αk+1−1).