Apa itu "campuran" dalam model campuran gaussian


8

Kami sering mempelajari model Gaussian Mixture sebagai model yang berguna dalam pembelajaran mesin dan aplikasinya.

Apa signifikansi fisik dari " Campuran " ini?

Apakah ini digunakan karena Gaussian Mixture Model memodelkan probabilitas sejumlah variabel acak masing-masing dengan nilai rata-rata sendiri? Jika tidak, lalu apa interpretasi yang benar dari kata ini.

Jawaban:


11

SEBUAH distribusi menggabungkan distribusi komponen yang berbeda dengan bobot yang biasanya berjumlah satu (atau dapat dinormalisasi ulang). SEBUAH adalah kasus khusus di mana komponennya adalah Gaussians.

Misalnya, berikut adalah campuran 25% dan 75% , yang dapat Anda sebut "satu bagian dan tiga bagian ":N(2,1)N(2,1)N(2,1)N(2,1)

xx <- seq(-5,5,by=.01)
plot(xx,0.25*dnorm(xx,-2,1)+0.75*dnorm(xx,2,1),type="l",xlab="",ylab="")

campuran

Intinya, ini seperti resep. Bermain-mainlah sedikit dengan bobot, sarana dan varians untuk melihat apa yang terjadi, atau lihat dua tag di CV.


7

Ya Campuran Gaussian disebut dengan cara ini karena diasumsikan bahwa data yang diamati berasal dari distribusi campuran Gaussian yang terdiri dari Gaussians dengan cara dan varians mereka sendiri. Namun, kelas adalah laten dan begitu juga indikator yang memberi tahu Anda kelas mana yang termasuk dalam observasi.KK

Tujuan dari pemodelan campuran sekarang adalah untuk memperkirakan kelas yang paling mungkin untuk setiap pengamatan. Oleh karena itu, pemodelan campuran Gaussian dapat dilihat sebagai masalah data yang hilang. Estimasi biasanya dilakukan dengan menggunakan algoritma EM.


dapatkah saya berasumsi bahwa Kausa berhubungan satu sama lain (melalui bobot sedemikian rupa sehingga jumlah mereka sama dengan satu)
Upendra Pratap Singh

@Snowbell Ya, biasanya diasumsikan bahwa bobot dinormalisasi dalam arti jumlahnya adalah 1. Untuk informasi umum tentang campuran, Anda mungkin ingin memeriksa en.wikipedia.org/wiki/Mixture_distribution
tomka
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.