Pertanyaan yang diberi tag «self-study»

Latihan rutin dari buku teks, kursus, atau tes yang digunakan untuk kelas atau belajar mandiri. Kebijakan komunitas ini adalah untuk "memberikan petunjuk bermanfaat" untuk pertanyaan seperti itu daripada jawaban lengkap.

1
K-means sebagai batas kasus algoritma EM untuk campuran Gaussian dengan kovarian akan
Tujuan saya adalah untuk melihat bahwa algoritma K-means sebenarnya adalah algoritma Ekspektasi-Maksimalisasi untuk campuran Gaussian di mana semua komponen memiliki kovarian dalam batas sebagai .σ2Iσ2I\sigma^2 Ilimσ→0limσ→0\lim_{\sigma \to 0} Misalkan kita memiliki kumpulan data {x1,…,xN}{x1,…,xN}\{x_1, \dots ,x_N\} pengamatan dari variabel acak XXX . Fungsi objektif untuk M-means diberikan oleh: J=∑n=1N∑k=1Krnk||xn−μk||2J=∑n=1N∑k=1Krnk||xn−μk||2J = …

1
Bukti ketidaksetaraan Cantelli
Saya mencoba membuktikan ketidaksetaraan berikut: EDIT: Hampir segera setelah saya memposting pertanyaan ini, saya menemukan bahwa ketidaksetaraan saya diminta untuk membuktikan disebut ketidaksetaraan Cantelli. Ketika saya menulis ini, saya tidak menyadari ketidaksetaraan khusus ini memiliki nama. Saya telah menemukan banyak bukti melalui Google, jadi saya tidak benar-benar membutuhkan solusi lagi. …


1
mana dan didistribusikan secara lognormal
Saya mencoba untuk menghitung ekspektasi untuk arbitrary (untuk ekspektasinya tidak terbatas) jika didistribusikan secara lognormal, yaitu .E[ec X]E[ecX]E[e^{cX}]c &lt; 0c&lt;0c<0c &gt; 0c&gt;0c>0XXXcatatan( X) ∼ N( μ , σ)log⁡(X)∼N(μ,σ)\log(X) \sim N(\mu, \sigma) Gagasan saya adalah menuliskan ekspektasi sebagai integral, tetapi saya tidak melihat bagaimana melanjutkan: E[ec X] =12 σπ---√∫∞01xexp( c x …

1
Bagaimana menemukan kepadatan dari fungsi karakteristik?
Distribusi memiliki fungsi karakteristik ϕ(t)=(1−t2/2)exp(−t2/4), −∞&lt;t&lt;∞ϕ(t)=(1−t2/2)exp⁡(−t2/4), −∞&lt;t&lt;∞\phi(t) = (1-t^2/2)\exp(-t^2/4),\ -\infty \lt t \lt \infty Tunjukkan bahwa distribusi benar - benar kontinu dan tulis fungsi kepadatan distribusi. Mencoba: ∫∞−∞|(1−t2/2)exp(−t2/4)|dt=(−2/t)(1−t2/2)exp(−t2/4)−2exp(−t2/4)|0−∞∫−∞∞|(1−t2/2)exp⁡(−t2/4)|dt=(−2/t)(1−t2/2)exp⁡(−t2/4)−2exp⁡(−t2/4)|−∞0\int_{-\infty}^{\infty}|(1-t^2/2)\exp(-t^2/4)|dt =(-2/t)(1-t^2/2)\exp(-t^2/4)-2\exp(-t^2/4)|_{-\infty}^{0} Hasil serupa untuk karena kuadrat.[0,∞][0,∞][0,\infty]ttt Saya tidak yakin saya melakukan integrasi dengan benar, tetapi jika saya dapat menunjukkan bahwa nilai absolut …

2
Mengapa model statistik cocok jika diberi set data yang sangat besar?
Proyek saya saat ini mungkin mengharuskan saya untuk membuat model untuk memprediksi perilaku sekelompok orang tertentu. set data pelatihan hanya berisi 6 variabel (id hanya untuk tujuan identifikasi): id, age, income, gender, job category, monthly spend di mana monthly spendadalah variabel respon. Tetapi dataset pelatihan berisi sekitar 3 juta baris, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


3
Jalan acak: raja di papan catur
Saya punya pertanyaan tentang jalan acak dua raja di papan catur 3 × 3. Setiap raja bergerak secara acak dengan probabilitas yang sama di papan catur ini - secara vertikal, horizontal dan diagonal. Kedua raja bergerak secara independen dari satu sama lain dalam papan catur yang sama. Keduanya mulai di …

2
Rasio Kemungkinan untuk distribusi Eksponensial dua sampel
Membiarkan XXXdan menjadi dua variabel acak independen dengan masing-masing pdf:YYY f(x;θi)={1θie−x/θi0&lt;x&lt;∞,0&lt;θi&lt;∞0elsewheref(x;θi)={1θie−x/θi0&lt;x&lt;∞,0&lt;θi&lt;∞0elsewheref \left(x;\theta_i \right) =\begin{cases} \frac{1}{\theta_i} e^{-x/ {\theta_i}} \quad 0<x<\infty, 0<\theta_i< \infty \\ 0 \quad \text{elsewhere} \end{cases} untuk . Dua sampel indepedent diambil untuk menguji terhadap dengan ukuran dan dari distribusi ini. Saya perlu menunjukkan bahwa LRT dapat ditulis sebagai fungsi …

2
Ketika n meningkatkan nilai-t meningkat dalam uji hipotesis, tetapi t-tabel justru sebaliknya. Mengapa?
Rumus untuk dalam uji hipotesis diberikan oleh: tttt =X¯- μσ^/n--√.t=X¯−μσ^/n. t=\frac{\bar{X}-\mu}{\hat \sigma/\sqrt{n}}. Ketika meningkat, nilai- meningkat sesuai dengan rumus di atas. Tetapi mengapa kritis menurun pada -tabel saat (yang merupakan fungsi dari ) meningkat?nnntttttttttdfdf\text{df}nnn

2
Perkiraan jumlah relatif koin di Kanada
Mungkinkah untuk memperkirakan secara akurat jumlah relatif Loonies , Twoonies , quarter, dimes, nickles (dan mungkin sen yang dihentikan) dalam sirkulasi dari sekadar memperoleh sampel koin yang cukup besar melalui penggunaan sehari-hari? Dengan penggunaan sehari-hari saya merujuk pada koin yang Anda kembalikan saat Anda melakukan pembelian di toko grosir misalnya. …

2
Memeriksa apakah kepadatan adalah keluarga eksponensial
Mencoba membuktikan bahwa ini bukan milik keluarga eksponensial. f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4(y+a)(1+4a);0&lt;y&lt;1,a&gt;0f(y|a)=4\frac{(y+a)}{(1+4a)} ; 0 < y < 1 , a>0 Inilah pendekatan saya: f(y|a)=4(y+a)e−log(1+4a)f(y|a)=4(y+a)e−log(1+4a)f(y|a) = 4(y+a)e^{-log(1+4a)} f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a)=(4y)(1+ay)e−log(1+4a)f(y|a) = (4y)(1+\frac{a}{y})e^{-log(1+4a)} Membandingkannya dengan bentuk standar, dan yang harus menjadi fungsi hanya , tidak dapat didefinisikan dalam hal saja, seperti di tidak dapat dipisahkan. Apakah ini …

1
Bagaimana beta sebelum mempengaruhi posterior di bawah kemungkinan binomial
Saya punya dua pertanyaan, Pertanyaan 1: Bagaimana saya bisa menunjukkan bahwa distribusi posterior adalah distribusi beta jika kemungkinannya adalah binomial dan yang sebelumnya adalah beta Pertanyaan 2: Bagaimana pilihan parameter sebelumnya mempengaruhi posterior? Bukankah seharusnya mereka semua sama? Apakah mungkin untuk menjawab pertanyaan-pertanyaan ini dalam R?

2
Bagaimana cara memplot set data 5D di "koordinat bintang"?
Saya membaca makalah "Star Coordinates: A Visualization Multidimensional Technique dengan Uniform Treatment of Dimensions" dan mencoba untuk memplot data saya. Katakanlah saya memiliki , titik data lima dimensi, dan titik dihitung dengan rumus yang dijelaskan dalam makalah. A(2,5,3,1,8)A(2,5,3,1,8)A(2,5,3,1,8) Ide dasar Star Coordinates adalah untuk mengatur sumbu koordinat pada lingkaran pada …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.