Pertanyaan yang diberi tag «computational-statistics»

Mengacu pada antarmuka statistik dan komputasi; penggunaan algoritma dan perangkat lunak untuk keperluan statistik.

1
Solusi bentuk tertutup untuk masalah laso ketika data matriks diagonal
\newcommand{\diag}{\operatorname{diag}} Kami memiliki masalah: minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),minw∈Rd(1n∑i=1n(⟨w,xi⟩−yi)2+2λ||w||1),\min_{w\in\mathbb{R}^{d}}\left( \frac{1}{n}\sum_{i=1}^{n} \left( \langle w,x_{i}\rangle-y_{i} \right)^{2} +2\lambda||w||_1\right), dengan asumsi bahwa: ∑i=1nxixTi=diag(σ21,...,σ2d).∑i=1nxixiT=diag⁡(σ12,...,σd2).\sum_{i=1}^nx_ix_i^T=\diag(\sigma_1^2,...,\sigma_d^2). Apakah ada solusi bentuk tertutup dalam kasus ini? Saya punya itu: (XTX)−1=diag(σ−21,...,σ−2d),(XTX)−1=diag⁡(σ1−2,...,σd−2),(X^TX)^{-1}=\diag\left(\sigma_1^{-2},...,\sigma_d^{-2}\right), jadi saya pikir jawabannya adalah : wj=yjmax{0,1−λn|yj|},wj=yjmax{0,1−λn|yj|},w\,^j=y\,^j\max\left\{0,1-\lambda \frac{n}{|y^j|}\right\}, untuk yj=∑i=1nyixijσ2iyj=∑i=1nyixijσi2y\,^j=\displaystyle\sum_{i=1}^n\frac{y_ix_i\,^j}{\sigma_i^2} , tapi saya tidak yakin.


1
Bagaimana saya bisa mengoptimalkan efisiensi komputasi ketika memasang model yang kompleks ke kumpulan data besar berulang kali?
Saya mengalami masalah kinerja menggunakan MCMCglmmpaket di R untuk menjalankan model efek campuran. Kode ini terlihat seperti ini: MC1<-MCMCglmm(bull~1,random=~school,data=dt,family="categorical" , prior=list(R=list(V=1,fix=1), G=list(G1=list(V=1, nu=0))) , slice=T, nitt=iter, ,burnin=burn, verbose=F) Ada sekitar 20.000 pengamatan dalam data dan mereka terkelompok di sekitar 200 sekolah. Saya telah membuang semua variabel yang tidak digunakan dari …


3
Menggunakan simulasi komputer untuk lebih memahami konsep statistik di tingkat pascasarjana
Hai, saya mengambil kursus pascasarjana di bidang Statistik dan kami telah membahas statistik Uji, dan konsep lainnya. Namun, saya sering dapat menerapkan formula dan mengembangkan semacam intuisi tentang cara kerja tetapi saya sering merasa bahwa mungkin jika saya mendukung penelitian saya dengan eksperimen simulasi, saya akan mengembangkan intuisi yang lebih …

1
Apa ini "koefisien korelasi maksimum"?
Statistik pemrosesan gambar yang khas adalah penggunaan fitur tekstur Haralick , yaitu 14. Saya bertanya-tanya tentang ke-14 fitur ini: Diberikan peta adjacency (yang kita dapat dengan mudah melihat distribusi empiris dari dua integer ), didefinisikan sebagai: akar kuadrat dari nilai eigen kedua , dimana adalah:i , j < 256 Q …

1
Menemukan kelompok kontrol yang sebanding untuk kelompok perlakuan?
Saya memiliki kelompok perlakuan ukuran 30 (30 sekolah di California) yang menggunakan perangkat lunak tambahan matematika. Dalam analisis sederhana, saya ingin membandingkan rata-rata pertumbuhan Matematika siswa antara kelompok perlakuan kami dan kelompok kontrol yang sebanding. Ada banyak sekolah di CA yang tidak menggunakan perangkat lunak. Saya ingin kelompok kontrol untuk …


3
Apakah mungkin dalam R (atau secara umum) untuk memaksa koefisien regresi menjadi tanda tertentu?
Saya bekerja dengan beberapa data dunia nyata dan model regresi menghasilkan beberapa hasil yang berlawanan dengan intuisi. Biasanya saya mempercayai statistik tetapi pada kenyataannya beberapa hal ini tidak benar. Masalah utama yang saya lihat adalah bahwa peningkatan dalam satu variabel menyebabkan peningkatan respons ketika, pada kenyataannya, mereka harus berkorelasi negatif. …

1
Perhitungan / estimasi cepat sistem linear peringkat rendah
Sistem persamaan linear sangat luas dalam statistik komputasi. Satu sistem khusus yang saya temui (misalnya, dalam analisis faktor) adalah sistem Ax=bAx=bAx=b di mana Di sini adalah matriks diagonal dengan diagonal yang benar-benar positif, adalah (dengan ) matriks semi-pasti positif simetris positif, dan adalah matriks sembarang . Kami diminta untuk memecahkan …

4
Menguji perangkat lunak statistik
Teknik / pendekatan apa yang berguna dalam menguji perangkat lunak statistik? Saya sangat tertarik pada program yang melakukan estimasi parametrik menggunakan kemungkinan maksimum. Membandingkan hasil dengan yang dari program lain atau sumber yang diterbitkan tidak selalu mungkin karena sebagian besar waktu ketika saya menulis program sendiri itu karena perhitungan yang …

4
Mengapa gradient descent diperlukan?
Ketika kita dapat membedakan fungsi biaya dan menemukan parameter dengan menyelesaikan persamaan yang diperoleh melalui diferensiasi parsial sehubungan dengan setiap parameter dan mencari tahu di mana fungsi biaya minimum. Juga saya pikir mungkin untuk menemukan banyak tempat di mana turunannya nol, dengan demikian kita dapat memeriksa semua tempat tersebut dan …

2
Bagaimana sampel dari distribusi diskrit pada bilangan bulat non-negatif?
Saya memiliki distribusi diskrit berikut, di mana konstanta dikenal:α , βα,β\alpha,\beta p ( x ; α , β) = Beta ( α + 1 , β+ x )Beta ( α , β)untuk x = 0 , 1 , 2 , ...p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,… p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x = …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.