Pertanyaan yang diberi tag «optimization»

Gunakan tag ini untuk penggunaan optimasi dalam statistik.

4
Mengapa algoritme pengoptimalan didefinisikan berdasarkan masalah pengoptimalan lainnya?
Saya sedang melakukan penelitian tentang teknik optimasi untuk pembelajaran mesin, tetapi saya terkejut menemukan sejumlah besar algoritma optimasi didefinisikan dalam hal masalah optimasi lainnya. Saya menggambarkan beberapa contoh berikut ini. Misalnya https://arxiv.org/pdf/1511.05133v1.pdf Semuanya terlihat bagus dan bagus tapi kemudian ada dalam .... jadi apa algoritma yang memecahkan untuk ? Kami …

2
Apakah teknik pembelajaran mesin “algoritme aproksimasi”?
Baru-baru ini ada pertanyaan seperti ML di cstheory stackexchange, dan saya memposting jawaban yang merekomendasikan metode Powell, gradient descent, algoritma genetika, atau "algoritma aproksimasi" lainnya. Dalam komentar seseorang mengatakan kepada saya metode ini adalah "heuristik" dan bukan "algoritma perkiraan" dan sering tidak mendekati optimal teoritis (karena mereka "sering terjebak dalam …

4
Apakah selalu ada maximizer untuk masalah MLE?
Saya ingin tahu apakah selalu ada maximizer untuk masalah estimasi kemungkinan maksimum (log-)? Dengan kata lain, apakah ada beberapa distribusi dan beberapa parameternya, di mana masalah MLE tidak memiliki maximizer? Pertanyaan saya berasal dari klaim seorang insinyur bahwa fungsi biaya (kemungkinan atau log-kemungkinan, saya tidak yakin yang dimaksudkan) di MLE …

3
Koordinasikan vs gradient descent
Saya bertanya-tanya apa perbedaan kasus penggunaan untuk dua algoritma, Koordinat Keturunan dan Gradient Keturunan . Saya tahu bahwa penurunan koordinat memiliki masalah dengan fungsi yang tidak mulus tetapi digunakan dalam algoritma populer seperti SVM dan LASSO. Namun penurunan Gradient menurut saya digunakan secara lebih luas, terutama dengan kebangkitan JST, dan …


4
Bagaimana cara memastikan properti dari matriks kovarians saat memasang model normal multivariat menggunakan kemungkinan maksimum?
Misalkan saya memiliki model berikut ysaya= f( xsaya, θ ) + εsayayi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i di mana ysaya∈ RKysaya∈RKy_i\in \mathbb{R}^K , xsayaxsayax_i adalah vektor dari variabel penjelas, θθ\theta adalah parameter fungsi non-linear fff dan εsaya∼ N( 0 , Σ )εsaya∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma) , di mana ΣΣ\Sigma alami adalah K× KK×KK\times K matriks. Tujuannya adalah …

3
Mengapa kemungkinan maksimum dan kemungkinan tidak diharapkan?
Mengapa begitu umum untuk mendapatkan estimasi kemungkinan maksimum dari parameter, tetapi Anda hampir tidak pernah mendengar tentang perkiraan parameter kemungkinan yang diharapkan (yaitu, berdasarkan pada nilai yang diharapkan daripada mode fungsi kemungkinan)? Apakah ini terutama karena alasan historis, atau karena alasan teknis atau teoretis yang lebih substantif? Apakah akan ada …


1
Apakah ada penjelasan intuitif mengapa regresi logistik tidak akan berfungsi untuk kasus pemisahan sempurna? Dan mengapa menambahkan regularisasi akan memperbaikinya?
Kami memiliki banyak diskusi bagus tentang pemisahan sempurna dalam regresi logistik. Seperti, Regresi logistik dalam R menghasilkan pemisahan sempurna (fenomena Hauck-Donner). Sekarang apa? dan model regresi logistik tidak bertemu . Saya pribadi masih merasa itu tidak intuitif mengapa itu akan menjadi masalah dan mengapa menambahkan regularisasi akan memperbaikinya. Saya membuat …

7
Mengapa matriks simetris positif pasti (SPD) begitu penting?
Saya tahu definisi matriks positif simetris positif (SPD), tetapi ingin lebih memahami. Mengapa mereka begitu penting, secara intuitif? Inilah yang saya tahu. Apa lagi? Untuk data yang diberikan, matriks Co-variance adalah SPD. Matriks co-variance adalah metrik penting, lihat posting yang luar biasa ini untuk penjelasan intuitif. Bentuk kuadrat 12x⊤Ax−b⊤x+c12x⊤SEBUAHx-b⊤x+c\frac 1 …

2
Dalam jaring saraf, mengapa menggunakan metode gradien daripada metaheuristik lainnya?
Dalam pelatihan jaringan saraf yang dalam dan dangkal, mengapa metode gradien (misalnya gradient descent, Nesterov, Newton-Raphson) umum digunakan, berbeda dengan metaheuristik lainnya? Metaheuristik yang saya maksud adalah metode seperti annealing yang disimulasikan, optimisasi koloni semut, dll., Yang dikembangkan untuk menghindari terjebak dalam minima lokal.

2
Metode optimasi apa yang paling cocok untuk LSTM?
Saya telah menggunakan theano untuk bereksperimen dengan LSTM, dan bertanya-tanya apa metode optimasi (SGD, Adagrad, Adadelta, RMSprop, Adam, dll) bekerja paling baik untuk LSTM? Apakah ada makalah penelitian tentang topik ini? Juga, apakah jawabannya tergantung pada jenis aplikasi yang saya gunakan untuk LSTM? Jika demikian, saya menggunakan LSTM untuk klasifikasi …

3
Kapan algoritma genetika merupakan pilihan yang baik untuk optimasi?
Algoritma genetika adalah salah satu bentuk metode optimasi. Seringkali penurunan gradien stokastik dan turunannya adalah pilihan terbaik untuk optimasi fungsi, tetapi kadang-kadang algoritma genetika masih digunakan. Misalnya, antena pesawat ruang angkasa ST5 NASA dibuat dengan algoritma genetika: Kapan metode optimisasi genetik merupakan pilihan yang lebih baik daripada metode gradient descent …

2
Apa arti super skrip 2 subskrip 2 dalam konteks norma?
Saya baru mengenal pengoptimalan. Saya terus melihat persamaan yang memiliki superskrip 2 dan subskrip 2 di sebelah kanan norma. Sebagai contoh, di sini adalah persamaan kuadrat terkecil mnt | | Ax-b | |22||Ax−b||22 ||Ax-b||^2_2 Saya rasa saya mengerti superskrip 2: artinya kuadratkan nilai norma. Tapi apa itu subskrip 2? Bagaimana …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.