Pertanyaan yang diberi tag «neural-networks»

Jaringan saraf tiruan (JST) adalah kelas model komputasi yang luas yang didasarkan pada jaringan saraf biologis. Mereka mencakup NNs feedforward (termasuk NN "dalam"), NN konvolusional, NN berulang, dll.

2
Meningkatkan jaringan saraf
Nah baru-baru ini saya bekerja pada belajar algoritma meningkatkan, seperti AdaBoost, meningkatkan gradien, dan saya tahu fakta bahwa yang paling umum digunakan lemah-pelajar adalah pohon. Saya benar-benar ingin tahu apakah ada beberapa contoh sukses baru-baru ini (maksud saya beberapa makalah atau artikel) untuk menggunakan jaringan saraf sebagai pembelajar dasar.

3
Dari aturan Perceptron ke Gradient Descent: Bagaimana Perceptrons dengan fungsi aktivasi sigmoid berbeda dari Regresi Logistik?
Pada dasarnya, pertanyaan saya adalah bahwa dalam multilayer Perceptrons, perceptrons digunakan dengan fungsi aktivasi sigmoid. Sehingga dalam aturan pembaruan dihitung sebagaiy^y^\hat{y} y^=11+exp(−wTxi)y^=11+exp⁡(−wTxi)\hat{y} = \frac{1}{1+\exp(-\mathbf{w}^T\mathbf{x}_i)} Bagaimana perbedaan "sigmoid" Perceptron ini dari regresi logistik? Saya akan mengatakan bahwa perceptron sigmoid satu-lapisan setara dengan regresi logistik dalam arti bahwa keduanya menggunakan dalam aturan …



5
Jaringan saraf modern yang membangun topologi mereka sendiri
Keterbatasan dari algoritma neural net standar (seperti backprop) adalah Anda harus membuat keputusan desain tentang berapa banyak layer tersembunyi dan neuron per layer yang Anda inginkan. Biasanya, tingkat pembelajaran dan generalisasi sangat sensitif terhadap pilihan-pilihan ini. Ini telah menjadi alasan, mengapa algoritma neural net seperti korelasi kaskade telah menghasilkan minat. …




2
Bagaimana dan mengapa Normalisasi Batch menggunakan rata-rata bergerak untuk melacak keakuratan model saat melatih?
Saya membaca makalah normalisasi batch (BN) (1) dan tidak mengerti perlunya menggunakan moving average untuk melacak akurasi model dan bahkan jika saya menerima bahwa itu adalah hal yang benar untuk dilakukan, saya tidak mengerti apa yang sebenarnya mereka lakukan. Menurut pemahaman saya (yang salah saya), makalah ini menyebutkan bahwa itu …

2
Mengapa fungsi softmax digunakan untuk menghitung probabilitas meskipun kita dapat membagi setiap nilai dengan jumlah vektor?
Menerapkan fungsi softmax pada vektor akan menghasilkan "probabilitas" dan nilai antara dan . 000111 Tetapi kita juga dapat membagi setiap nilai dengan jumlah vektor dan itu akan menghasilkan probabilitas dan nilai antara dan .000111 Saya membaca jawabannya di sini tetapi mengatakan bahwa alasannya adalah karena itu dapat dibedakan, meskipun Kedua …


1
Dari Bayesian Networks ke Neural Networks: bagaimana regresi multivarian dapat ditransformasikan ke jaringan multi-output
Saya sedang berurusan dengan Model Linear Hierarchical Bayesian , di sini jaringan menggambarkannya. YYY merupakan penjualan harian suatu produk di supermarket (diamati). XXX adalah matriks regresi yang diketahui, termasuk harga, promosi, hari dalam seminggu, cuaca, hari libur. 1SSS adalah tingkat persediaan laten yang tidak diketahui dari setiap produk, yang menyebabkan …

4
Pengkodean Data Sudut untuk Jaringan Saraf Tiruan
Saya melatih jaringan saraf (detail tidak penting) di mana data target adalah vektor sudut (antara 0 dan 2 * pi). Saya mencari saran tentang cara menyandikan data ini. Inilah yang sedang saya coba (dengan kesuksesan terbatas): 1) Pengodean 1-of-C: I bin pengaturan kemungkinan sudut menjadi 1000 atau lebih sudut diskrit …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.