Pertanyaan yang diberi tag «neural-networks»

Jaringan saraf tiruan (JST) adalah kelas model komputasi yang luas yang didasarkan pada jaringan saraf biologis. Mereka mencakup NNs feedforward (termasuk NN "dalam"), NN konvolusional, NN berulang, dll.

1
Apa yang dimaksud dengan lapisan bottleneck dalam jaringan saraf?
Saya sedang membaca makalah FaceNet dan dalam paragraf 3 dari pengantar tertulis: Pendekatan pengenalan wajah sebelumnya yang didasarkan pada jaringan dalam menggunakan lapisan klasifikasi yang dilatih lebih dari satu set identitas wajah yang dikenal dan kemudian mengambil lapisan bottleneck antara sebagai representasi yang digunakan untuk menggeneralisasi pengakuan di luar rangkaian …


2
Inisialisasi bobot lebih berat CNN
Dalam beberapa tutorial saya menemukan dinyatakan bahwa "Xavier" inisialisasi berat (kertas: Memahami kesulitan pelatihan deep feedforward neural networks ) adalah cara yang efisien untuk menginisialisasi bobot jaringan saraf. Untuk lapisan yang sepenuhnya terhubung ada aturan praktis dalam tutorial tersebut: Var(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W)=2nin+nout,simpler alternative:Var(W)=1ninVar(W) = \frac{2}{n_{in} + n_{out}}, \quad \text{simpler alternative:} \quad …


3
Apa sebenarnya perbedaan antara model parametrik dan non-parametrik?
Saya bingung dengan definisi model non-parametrik setelah membaca tautan ini Model parametrik vs Nonparametrik dan Menjawab komentar dari pertanyaan saya yang lain . Awalnya saya pikir "parametrik vs non-parametrik" berarti jika kita memiliki asumsi distribusi pada model (mirip dengan pengujian hipotesis parametrik atau non-parametrik). Tetapi kedua sumber daya mengklaim "parametrik …


1
Mengapa penguatan yang dalam belajar tidak stabil?
Dalam makalah DeepMind tahun 2015 tentang pembelajaran penguatan dalam, ia menyatakan bahwa "Upaya sebelumnya untuk menggabungkan RL dengan jaringan saraf sebagian besar gagal karena pembelajaran yang tidak stabil". Makalah ini kemudian mencantumkan beberapa penyebabnya, berdasarkan korelasi antar pengamatan. Tolong bisakah seseorang menjelaskan apa artinya ini? Apakah itu bentuk overfitting, di …

2
Mengapa jaringan saraf mudah tertipu?
Saya telah membaca beberapa makalah tentang membuat gambar secara manual untuk "mengelabui" jaringan saraf (lihat di bawah). Apakah ini karena jaringan hanya memodelkan probabilitas bersyarat ? Jika jaringan dapat memodelkan probabilitas gabungan , akankah kasus seperti itu masih terjadi?p ( y| x)hal(y|x)p(y|x)p ( y, x )hal(y,x)p(y,x) Dugaan saya adalah gambar …

2
Apa asal usul jaringan saraf autoencoder?
Saya mencari di Google, Wikipedia, sarjana Google, dan banyak lagi, tetapi saya tidak dapat menemukan asal Autoencoder. Mungkin itu salah satu konsep yang berevolusi sangat lambat, dan tidak mungkin untuk melacak kembali titik awal yang jelas, tetapi saya masih ingin menemukan semacam ringkasan dari langkah-langkah utama perkembangan mereka. The bab …


2
Apa manfaat dari distribusi normal terpotong dalam menginisialisasi bobot dalam jaringan saraf?
Ketika menginisialisasi bobot koneksi dalam jaringan saraf feedforward, penting untuk menginisialisasi mereka secara acak untuk menghindari simetri yang tidak dapat dipecahkan oleh algoritma pembelajaran. Rekomendasi yang saya lihat di berbagai tempat (misalnya dalam tutorial MNIST TensorFlow ) adalah menggunakan distribusi normal terpotong menggunakan standar deviasi , di manaNadalah jumlah input …

1
Cara melatih lapisan deep-network LSTM
Saya menggunakan jaringan lstm dan umpan-maju untuk mengklasifikasikan teks. Saya mengonversi teks menjadi vektor satu-panas dan mengumpankan masing-masing ke dalam lstm sehingga saya dapat meringkasnya sebagai satu representasi. Lalu saya memberinya makan ke jaringan lain. Tapi bagaimana cara melatih lstm? Saya hanya ingin urutan mengklasifikasikan teks - haruskah saya memberinya …

3
Bagaimana tepatnya jaringan saraf convolutional menggunakan konvolusi menggantikan multiplikasi matriks?
Saya sedang membaca Buku Yoshua Bengio tentang pembelajaran mendalam dan dikatakan di halaman 224: Jaringan konvolusional hanyalah jaringan saraf yang menggunakan konvolusi sebagai pengganti perkalian matriks umum dalam setidaknya satu lapisannya. Namun, saya tidak 100% yakin bagaimana "mengganti perkalian matriks dengan konvolusi" dalam arti yang tepat secara matematis. Yang benar-benar …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.