Pertanyaan yang diberi tag «deep-learning»

Area pembelajaran mesin berkaitan dengan pembelajaran representasi hirarkis data, terutama dilakukan dengan jaringan saraf yang mendalam.

2
Bagaimana dan mengapa Normalisasi Batch menggunakan rata-rata bergerak untuk melacak keakuratan model saat melatih?
Saya membaca makalah normalisasi batch (BN) (1) dan tidak mengerti perlunya menggunakan moving average untuk melacak akurasi model dan bahkan jika saya menerima bahwa itu adalah hal yang benar untuk dilakukan, saya tidak mengerti apa yang sebenarnya mereka lakukan. Menurut pemahaman saya (yang salah saya), makalah ini menyebutkan bahwa itu …




2
Dalam jaring saraf, mengapa menggunakan metode gradien daripada metaheuristik lainnya?
Dalam pelatihan jaringan saraf yang dalam dan dangkal, mengapa metode gradien (misalnya gradient descent, Nesterov, Newton-Raphson) umum digunakan, berbeda dengan metaheuristik lainnya? Metaheuristik yang saya maksud adalah metode seperti annealing yang disimulasikan, optimisasi koloni semut, dll., Yang dikembangkan untuk menghindari terjebak dalam minima lokal.

3
Pentingnya simpul bias dalam jaringan saraf
Saya ingin tahu seberapa penting bias node bagi efektivitas jaringan saraf modern. Saya dapat dengan mudah memahami bahwa ini penting dalam jaringan yang dangkal dengan hanya beberapa variabel input. Namun, jaring saraf modern seperti dalam pembelajaran yang mendalam sering memiliki sejumlah besar variabel input untuk memutuskan apakah neuron tertentu dipicu. …


4
Kapan saya harus menggunakan autoencoder variasional sebagai lawan dari autoencoder?
Saya mengerti struktur dasar autoencoder variasional dan autoencoder normal (deterministik) dan matematika di belakangnya, tetapi kapan dan mengapa saya lebih suka satu jenis autoencoder dari yang lain? Yang bisa saya pikirkan adalah distribusi sebelumnya variabel laten dari autoencoder variasional memungkinkan kita untuk mengambil sampel variabel laten dan kemudian membangun gambar …

5
Apa perbedaan antara 'transfer pembelajaran' dan 'adaptasi domain'?
Apakah ada perbedaan antara 'transfer pembelajaran' dan 'adaptasi domain'? Saya tidak tahu tentang konteks, tetapi pemahaman saya adalah bahwa kami memiliki beberapa dataset 1 dan melatihnya, setelah itu kami memiliki dataset 2 yang ingin kami sesuaikan dengan model kami tanpa pelatihan ulang dari awal, untuk mana 'transfer pembelajaran' dan 'adaptasi …


3
Model ikonik (mainan) dari jaringan saraf
Profesor fisika saya di sekolah pascasarjana, serta peraih Noble Feynman, akan selalu menyajikan apa yang mereka sebut model mainan untuk menggambarkan konsep dasar dan metode dalam fisika, seperti osilator harmonik, pendulum, spinning top, dan kotak hitam. Model mainan apa yang digunakan untuk menggambarkan konsep dasar dan metode yang mendasari penerapan …



2
Haruskah sampel pelatihan diambil secara acak untuk pelatihan neural-batch mini diambil tanpa penggantian?
Kami mendefinisikan zaman sebagai telah melalui keseluruhan dari semua sampel pelatihan yang tersedia, dan ukuran mini-batch sebagai jumlah sampel yang kami rata-rata menemukan pembaruan untuk bobot / bias yang diperlukan untuk turun gradien. Pertanyaan saya adalah apakah kita harus menggambar tanpa penggantian dari set contoh pelatihan untuk menghasilkan setiap mini-batch …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.