Pertanyaan yang diberi tag «neural-networks»

Jaringan saraf tiruan (JST) adalah kelas model komputasi yang luas yang didasarkan pada jaringan saraf biologis. Mereka mencakup NNs feedforward (termasuk NN "dalam"), NN konvolusional, NN berulang, dll.

1
Kehilangan pelatihan turun dan naik lagi. Apa yang terjadi?
Kehilangan latihan saya turun dan naik lagi. Sangat aneh. Kehilangan validasi silang melacak kehilangan pelatihan. Apa yang sedang terjadi? Saya memiliki dua LSTMS yang ditumpuk sebagai berikut (pada Keras): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', optimizer='adadelta') Saya latih untuk 100 Zaman: model.fit(X_train, …

4
Jaringan saraf dengan koneksi lompat-lapisan
Saya tertarik pada regresi dengan jaringan saraf. Jaringan saraf dengan nol simpul tersembunyi + koneksi skip-layer adalah model linier. Bagaimana dengan jaring saraf yang sama tetapi dengan simpul tersembunyi? Saya bertanya-tanya apa yang akan menjadi peran koneksi skip-layer? Secara intuitif, saya akan mengatakan bahwa jika Anda menyertakan koneksi skip-layer, maka …


8
Mengapa begitu penting untuk memiliki teori berprinsip dan matematis untuk Pembelajaran Mesin?
Saya bertanya-tanya, mengapa begitu penting memiliki pembelajaran mesin berprinsip / teoretis? Dari sudut pandang pribadi sebagai manusia, saya bisa mengerti mengapa Machine Learning berprinsip akan menjadi penting: manusia suka memahami apa yang mereka lakukan, kami menemukan keindahan dan kepuasan untuk memahami. dari sudut pandang teori, matematika itu menyenangkan ketika ada …

6
Bagaimana jaringan saraf mengenali gambar?
Pertanyaan ini dimigrasikan dari Stack Overflow karena dapat dijawab pada Cross Validated. Bermigrasi 7 tahun yang lalu . Saya mencoba mempelajari bagaimana Neural Network bekerja pada pengenalan gambar. Saya telah melihat beberapa contoh dan menjadi semakin bingung. Dalam contoh pengenalan huruf dari gambar 20x20, nilai setiap piksel menjadi lapisan input. …

6
Untuk masalah cembung, apakah gradien dalam Stochastic Gradient Descent (SGD) selalu menunjuk pada nilai ekstrim global?
Diberikan fungsi biaya cembung, menggunakan SGD untuk optimisasi, kami akan memiliki gradien (vektor) pada titik tertentu selama proses optimasi. Pertanyaan saya adalah, mengingat titik pada cembung, apakah gradien hanya menunjuk pada arah di mana fungsi naik / turun tercepat, atau gradien selalu menunjuk pada titik optimal / ekstrim dari fungsi …


3
Apa keuntungan dari menumpuk banyak LSTM?
Apa keuntungannya, mengapa seseorang menggunakan banyak LSTM, ditumpuk satu demi satu, dalam jaringan yang dalam? Saya menggunakan LSTM untuk mewakili urutan input sebagai input tunggal. Jadi, begitu saya memiliki representasi tunggal itu — mengapa saya harus melewatinya lagi? Saya bertanya ini karena saya melihat ini dalam program generasi bahasa alami.

1
Mengapa unit linear yang diperbaiki dianggap non-linear?
Mengapa fungsi aktivasi unit linear yang diperbaiki (ReLU) dianggap non-linear? f( x ) = maks ( 0 , x )f(x)=max(0,x) f(x) = \max(0,x) Mereka linier ketika input positif dan dari pemahaman saya untuk membuka kekuatan representatif dari jaringan yang dalam, aktivasi non-linear adalah suatu keharusan, jika tidak seluruh jaringan dapat …


3
Apa alasan bahwa Pengoptimal Adam dianggap kuat dengan nilai parameter hipernya?
Saya membaca tentang pengoptimal Adam untuk Deep Learning dan menemukan kalimat berikut dalam buku baru Deep Learning karya Bengio, Goodfellow dan Courville: Adam umumnya dianggap cukup kuat untuk memilih parameter hiper, meskipun tingkat pembelajaran kadang-kadang perlu diubah dari standar yang disarankan. jika ini benar, ini adalah masalah besar karena pencarian …

4
Apa yang bisa kita pelajari tentang otak manusia dari jaringan saraf tiruan?
Saya tahu pertanyaan / judul saya tidak terlalu spesifik, jadi saya akan mencoba menjelaskannya: Jaringan saraf tiruan memiliki desain yang relatif ketat. Tentu saja, secara umum, mereka dipengaruhi oleh biologi dan mencoba untuk membangun model matematika dari jaringan saraf nyata, tetapi pemahaman kita tentang jaringan saraf nyata tidak cukup untuk …

2
Autoencoder tidak dapat mempelajari fitur yang berarti
Saya memiliki 50.000 gambar seperti ini: Mereka menggambarkan grafik data. Saya ingin mengekstrak fitur dari gambar-gambar ini sehingga saya menggunakan kode autoencoder yang disediakan oleh Theano (deeplearning.net). Masalahnya adalah, autoencoder ini sepertinya tidak mempelajari fitur apa pun. Saya sudah mencoba RBM dan itu sama. Dataset MNIST menyediakan fitur yang bagus …

2
Bagaimana K12 'CNN Krizhevsky mendapatkan 253.440 neuron di lapisan pertama?
Dalam Alex Krizhevsky, et al. Klasifikasi imagenet dengan jaringan saraf convolutional yang mendalam mereka menyebutkan jumlah neuron di setiap lapisan (lihat diagram di bawah). Input jaringan adalah 150.528-dimensi, dan jumlah neuron dalam lapisan jaringan yang tersisa diberikan oleh 253.440–186.624–64.889–64.889–43.264–4096–4096–1000. Tampilan 3D Jumlah neuron untuk semua lapisan setelah yang pertama jelas. …

2
Apa perbedaan antara dropout dan drop connect?
Apa perbedaan antara dropout dan drop connect? AFAIK, dropout drop secara acak node tersembunyi selama pelatihan tetapi tetap mereka dalam pengujian, dan drop koneksi koneksi drop. Tetapi bukankah menjatuhkan koneksi sama dengan menjatuhkan node yang tersembunyi? Bukankah node (atau koneksi) hanya satu set bobot?

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.