Pertanyaan yang diberi tag «deep-learning»

Area pembelajaran mesin berkaitan dengan pembelajaran representasi hirarkis data, terutama dilakukan dengan jaringan saraf yang mendalam.


2
Hambatan menerapkan pembelajaran yang mendalam dalam praktik
Setelah membaca banyak makalah pembelajaran yang mendalam, semacam perasaan kasar adalah bahwa ada banyak trik dalam melatih jaringan untuk mendapatkan kinerja yang lebih baik dari biasanya. Dari perspektif aplikasi industri, sangat sulit untuk mengembangkan trik semacam ini kecuali kelompok-kelompok penelitian elit di perusahaan teknologi besar, misalnya, google atau facebook. Lalu …

2
Bidang reseptif neuron di LeNet
Saya mencoba memahami bidang reseptif CNN dengan lebih baik. Untuk melakukan itu saya ingin menghitung bidang reseptif dari setiap neuron di LeNet. Untuk MLP normal itu agak mudah (lihat http://deeplearning.net/tutorial/lenet.html#sparse-connectivity ), tetapi lebih sulit untuk menghitung bidang reseptif dari neuron dalam lapisan berikut satu atau lebih lapisan konvolusional dan lapisan …


1
Autoencoder variabel dengan model campuran Gaussian
Sebuah autoencoder variational (Vae) menyediakan cara belajar distribusi probabilitas yang berkaitan masukan representasi latennya . Secara khusus, encoder memetakan input ke distribusi pada . Encoder tipikal akan menampilkan parameter , mewakili distribusi Gaussian ; distribusi ini digunakan sebagai perkiraan kami untuk .p ( x , z)hal(x,z)p(x,z)xxxzzzeeexxxzzz( μ , σ) = …

4
Dapatkah regresi berbasis pohon berkinerja lebih buruk daripada regresi linier biasa?
Hai, saya sedang mempelajari teknik regresi. Data saya memiliki 15 fitur dan 60 juta contoh (tugas regresi). Ketika saya mencoba banyak teknik regresi yang dikenal (gradient boosted tree, Decision tree regression, AdaBoostRegressor dll) regresi linier dilakukan dengan sangat baik. Skor hampir terbaik di antara algoritma tersebut. Apa yang bisa menjadi …

1
mengenai format output untuk segmentasi semantik
Saat membaca makalah segmentasi semantik serta implementasi yang sesuai, saya menemukan bahwa beberapa pendekatan menggunakan softmax sementara yang lain menggunakan sigmoid untuk pelabelan tingkat piksel. Misalnya, sehubungan dengan kertas u-net , output adalah peta fitur dengan dua saluran. Saya telah melihat beberapa implementasi menggunakan softmax pada dua keluaran saluran ini. …

3
Dropout: menskalakan aktivasi versus membalik dropout
Ketika menerapkan dropout di jaringan saraf tiruan, kita perlu mengimbangi kenyataan bahwa pada waktu pelatihan sebagian neuron dinonaktifkan. Untuk melakukannya, ada dua strategi umum: scaling aktivasi pada waktu ujian membalikkan dropout selama fase pelatihan Dua strategi dirangkum dalam slide di bawah ini, diambil dari Standford CS231n: Convolutional Neural Networks for …


2
Apa output dari tf.nn.dynamic_rnn ()?
Saya tidak yakin tentang apa yang saya mengerti dari dokumentasi resmi, yang mengatakan: Pengembalian: Sepasang (keluaran, status) tempat: outputs: Tensor keluaran RNN. Jika time_major == False(default), ini akan menjadi Tensor berbentuk: [batch_size, max_time, cell.output_size]. Jika time_major == True, ini akan menjadi Tensor berbentuk: [max_time, batch_size, cell.output_size]. Catatan, jika cell.output_sizetupel integer …


2
Seberapa pentingkah perluasan basis untuk jaring dalam?
Jika jaring saraf yang dalam dianggap sebagai penduga fungsi universal, apakah perluasan basis benar-benar diperlukan? Atau apakah ini spesifik kasus? Misalnya, jika seseorang memiliki tiga variabel X kuantitatif, apakah akan ada keuntungan dalam memperluas jumlah variabel dengan memperkenalkan interaksi, polinomial, dll.? Ini tampaknya memiliki utilitas yang baik dalam RF misalnya …

1
MSE sebagai proksi Korelasi Pearson dalam Masalah Regresi
TL; DR (terlalu panjang, tidak dibaca): Saya sedang mengerjakan masalah prediksi deret waktu, yang saya rumuskan sebagai masalah Regresi menggunakan Deep Learning (keras). Saya ingin mengoptimalkan korelasi Pearson antara prediksi saya dan label yang sebenarnya. Saya bingung dengan fakta bahwa menggunakan MSE sebagai proxy sebenarnya mengarah ke hasil yang lebih …

2
Fitur diekstraksi dengan max pooling vs mean pooling
Dalam pembelajaran yang mendalam, dan ini adalah aplikasi untuk visi komputer, apakah mungkin untuk mengetahui fitur apa dari kedua jenis ekstrak pooling ini? misalnya apakah mungkin untuk mengatakan bahwa max pool mengekstraksi tepi? Bisakah kita mengatakan sesuatu yang serupa tentang pooling jahat? PS merasa bebas untuk merekomendasikan jika stackoverflow lebih …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.