Pertanyaan yang diberi tag «tensorflow»

Pustaka Python untuk pembelajaran mendalam yang dikembangkan oleh Google. Gunakan tag ini untuk setiap pertanyaan pada topik yang (a) melibatkan tensorflow baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan hanya tentang bagaimana menggunakan tensorflow.

6
Adam optimizer dengan peluruhan eksponensial
Dalam sebagian besar kode Tensorflow yang saya lihat Adam Optimizer digunakan dengan Laju Pembelajaran konstan 1e-4(yaitu 0,0001). Kode biasanya terlihat sebagai berikut: ...build the model... # Add the optimizer train_op = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) # Add the ops to initialize variables. These will include # the optimizer slots added by AdamOptimizer(). init_op …

1
Apa bedanya softmax_cross_entropy_with_logits dari softmax_cross_entropy_with_logits_v2?
Secara khusus, saya kira saya bertanya-tanya tentang pernyataan ini: Versi utama masa depan TensorFlow akan memungkinkan gradien mengalir ke input label pada backprop secara default. Yang ditampilkan saat saya gunakan tf.nn.softmax_cross_entropy_with_logits. Dalam pesan yang sama ia mendesak saya untuk melihatnya tf.nn.softmax_cross_entropy_with_logits_v2. Saya melihat melalui dokumentasi tetapi hanya menyatakan bahwa untuk …

3
Machine Learning: Haruskah saya menggunakan entropi silang kategoris atau kehilangan entropi silang biner untuk prediksi biner?
Pertama-tama, saya menyadari jika saya perlu melakukan prediksi biner, saya harus membuat setidaknya dua kelas melalui melakukan satu-hot-encoding. Apakah ini benar? Namun, apakah binary cross entropy hanya untuk prediksi dengan hanya satu kelas? Jika saya menggunakan kerugian entropi lintas kategoris yang biasanya ditemukan di sebagian besar perpustakaan (seperti TensorFlow), apakah …


5
Memahami unit LSTM vs. sel
Saya telah mempelajari LSTM untuk sementara waktu. Saya mengerti pada tingkat tinggi bagaimana semuanya bekerja. Namun, akan mengimplementasikannya menggunakan Tensorflow saya perhatikan bahwa BasicLSTMCell memerlukan sejumlah unit (yaitu num_units) parameter. Dari ini penjelasan yang sangat menyeluruh LSTMs, saya sudah mengumpulkan bahwa satu satuan LSTM adalah salah satu dari berikut ini …

3
Membangun autoencoder di Tensorflow untuk melampaui PCA
Hinton dan Salakhutdinov dalam Mengurangi Dimensi Data dengan Neural Networks, Science 2006 mengusulkan PCA non-linear melalui penggunaan autoencoder yang mendalam. Saya telah mencoba membangun dan melatih autoencoder PCA dengan Tensorflow beberapa kali tetapi saya tidak pernah dapat memperoleh hasil yang lebih baik daripada PCA linier. Bagaimana saya bisa melatih autoencoder …


2
cara menghitung kehilangan KLD vs kehilangan rekonstruksi dalam auto-encoder variasional
di hampir semua contoh kode yang pernah saya lihat dari VAE, fungsi kerugian didefinisikan sebagai berikut (ini adalah kode tensorflow, tapi saya pernah melihat yang serupa untuk theano, obor dll. Ini juga untuk convnet, tetapi itu juga tidak terlalu relevan , hanya mempengaruhi sumbu jumlah yang diambil alih): # latent …

1
Bagaimana cara menafsirkan histogram yang diberikan oleh TensorFlow di TensorBoard?
Saya baru-baru ini berlari dan belajar aliran tensor dan mendapat beberapa histogram yang saya tidak tahu bagaimana menafsirkannya. Biasanya saya menganggap tinggi batang sebagai frekuensi (atau frekuensi / jumlah relatif). Namun, kenyataan bahwa tidak ada balok seperti pada histogram biasa dan fakta bahwa banyak hal yang diarsir membuat saya bingung. …

3
Relu vs Sigmoid vs Softmax sebagai neuron lapisan tersembunyi
Saya bermain dengan Neural Network sederhana dengan hanya satu lapisan tersembunyi, oleh Tensorflow, dan kemudian saya mencoba berbagai aktivasi untuk lapisan tersembunyi: Relu Sigmoid Softmax (well, biasanya softmax digunakan di lapisan terakhir ..) Relu memberikan akurasi kereta terbaik & akurasi validasi. Saya tidak yakin bagaimana menjelaskannya. Kita tahu bahwa Relu …



1
Kehilangan fungsi untuk autoencoder
Saya bereksperimen sedikit autoencoder, dan dengan tensorflow saya membuat model yang mencoba merekonstruksi dataset MNIST. Jaringan saya sangat sederhana: X, e1, e2, d1, Y, di mana e1 dan e2 adalah lapisan pengkodean, d2 dan Y adalah lapisan decoding (dan Y adalah output yang direkonstruksi). X memiliki 784 unit, e1 memiliki …

3
Perbedaan antara sampel, langkah waktu dan fitur dalam jaringan saraf
Saya akan melalui blog berikut pada jaringan saraf LSTM: http://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/ Penulis membentuk kembali vektor input X sebagai [sampel, langkah waktu, fitur] untuk konfigurasi LSTM yang berbeda. Penulis menulis Memang, urutan huruf adalah langkah waktu dari satu fitur daripada satu langkah waktu dari fitur yang terpisah. Kami telah memberikan lebih banyak …

4
Apakah mungkin untuk memberikan gambar berukuran variabel sebagai input ke jaringan saraf convolutional?
Bisakah kita memberikan gambar dengan ukuran variabel sebagai input ke jaringan saraf convolutional untuk deteksi objek? Jika memungkinkan, bagaimana kita bisa melakukan itu? Tetapi jika kita mencoba memotong gambar, kita akan kehilangan sebagian dari gambar dan jika kita mencoba untuk mengubah ukuran, maka, kejelasan gambar akan hilang. Apakah ini berarti …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.