Pertanyaan yang diberi tag «tensorflow»

Pustaka Python untuk pembelajaran mendalam yang dikembangkan oleh Google. Gunakan tag ini untuk setiap pertanyaan pada topik yang (a) melibatkan tensorflow baik sebagai bagian penting dari pertanyaan atau jawaban yang diharapkan, & (b) bukan hanya tentang bagaimana menggunakan tensorflow.

2
Apakah praktik umum untuk meminimalkan kerugian rata-rata dari batch bukan jumlah?
Tensorflow memiliki contoh tutorial tentang mengklasifikasikan CIFAR-10 . Pada tutorial, rata-rata kehilangan entropi silang di seluruh batch diminimalkan. def loss(logits, labels): """Add L2Loss to all the trainable variables. Add summary for for "Loss" and "Loss/avg". Args: logits: Logits from inference(). labels: Labels from distorted_inputs or inputs(). 1-D tensor of shape …

2
Bagaimana Dropout Spatial dalam 2D ​​diterapkan?
Ini dengan merujuk pada kertas Pelokalan Objek Efisien Menggunakan Jaringan Konvolusional , dan dari apa yang saya pahami dropout diimplementasikan dalam 2D. Setelah membaca kode dari Keras tentang bagaimana Dropout 2D Spasial diimplementasikan, pada dasarnya bentuk biner acak [batch_size, 1, 1, num_channels] diimplementasikan. Namun, apa sebenarnya yang dilakukan Dropout 2D …


5
Apakah biaya lintas-entropi masuk akal dalam konteks regresi?
Apakah biaya lintas-entropi masuk akal dalam konteks regresi (berlawanan dengan klasifikasi)? Jika demikian, dapatkah Anda memberikan contoh mainan melalui TensorFlow? Jika tidak, mengapa tidak? Saya membaca tentang cross-entropy di Neural Networks dan Deep Learning oleh Michael Nielsen dan sepertinya sesuatu yang secara alami dapat digunakan untuk regresi maupun klasifikasi, tetapi …

4
Bagaimana cara (secara sistematis) menyesuaikan tingkat pembelajaran dengan Gradient Descent sebagai Pengoptimal?
Orang luar ke bidang ML / DL; memulai kursus Belajar Udacity Deep yang didasarkan pada Tensorflow; melakukan penugasan 3 masalah 4; mencoba menyesuaikan tingkat belajar dengan konfigurasi berikut: Ukuran batch 128 Jumlah langkah: cukup untuk mengisi 2 zaman Ukuran lapisan tersembunyi: 1024, 305, 75 Inisialisasi berat: terpotong normal dengan std. …

2
Bagaimana cara gradient descent minibatch memperbarui bobot untuk setiap contoh dalam satu batch?
Jika kita memproses 10 contoh dalam satu batch, saya mengerti kita bisa menjumlahkan kerugian untuk setiap contoh, tetapi bagaimana cara backpropagation dalam hal memperbarui bobot untuk masing-masing contoh? Sebagai contoh: Contoh 1 -> kerugian = 2 Contoh 2 -> kerugian = -2 Ini menghasilkan kerugian rata-rata 0 (E = 0), …

2
Keras: mengapa kehilangan berkurang sementara val_loss meningkat?
Saya menyiapkan pencarian grid untuk sekelompok params. Saya mencoba mencari parameter terbaik untuk jaring neural Keras yang melakukan klasifikasi biner. Outputnya adalah 1 atau 0. Ada sekitar 200 fitur. Ketika saya melakukan pencarian kotak, saya mendapat banyak model dan parameternya. Model terbaik memiliki parameter ini: Epochs : 20 Batch Size …

2
Bagaimana Tensorflow `tf.train.Optimizer` menghitung gradien?
Saya mengikuti tutorial mnist Tensorflow ( https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/mnist/mnist_softmax.py ). Tutorial menggunakan tf.train.Optimizer.minimize(khusus tf.train.GradientDescentOptimizer). Saya tidak melihat argumen yang dilewatkan di mana pun untuk menentukan gradien. Apakah Tensor flow menggunakan diferensiasi numerik secara default? Apakah ada cara untuk lulus dalam gradien seperti yang Anda bisa scipy.optimize.minimize?

1
Apakah jaringan saraf biasanya membutuhkan waktu untuk “menendang” selama pelatihan?
Saya mencoba untuk melatih jaringan saraf yang mendalam untuk klasifikasi, menggunakan propagasi balik. Secara khusus, saya menggunakan jaringan saraf convolutional untuk klasifikasi gambar, menggunakan perpustakaan Tensor Flow. Selama pelatihan, saya mengalami beberapa perilaku aneh, dan saya hanya ingin tahu apakah ini tipikal, atau apakah saya mungkin melakukan sesuatu yang salah. …

1
Mengapa fitur Fourier acak tidak negatif?
Fitur Random Fourier menyediakan perkiraan untuk fungsi kernel. Mereka digunakan untuk berbagai metode kernel, seperti proses SVM dan Gaussian. Hari ini, saya mencoba menggunakan implementasi TensorFlow dan saya mendapat nilai negatif untuk setengah dari fitur saya. Seperti yang saya pahami, ini seharusnya tidak terjadi. Jadi saya kembali ke kertas aslinya …


1
Model pembelajaran dalam mana yang dapat mengklasifikasikan kategori yang tidak eksklusif satu sama lain
Contoh: Saya memiliki kalimat dalam deskripsi pekerjaan: "Java senior engineer in UK". Saya ingin menggunakan model pembelajaran yang mendalam untuk memperkirakannya sebagai 2 kategori: English dan IT jobs. Jika saya menggunakan model klasifikasi tradisional, hanya dapat memprediksi 1 label dengan softmaxfungsi di lapisan terakhir. Dengan demikian, saya dapat menggunakan 2 …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
mengenai format output untuk segmentasi semantik
Saat membaca makalah segmentasi semantik serta implementasi yang sesuai, saya menemukan bahwa beberapa pendekatan menggunakan softmax sementara yang lain menggunakan sigmoid untuk pelabelan tingkat piksel. Misalnya, sehubungan dengan kertas u-net , output adalah peta fitur dengan dua saluran. Saya telah melihat beberapa implementasi menggunakan softmax pada dua keluaran saluran ini. …

2
Apa output dari tf.nn.dynamic_rnn ()?
Saya tidak yakin tentang apa yang saya mengerti dari dokumentasi resmi, yang mengatakan: Pengembalian: Sepasang (keluaran, status) tempat: outputs: Tensor keluaran RNN. Jika time_major == False(default), ini akan menjadi Tensor berbentuk: [batch_size, max_time, cell.output_size]. Jika time_major == True, ini akan menjadi Tensor berbentuk: [max_time, batch_size, cell.output_size]. Catatan, jika cell.output_sizetupel integer …

3
Dalam Model Komputasi TensorFlow, apakah mungkin untuk menerapkan algoritma pembelajaran mesin umum?
https://www.tensorflow.org/ Semua proyek di TensorFlow yang saya lihat di GitHub mengimplementasikan beberapa jenis model Jaringan Saraf Tiruan. Mengingat TensorFlow merupakan peningkatan dari pada DAG (ini bukan asiklik lagi), saya bertanya-tanya apakah beberapa kekurangan yang melekat membuatnya tidak cocok untuk model pembelajaran mesin umum? Dalam Model Komputasi TensorFlow, apakah mungkin untuk …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.