Pertanyaan yang diberi tag «machine-learning»

Metode dan prinsip membangun "sistem komputer yang secara otomatis meningkatkan dengan pengalaman."


5
Apa masalah "ReLU yang sekarat" dalam jaringan saraf?
Mengacu pada catatan kursus Stanford tentang Jaringan Syaraf Konvolusional untuk Pengenalan Visual , sebuah paragraf mengatakan: "Sayangnya, unit ReLU bisa rapuh selama pelatihan dan bisa" mati ". Misalnya, gradien besar yang mengalir melalui neuron ReLU dapat menyebabkan bobot diperbarui sedemikian rupa sehingga neuron tidak akan pernah diaktifkan pada titik data …

5
Fungsi cross-entropy error dalam jaringan saraf
Dalam MNIST For ML Beginners mereka mendefinisikan cross-entropy sebagai Hy′( y) : = - Âsayay′sayacatatan( ysaya)Hy′(y): =-∑sayaysaya′catatan⁡(ysaya)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) ysayaysayay_i adalah nilai probabilitas yang diprediksi untuk kelas dan adalah probabilitas sebenarnya untuk kelas itu.sayasayaiy′sayaysaya′y_i' pertanyaan 1 Bukankah ini masalah (dalam ) bisa 0? Ini berarti …

15
Python vs R untuk pembelajaran mesin
Saya baru mulai mengembangkan aplikasi pembelajaran mesin untuk tujuan akademik. Saat ini saya menggunakan R dan melatih diri saya di dalamnya. Namun, di banyak tempat, saya telah melihat orang menggunakan Python . Apa yang digunakan orang di dunia akademis dan industri, dan apa rekomendasinya?

8
Memilih tingkat pembelajaran
Saat ini saya sedang mengerjakan implementasi Stochastic Gradient Descent,, SGDuntuk jaring saraf menggunakan back-propagation, dan sementara saya mengerti tujuannya, saya punya beberapa pertanyaan tentang bagaimana memilih nilai untuk tingkat pembelajaran. Apakah tingkat pembelajaran terkait dengan bentuk gradien kesalahan, karena menentukan tingkat keturunan? Jika demikian, bagaimana Anda menggunakan informasi ini untuk …



5
Mengapa fungsi biaya menggunakan kesalahan kuadrat?
Saya baru memulai dengan beberapa pembelajaran mesin, dan sampai sekarang saya telah berurusan dengan regresi linier atas satu variabel. Saya telah belajar bahwa ada hipotesis, yaitu: hθ(x)=θ0+θ1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x Untuk mengetahui nilai yang baik untuk parameter dan kami ingin meminimalkan perbedaan antara hasil yang dihitung dan hasil aktual dari data pengujian kami. …


8
Ilmuwan data vs insinyur pembelajaran mesin
Apa perbedaan, jika ada, antara "ilmuwan data" dan "insinyur pembelajaran mesin"? Selama setahun terakhir atau lebih "insinyur pembelajaran mesin" telah mulai muncul banyak dalam posting pekerjaan. Ini terutama terlihat di San Francisco, yang bisa dibilang dari mana istilah "ilmuwan data" berasal. Pada satu titik "ilmuwan data" menyalip "ahli statistik", dan …

3
Keuntungan dari AUC vs akurasi standar
Saya mulai melihat ke area di bawah kurva (AUC) dan saya sedikit bingung tentang kegunaannya. Ketika pertama kali menjelaskan kepada saya, AUC tampaknya menjadi ukuran kinerja yang hebat tetapi dalam penelitian saya, saya telah menemukan bahwa beberapa mengklaim keunggulannya sebagian besar marjinal karena yang terbaik untuk menangkap model 'beruntung' dengan …

6
string sebagai fitur di pohon keputusan / hutan acak
Saya melakukan beberapa masalah pada aplikasi pohon keputusan / hutan acak. Saya mencoba menyesuaikan masalah yang memiliki angka dan juga string (seperti nama negara) sebagai fitur. Sekarang perpustakaan, scikit-learn hanya mengambil angka sebagai parameter, tapi saya ingin menyuntikkan string dan mereka membawa banyak pengetahuan. Bagaimana saya menangani skenario seperti itu? …



3
RNN vs CNN di tingkat tinggi
Saya sudah memikirkan Recurrent Neural Networks (RNN) dan varietas mereka dan Convolutional Neural Networks (CNN) dan varietas mereka. Apakah kedua poin ini adil untuk dikatakan: Gunakan CNN untuk memecah komponen (seperti gambar) menjadi subkomponen (seperti objek dalam gambar, seperti garis besar objek dalam gambar, dll.) Gunakan RNN untuk membuat kombinasi …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.