Pertanyaan yang diberi tag «math»





2
Bagaimana cara memilih fungsi aktivasi?
Saya memilih fungsi aktivasi untuk lapisan output tergantung pada output yang saya butuhkan dan sifat-sifat fungsi aktivasi yang saya tahu. Sebagai contoh, saya memilih fungsi sigmoid ketika saya berhadapan dengan probabilitas, sebuah ReLU ketika saya berurusan dengan nilai-nilai positif, dan fungsi linier ketika saya berurusan dengan nilai-nilai umum. Dalam lapisan ...

2
Adakah argumen ilmiah / matematis yang mencegah pembelajaran mendalam dari menghasilkan AI yang kuat?
Saya membaca The Book of Why karya Judea Pearl , di mana ia menyebutkan bahwa pembelajaran yang mendalam hanyalah teknologi pemasangan kurva yang dimuliakan, dan tidak akan mampu menghasilkan kecerdasan seperti manusia. Dari bukunya ada diagram ini yang menggambarkan tiga tingkat kemampuan kognitif: Idenya adalah bahwa "kecerdasan" yang dihasilkan oleh ...


3
Masalah matematika macam apa yang ada di AI yang sedang dikerjakan orang?
Saya baru-baru ini mendapat posisi postdoc 18 bulan di departemen matematika. Ini adalah posisi dengan tugas mengajar yang relatif ringan dan banyak kebebasan tentang jenis penelitian apa yang ingin saya lakukan. Sebelumnya saya banyak melakukan penelitian dalam probabilitas dan kombinatorik. Tetapi saya berpikir untuk melakukan pekerjaan yang lebih berorientasi pada ...
11 research  math 

1
Apa operator Bellman dalam pembelajaran penguatan?
Dalam matematika, kata operator dapat merujuk ke beberapa konsep yang berbeda tetapi terkait. Operator dapat didefinisikan sebagai fungsi antara dua ruang vektor, dapat didefinisikan sebagai fungsi di mana domain dan codomain adalah sama, atau dapat didefinisikan sebagai fungsi dari fungsi (yang merupakan vektor) ke fungsi lain (untuk contoh, operator diferensial ...

2
Apakah mean-squared error selalu cembung dalam konteks jaringan saraf?
Berbagai sumber yang saya sebutkan menyebutkan bahwa MSE itu hebat karena cembung. Tapi saya tidak mengerti caranya, terutama dalam konteks jaringan saraf. Katakanlah kita memiliki yang berikut ini: XXX : dataset pelatihan YYY : target ΘΘ\Theta : himpunan parameter modelfΘfΘf_\Theta (model jaringan saraf dengan non-linearitas) Kemudian: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - ...
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.