Deep neural networks - Hanya untuk klasifikasi gambar?

Semua contoh yang saya temukan menggunakan keyakinan mendalam atau jaringan saraf convolutional menggunakannya untuk klasifikasi gambar, deteksi bakteri atau pengenalan suara.

Apakah jaringan syaraf yang dalam juga berguna untuk tugas-tugas regresi klasik, di mana fitur-fiturnya tidak terstruktur (misalnya, tidak diatur dalam urutan atau kisi)? Jika ya, bisakah Anda memberi contoh?

— Julian
sumber

Kalimat pertama Anda memunculkan jaringan saraf convolutional. Tampaknya Anda membingungkan mereka dengan jaringan kepercayaan yang mendalam. Mereka tidak sama, meskipun keduanya adalah bentuk jaringan saraf.

— MSalters

Saya akan setuju dengan @msalters, tetapi akan mengatakan bahwa jaringan kepercayaan yang mendalam adalah jaringan yang benar-benar mendalam, dan memiliki keberhasilan yang terbatas, sedangkan jaring konvolusional lebih seperti filter gambar adaptif hibrida di lapisan convolutional diikuti oleh dangkal nn.

— seanv507

Apa yang Anda maksudkan dengan "pengamatan" sebagai "tidak terstruktur (tidak diatur dalam urutan atau kisi)"? Apakah Anda merujuk pada gambar yang "terstruktur" dalam arti bahwa masing-masing piksel disusun pada kisi? Tapi kemudian itu fitur yang "terstruktur", bukan "pengamatan" (itu akan menjadi gambar individu)?

— Amuba mengatakan Reinstate Monica

Saya akan mengatakan semua jaringan Konvolusi dalam, tidak semua jaringan dalam adalah konvolusi, dan juga semua jaringan kepercayaan yang mendalam, tidak semua jaringan dalam adalah jaringan kepercayaan yang mendalam. Memang Anda dapat memiliki jaringan yang dalam yang tidak dalam atau konvolusional, mereka cenderung sulit untuk dilatih. Namun tentu saja ada ruang untuk debat tak berguna tentang terminologi.

— Lyndon White

Anda tidak dapat menerapkan jaringan konvolusional ke data yang tidak terstruktur (tidak dalam urutan / kisi, dll). Ini pada dasarnya tidak masuk akal. Jaringan konvolusional terkait erat dengan mengambil transformasi Fourier dari input Anda - misalnya untuk sekuens yang mengubahnya dari domain waktu ke domain frekuensi.

— Lyndon White

Jawaban:

Karakteristik gambar yang membuatnya dapat diklasifikasi dengan jaringan saraf yang dalam adalah ada banyak fitur (mungkin jutaan jika tidak milyaran piksel dengan RGB, intensitas, dll.) Dan jika Anda memiliki label yang akurat, itu bukan data yang berisik. Kamera saat ini sangat bagus dan tidak salah mengukur apa pun. Berkat Internet, kami sekarang memiliki banyak gambar berlabel akurat. Jaringan yang dalam dapat mengekspresikan fungsi rumit yang sewenang-wenang, yang merupakan masalah dengan data bising karena Anda dapat dengan mudah menyesuaikan kebisingan, karenanya mengapa banyak metode pembelajaran cenderung menghukum model yang rumit. Namun, dalam hal pengenalan gambar, fungsi sebenarnya tampaknya sangat rumit, kami tidak tahu seperti apa bentuk fungsionalnya, dan kami bahkan tidak tahu fitur apa yang relevan dalam banyak kasus.

Ini tidak berarti Anda tidak dapat menggunakan jaringan dalam untuk mempelajari fungsi yang tidak ada hubungannya dengan gambar. Anda hanya perlu sangat berhati-hati tentang sisi buruknya, sebagian besar hal itu sangat rentan terhadap overfitting, tetapi juga bahwa itu mahal secara komputasi dan dapat membutuhkan waktu lama untuk melatih (tidak banyak masalah hari ini dengan SGD dan GPU paralel). Kelemahan lainnya adalah Anda memiliki interpretabilitas model yang sangat sedikit atau tidak ada, yang tidak terlalu penting untuk klasifikasi gambar. Kami hanya mencoba membuat komputer untuk mengenali perbedaan antara simpanse dan orangutan. Pemahaman manusia tentang formula itu tidak masalah. Untuk domain lain, terutama diagnosa medis, penelitian kebijakan, dll., Anda ingin atau bahkan mungkin membutuhkan pemahaman manusia.

— Adam Acosta
sumber

Tentu Anda dapat menggunakan jaringan saraf yang dalam untuk banyak masalah selain dari pengenalan gambar atau ucapan. Masalahnya adalah jika Anda benar-benar membutuhkannya.

Jaringan saraf dalam jauh lebih kuat daripada MLP sederhana namun mereka juga membutuhkan lebih banyak sumber daya dan lebih sulit untuk dikembangkan. Dengan demikian mereka digunakan dalam domain yang sangat kompleks. Anda dapat menggunakannya untuk memecahkan masalah yang lebih mudah tetapi biasanya model yang lebih sederhana mendapatkan hasil yang baik juga.

Menggunakan jaringan saraf yang dalam untuk masalah mudah akan seperti membunuh lalat dengan bazoka, yakin Anda akan membunuh mereka tetapi tidak bisakah Anda menemukan cara yang lebih sederhana?

— davidivad
sumber

Ini bukan jawaban. Apa yang mudah apa yang sulit? Memprediksi pasar saham / melakukan ekstrapolasi dari contoh-contoh terbatas / ... ADA banyak masalah sulit yang mendalam dan bagus pada semuanya?

— seanv507

Saya belum mengatakan bahwa jaringan saraf yang dalam dapat memecahkan apa pun. Yang saya maksud adalah bahwa mereka digunakan dalam domain kompleks di mana Anda memiliki banyak entri. Saya tahu bahwa mereka tidak dapat menyelesaikan setiap masalah tetapi bukan itu inti dari pertanyaan ini. Intinya menekankan bahwa mereka dapat diterapkan untuk masalah lain selain dari pengenalan gambar / ucapan tetapi mereka memiliki kelemahan yang patut dipertimbangkan dalam kasus-kasus di mana model lain dapat diterapkan.

— davidivad

Saya setuju dengan jawaban davidivad. Tetapi juga saya pikir penerapan jaringan saraf yang dalam untuk gambar adalah bahwa gambar (dan, yang lebih penting, gambar berlabel ) relatif murah untuk dikumpulkan. Di domain lain, bisa jadi sangat mahal untuk mengumpulkan data dalam skala besar, terutama dalam batasan industri atau perusahaan pemerintah. Yang memperumit masalah ini adalah bahwa dalam banyak aplikasi, fenomena yang menarik relatif jarang, sehingga akan ada beberapa contoh berharga untuk dipelajari, sehingga upaya pengumpulan data skala besar pun mungkin menghasilkan sejumlah kecil anggota kelas tertentu.

— Sycorax berkata Reinstate Monica
sumber