Apakah model pembelajaran yang mendalam bersifat parametrik? Atau non-parametrik?


12

Saya tidak berpikir ada satu jawaban untuk semua model pembelajaran yang mendalam. Yang model pembelajarannya dalam adalah parametrik dan mana yang non-parametrik dan mengapa?


2
Ajukan pertanyaan pada diri sendiri: apakah jumlah parameter meningkat saat Anda memproses contoh pelatihan baru selama pelatihan? Jika demikian, metode ini non-parametrik.
Vladislavs Dovgalecs

3
Mengingat kalimat pertama Anda, bukankah kalimat kedua Anda menjadi judul yang lebih baik?
Glen_b -Reinstate Monica

Bisakah Anda mendefinisikan apa yang Anda maksud dengan parametrik dan non-parametrik? Ini tidak jelas seperti yang diasumsikan oleh beberapa orang, lihat wiki ini: en.wikipedia.org/wiki/Nonparametric_statistics untuk contoh ambiguitas
Repmat

Jawaban:


10

Model pembelajaran dalam umumnya parametrik - sebenarnya mereka memiliki sejumlah besar parameter, satu untuk setiap bobot yang disetel selama pelatihan.

Karena jumlah bobot umumnya tetap konstan, secara teknis mereka memiliki derajat kebebasan yang tetap. Namun, karena ada begitu banyak parameter, mereka mungkin terlihat meniru non-parametrik.

Proses Gaussian (misalnya) menggunakan masing-masing pengamatan sebagai bobot baru dan karena jumlah titik menuju tak terbatas demikian juga jumlah bobot (jangan dikacaukan dengan parameter hiper).

Saya katakan secara umum karena ada begitu banyak rasa yang berbeda dari masing-masing model. Misalnya dokter berpangkat rendah memiliki jumlah parameter terbatas yang disimpulkan oleh data dan saya yakin seseorang telah membuat beberapa jenis dnn non-parametrik di beberapa kelompok penelitian!


kebanyakan orang bingung bahwa pada umumnya, NNs adalah model Non-para karena mereka melakukan beberapa pemilihan fitur seperti peningkatan poin data, lucu !, kemudian regresi linier dengan L1-regularisasi juga Non-parametrik, sungguh bencana ..!. Terima kasih, @j__ untuk menjawabnya dengan jelas. Sejauh ini saya tidak menemukan jawaban yang jelas & ringkas. Jika Anda melihat ada tautan web / makalah penelitian tentang topik ini, silakan posting di sini, akan lebih baik untuk membaca lebih lanjut.
Anu

3

Standar jaringan saraf dalam (DNN), secara teknis, parametrik karena memiliki sejumlah parameter tetap. Namun, sebagian besar DNNs memiliki begitu banyak parameter yang mereka bisa ditafsirkan sebagai nonparametrik ; telah terbukti bahwa dalam batas lebar tak terbatas, jaringan saraf yang dalam dapat dilihat sebagai proses Gaussian (GP), yang merupakan model nonparametrik [Lee et al., 2018].

Namun demikian, mari kita secara ketat menafsirkan DNN sebagai parametrik untuk sisa jawaban ini.

Beberapa contoh model pembelajaran mendalam parametrik adalah:

  • Jaringan autoregresif dalam (DARN)
  • Jaringan kepercayaan Sigmoid (SBN)
  • Jaringan saraf berulang (RNN), Pixel CNN / RNN
  • Variational autoencoder (VAE), model Gaussian laten dalam lainnya misalnya DRAW

Beberapa contoh model pembelajaran nonparametrik adalah:

  • Proses Deep Gaussian (GPs)
  • GP berulang
  • Negara ruang GP
  • Proses Dirichlet hirarkis
  • Proses Buffet India bertingkat

spektrum model variabel laten

Gambar dari tutorial Shakir Mohamed tentang model generatif mendalam .

Referensi:


1

Deutsch and Journel (1997, hlm. 16-17) berpendapat tentang sifat menyesatkan dari istilah "non-parametrik". Mereka menyarankan bahwa ≪ ... model terminologi "kaya parameter" harus dipertahankan untuk model berbasis indikator alih-alih kualifikasi tradisional tetapi menyesatkan "non-parametrik" .≫

"Parameter kaya" mungkin deskripsi yang akurat, tetapi "kaya" memiliki muatan emosional yang memberikan pandangan positif yang mungkin tidak selalu dijamin (!).

Beberapa profesor mungkin masih bertahan yang merujuk secara kolektif ke jaring saraf, hutan acak, dan sejenisnya karena semuanya "non-parametrik". Meningkat opacity dan piecewise sifat jaring saraf (terutama dengan penyebaran fungsi aktivasi ReLU) membuat mereka non-parameteric- esque .


0

Model pembelajaran yang mendalam tidak harus dianggap parametrik. Model parametrik didefinisikan sebagai model yang didasarkan pada asumsi a priori tentang distribusi yang menghasilkan data. Jaring yang dalam tidak membuat asumsi tentang proses pembuatan data, melainkan menggunakan sejumlah besar data untuk mempelajari fungsi yang memetakan input ke output. Pembelajaran mendalam adalah non-parametrik dengan definisi yang masuk akal.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.