Kesamaan
Pada dasarnya kedua jenis algoritma dikembangkan untuk menjawab satu pertanyaan umum dalam aplikasi pembelajaran mesin:
Prediktor yang diberikan (faktor) - bagaimana cara menggabungkan interaksi antara faktor-faktor ini untuk meningkatkan kinerja?x1,x2,…,xp
Salah satu caranya adalah dengan memperkenalkan prediktor baru: Tetapi ini terbukti merupakan ide yang buruk karena sejumlah besar parameter dan jenis interaksi yang sangat spesifik.xp+1=x1x2,xp+2=x1x3,…
Baik pemodelan Multilevel dan algoritma Deep Learning menjawab pertanyaan ini dengan memperkenalkan model interaksi yang jauh lebih cerdas. Dan dari sudut pandang ini mereka sangat mirip.
Perbedaan
Sekarang izinkan saya mencoba memberikan pemahaman saya tentang apa perbedaan konseptual yang hebat di antara mereka. Untuk memberikan beberapa penjelasan, mari kita lihat asumsi yang kita buat di masing-masing model:
Pemodelan bertingkat: 1 lapisan yang mencerminkan struktur data dapat direpresentasikan sebagai Bayesian Hierarchical Network . Jaringan ini diperbaiki dan biasanya berasal dari aplikasi domain.1
Deep Learning: 2 data dihasilkan oleh interaksi dari banyak faktor. Struktur interaksi tidak diketahui, tetapi dapat direpresentasikan sebagai faktorisasi berlapis: interaksi tingkat lebih tinggi diperoleh dengan mengubah representasi tingkat bawah.2
Perbedaan mendasar berasal dari ungkapan "struktur interaksi tidak dikenal" dalam Deep Learning. Kita dapat mengasumsikan beberapa prior pada jenis interaksi, tetapi algoritma mendefinisikan semua interaksi selama prosedur pembelajaran. Di sisi lain, kita harus mendefinisikan struktur interaksi untuk pemodelan Multilevel (kita belajar hanya memvariasikan parameter model setelahnya).
Contohnya
x1,x2,x3 and we define {x1} and {x2,x3} as different layers.
In the Multilevel modelling regression, for example, we will get the interactions x1x2 and x1x3, but we will never get the interaction x2x3. Of course, partly the results will be affected by the correlation of the errors, but this is not that important for the example.
In Deep learning, for example in multilayered Restricted Boltzmann machines (RBM) with two hidden layers and linear activation function, we will have all the possible polinomial interactions with the degree less or equal than three.
Common advantages and disadvantages
Multilevel modelling
(-) need to define the structure of interactions
(+) results are usually easier to interpret
(+) can apply statistics methods (evaluate confidence intervals, check hypotheses)
Deep learning
(-) requires huge amount of data to train (and time for training as well)
(-) results are usually impossible to interpret (provided as a black box)
(+) no expert knowledge required
(+) once well-trained, usually outperforms most other general methods (not application specific)
Hope it will help!