Grup 1 :
Kompleksitas / kecepatan grup 1. tampaknya tidak terlalu sulit untuk menentukan apakah algoritma brute force digunakan (walaupun mungkin ada alternatif yang lebih efisien seperti algoritma "lompatan dan batas"). Misalnya, pemilihan subset penuh akan membutuhkan regresi agar sesuai dengan kumpulan fitur kandidat K. Kesesuaian OLS dari satu regresi linier memiliki kompleksitas O ( K 2 n ) (sesuai posting ini ) di mana n adalah ukuran sampel. Oleh karena itu, kompleksitas total brute-force seleksi bagian penuh harus O ( 2 K K 22KKO(K2n)n .O(2KK2n)
Kelompok 2 :
Kompleksitas / kecepatan kelompok 2. dibahas dalam bagian 3.8 dan 3.9 buku ini. Sebagai contoh, regresi ridge dengan penalti yang diberikan memiliki kompleksitas komputasi yang sama dengan regresi reguler. Karena λ perlu ditemukan menggunakan validasi silang, beban komputasi meningkat secara linier dalam jumlah pemisahan data yang digunakan dalam validasi silang (katakanlah, S ). Jika λ grid memiliki poin L , kompleksitas total regresi ridge dengan tuning parameter λ akan menjadi O ( L S K 2 n ) .λλSλLλO(LSK2n)
Ada beberapa pembicaraan tentang LASSO dalam buku ini, tetapi saya tidak dapat menemukan apa yang saya butuhkan. Namun, saya temukan di hlm. 443 dari Efron et al. "Least Angle Regression" (2004) bahwa kompleksitas LASSO untuk diberikan sama dengan kompleksitas OLS yang sesuai dengan regresi linier jika metode LARS digunakan. Kemudian kompleksitas total LASSO dengan tuning parameter λ akan menjadi O ( L S K 2 n ) . (Saya tidak membaca makalah itu dengan hati-hati, jadi tolong perbaiki saya jika saya salah.) Jaring elastis menggabungkan ridge dan LASSO; keduanya memiliki kompleksitas komputasi yang sama; karenanya, kompleksitas jaring elastis seharusnyaλλO(LSK2n)
mana A adalah ukuran grid dari parameter tuning α yang menyeimbangkan bobot bubungan versus LASSO.O(ALSK2n)Aα
Grup 3 :
Saya masih ketinggalan catatan tentang kompleksitas / kecepatan untuk grup 3. yang terdiri dari regresi komponen utama (PCR) dan partial least square (PLS).