Anda mungkin ingin memeriksa referensi ini . Sci-kit learning mengimplementasikan regresi logistik acak dan metodenya dijelaskan di sana.
Tetapi untuk menjawab pertanyaan Anda, kedua metode ini sangat berbeda dalam tujuan mereka. Regresi logistik adalah tentang pemasangan model dan RLR adalah tentang menemukan variabel yang masuk ke dalam model.
Regresi logistik vanili adalah model linier umum. Untuk respons biner, kami berpendapat bahwa peluang log dari probabilitas respons adalah fungsi linier dari sejumlah prediktor. Koefisien prediktor diperkirakan menggunakan kemungkinan maksimum dan kesimpulan tentang parameter kemudian didasarkan pada sifat sampel yang besar dari model. Untuk hasil terbaik, kami biasanya menganggap bahwa model ini cukup sederhana dan dipahami dengan baik. Kami tahu variabel independen apa yang memengaruhi respons. Kami ingin memperkirakan parameter model.
Tentu saja, dalam praktiknya, kita tidak selalu tahu variabel apa yang harus dimasukkan dalam model. Ini terutama benar dalam situasi pembelajaran mesin di mana jumlah variabel penjelas potensial sangat besar dan nilainya jarang.
Selama bertahun-tahun, banyak orang telah mencoba menggunakan teknik pemasangan model statistik untuk tujuan pemilihan variabel (baca "fitur"). Dalam meningkatkan tingkat keandalan:
- Sesuaikan model besar dan drop variabel dengan statistik Wald yang tidak signifikan. Tidak selalu menghasilkan model terbaik.
- Lihatlah semua model yang mungkin dan pilih yang "terbaik". Komputasi intensif dan tidak kuat.
- Pas dengan model besar dengan istilah hukuman L1 (gaya laso). Variabel-variabel yang tidak berguna menjadi tidak cocok. Lebih baik, tetapi tidak stabil dengan matriks jarang.
- Metode acak 3. Ambil himpunan bagian acak, paskan model yang dikenakan sanksi untuk masing-masing dan susun hasilnya. Variabel yang sering muncul dipilih. Ketika responsnya adalah biner, ini adalah regresi logistik acak. Teknik serupa dapat ditarik dengan data kontinu dan model linear umum.