Pertanyaan yang diberi tag «statistical-learning»

Algoritme pembelajaran mesin membangun model data pelatihan. Istilah "pembelajaran mesin" didefinisikan secara samar; ini mencakup apa yang juga disebut pembelajaran statistik, pembelajaran penguatan, pembelajaran tanpa pengawasan, dll. SELALU TAMBAHKAN TAG YANG LEBIH KHUSUS.


2
Mengapa regresi ridge disebut "ridge", mengapa itu diperlukan, dan apa yang terjadi ketika pergi hingga tak terbatas?
Perkiraan koefisien regresi punggungan adalah nilai yang meminimalkanβ^Rβ^R\hat{\beta}^R RSS+λ∑j=1pβ2j.RSS+λ∑j=1pβj2. \text{RSS} + \lambda \sum_{j=1}^p\beta_j^2. Pertanyaan saya adalah: Jika , maka kita melihat bahwa ekspresi di atas berkurang ke RSS yang biasa. Bagaimana jika ? Saya tidak mengerti penjelasan buku teks tentang perilaku koefisien.λ=0λ=0\lambda = 0λ→∞λ→∞\lambda \to \infty Untuk membantu memahami konsep …

3
Pengelompokan atau klasifikasi yang diawasi?
Pertanyaan kedua adalah bahwa saya menemukan dalam suatu diskusi di suatu tempat di web berbicara tentang "pengelompokan terawasi", sejauh yang saya tahu, pengelompokan tanpa pengawasan, jadi apa sebenarnya arti di balik "pengelompokan yang diawasi"? Apa bedanya dengan "klasifikasi"? Ada banyak tautan yang membicarakan hal itu: http://www.cs.uh.edu/docs/cosc/technical-reports/2005/05_10.pdf http://books.nips.cc/papers/files/nips23/NIPS2010_0427.pdf http://engr.case.edu/ray_soumya/mlrg/supervised_clustering_finley_joachims_icml05.pdf http://www.public.asu.edu/~kvanlehn/Stringent/PDF/05CICL_UP_DB_PWJ_KVL.pdf http://www.machinelearning.org/proceedings/icml2007/papers/366.pdf …

3
Apa itu pencampuran data?
Istilah ini sering muncul di utas terkait metode . Apakah memadukan metode khusus dalam penambangan data dan pembelajaran statistik? Saya tidak bisa mendapatkan hasil yang relevan dari google. Tampaknya pencampuran adalah mencampur hasil dari banyak model dan menghasilkan hasil yang lebih baik. Apakah ada sumber daya yang membantu saya mengetahui …

1
Mengapa kita harus membahas perilaku konvergensi dari penduga yang berbeda dalam topologi yang berbeda?
Dalam bab pertama buku Algebraic Geometry dan Statistical Learning Theory yang berbicara tentang konvergensi estimasi dalam ruang fungsional yang berbeda, disebutkan bahwa estimasi Bayesian sesuai dengan topologi distribusi Schwartz, sedangkan estimasi kemungkinan maksimum sesuai dengan topologi sup-norm. (di halaman 7): Misalnya, sup-norm, LpLpL^p -norm, topologi lemah ruang Hilbert L2L2L^2 , …

2
Bagaimana vektor variabel mewakili hyperplane?
Saya membaca Elemen Pembelajaran Statistik dan pada halaman 12 (bagian 2.3) model linier dinotasikan sebagai: Yˆ=XTβˆY^=XTβ^\widehat{Y} = X^{T} \widehat{\beta} ... di mana adalah transpos dari vektor kolom prediktor / variabel / input independen. (Ini menyatakan sebelumnya "semua vektor diasumsikan vektor kolom" sehingga tidak akan membuat ini X T vektor baris …

1
Regresi logistik untuk data dari distribusi Poisson
Dari beberapa catatan pembelajaran mesin yang berbicara tentang beberapa metode klasifikasi diskriminatif, khususnya regresi logistik, di mana y adalah label kelas (0 atau 1) dan x adalah datanya, dikatakan bahwa: jika , dan , maka akan menjadi logistik.x|y=0∼Poisson(λ0)x|y=0∼Poisson(λ0)x|y = 0 \sim \mathrm{Poisson}(λ_0)x|y=1∼Poisson(λ1)x|y=1∼Poisson(λ1)x|y = 1 \sim \mathrm{Poisson}(λ_1)p(y|x)p(y|x)p(y|x) Mengapa ini benar?

1
Memperluas model 2 kelas ke masalah multi-kelas
Makalah ini pada Adaboost memberikan beberapa saran dan kode (halaman 17) untuk memperluas model 2-kelas ke masalah kelas-K. Saya ingin menggeneralisasi kode ini, sehingga saya dapat dengan mudah memasang model 2-kelas yang berbeda dan membandingkan hasilnya. Karena sebagian besar model klasifikasi memiliki antarmuka rumus dan predictmetode, beberapa di antaranya seharusnya …



2
Apakah Random Forest pilihan yang baik untuk Klasifikasi data yang tidak seimbang? [Tutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 3 tahun yang lalu . Terlepas dari pendekatan variabilitas data yang mirip dan terus meningkat, dapatkah hutan acak "sebagai …

1
Bingung dengan Penurunan Fungsi Regresi
Saya baru saja mendapat salinan The Elements of Statistics Learning oleh Hastie, Tibshirani, dan Friedman. Dalam bab 2 (Ikhtisar Pembelajaran yang Dibimbing) bagian 4 (Teori Keputusan Statistik), ia memberikan derivasi dari fungsi regresi. Misalkan menunjukkan vektor input acak bernilai nyata, dan variabel output acak bernilai nyata, dengan distribusi gabungan . …

2
Unsur-unsur alternatif Pembelajaran Statistik
Elemen Pembelajaran Statistik (ESL) adalah buku yang memiliki luas dan kedalaman fantastis. Ini mencakup penting untuk metode yang sangat modern dengan mengutip makalah di mana studi asli ini terjadi. Namun, saya benar-benar menemukan bahasa buku itu sangat sangat mahal. Saya percaya ada cara yang lebih mudah untuk membahas konsep. Saya …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.