Pertanyaan yang diberi tag «machine-learning»

Algoritma pembelajaran mesin membangun model data pelatihan. Istilah "pembelajaran mesin" secara samar didefinisikan; itu termasuk apa yang juga disebut pembelajaran statistik, pembelajaran penguatan, pembelajaran tanpa pengawasan, dll. SELALU MENAMBAH TAG LEBIH SPESIFIK.

1
Pengawasan jauh: diawasi, semi-diawasi, atau keduanya?
"Pengawasan jauh" adalah skema pembelajaran di mana pengklasifikasi dipelajari dengan perangkat pelatihan yang berlabel lemah (data pelatihan diberi label secara otomatis berdasarkan heuristik / aturan). Saya pikir baik pembelajaran yang diawasi, dan pembelajaran semi-diawasi dapat mencakup "pengawasan yang jauh" jika data yang diberi label secara heuristik / secara otomatis diberi …

1
Diskusi tentang pakaian dalam xgboost
Pengaturan saya adalah sebagai berikut: Saya mengikuti garis pedoman dalam "Pemodelan Prediktif Terapan". Jadi saya telah memfilter fitur-fitur terkait dan berakhir dengan yang berikut: 4900 titik data di set latihan dan 1600 titik data di set tes. Saya memiliki 26 fitur dan targetnya adalah variabel kontinu. Saya menerapkan validasi silang …


3
Apakah tunggul keputusan merupakan model linier?
Decision stump adalah pohon keputusan dengan hanya satu split. Ini juga dapat ditulis sebagai fungsi piecewise. Misalnya, anggap adalah vektor, dan adalah komponen pertama , dalam pengaturan regresi, beberapa tunggul keputusan dapatxxxx1x1x_1xxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} 3& x_1\leq 2 \\ 5 & x_1 > 2 \\ \end{cases} Tetapi apakah ini model linier? …


2
Boosting: mengapa laju pembelajaran disebut parameter regularisasi?
The tingkat belajar parameter ( ) di Gradient Meningkatkan menyusut kontribusi masing-masing model dasar baru -typically sebuah pohon yang dangkal yang ditambahkan dalam seri. Itu terbukti secara dramatis meningkatkan akurasi set tes, yang dapat dimengerti karena dengan langkah-langkah yang lebih kecil, minimum fungsi kerugian dapat dicapai lebih tepat. ν∈ [ …


2
Apa arti "Regresi Logistik"?
Saya sedang memeriksa implementasi Regresi Logistik dari sini . Setelah saya membaca artikel itu, sepertinya bagian yang penting adalah menemukan koefisien terbaik untuk menentukan fungsi sigmoid. Jadi saya hanya ingin tahu mengapa metode ini disebut "Regresi Logistik". Apakah ini terkait dengan fungsi logaritmik? Mungkin saya perlu info latar belakang sejarah …

1
Predictive Modeling - Haruskah kita peduli tentang pemodelan campuran?
Untuk pemodelan prediktif, apakah kita perlu memusatkan perhatian pada diri kita dengan konsep statistik seperti efek acak dan tidak independennya pengamatan (tindakan berulang)? Sebagai contoh.... Saya memiliki data dari 5 kampanye pengiriman langsung (terjadi selama setahun) dengan berbagai atribut dan tanda untuk pembelian. Idealnya, saya akan menggunakan semua data ini …

6
Programmer ingin masuk ke bidang pembelajaran mesin
Saya seorang pengembang perangkat lunak (kebanyakan. NET dan Python sekitar 5 tahun pengalaman). Apa yang bisa saya lakukan untuk membantu saya mendapatkan pekerjaan di bidang pembelajaran mesin atau benar-benar apa pun yang akan membuat saya memulai di bidang itu? Apakah gelar pascasarjana merupakan persyaratan yang sulit?


2
Kapan "Tetangga Terdekat" bermakna, hari ini?
Pada tahun 1999, Beyer et al. bertanya, Kapan "Tetangga Terdekat" bermakna? Adakah cara yang lebih baik untuk menganalisis dan memvisualisasikan efek jarak rata pada pencarian NN sejak 1999? Apakah set data yang diberikan memberikan jawaban yang berarti untuk masalah 1-NN? Masalah 10-NN? Masalah 100-NN? Bagaimana Anda para pakar mendekati pertanyaan …

6
Apa ide 'mendasar' pembelajaran mesin untuk memperkirakan parameter?
Gagasan statistik 'mendasar' untuk memperkirakan parameter adalah kemungkinan maksimum . Saya bertanya-tanya apa ide yang sesuai dalam pembelajaran mesin. Qn 1. Apakah adil untuk mengatakan bahwa ide 'mendasar' dalam pembelajaran mesin untuk memperkirakan parameter adalah: 'Kehilangan Fungsi' [Catatan: Adalah kesan saya bahwa algoritma pembelajaran mesin sering mengoptimalkan fungsi kerugian dan …

6
Apakah menyetel hyperparameter pada sampel dataset adalah ide yang buruk?
Saya memiliki dataset 140000 contoh dan 30 fitur yang saya latih beberapa pengklasifikasi untuk klasifikasi biner (SVM, Regresi Logistik, Hutan Acak dll) Dalam banyak kasus, penyetelan hyperparameter pada keseluruhan dataset menggunakan pencarian Grid atau Random terlalu memakan waktu. Saya mulai menggunakan teknik berikut Sub sampel dataset saya Gunakan fraksi yang …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.