Pertanyaan yang diberi tag «machine-learning»

Algoritma pembelajaran mesin membangun model data pelatihan. Istilah "pembelajaran mesin" secara samar didefinisikan; itu termasuk apa yang juga disebut pembelajaran statistik, pembelajaran penguatan, pembelajaran tanpa pengawasan, dll. SELALU MENAMBAH TAG LEBIH SPESIFIK.


2
Teknik augmentasi data untuk dataset umum?
Dalam banyak aplikasi pembelajaran mesin, metode augmentasi data yang disebut telah memungkinkan membangun model yang lebih baik. Misalnya, asumsikan satu set pelatihan gambar kucing dan anjing. Dengan memutar, mirroring, menyesuaikan kontras, dll. Dimungkinkan untuk menghasilkan gambar tambahan dari yang asli.100100100 Dalam hal gambar, augmentasi data relatif mudah. Namun, anggaplah (misalnya) …


3
Langkah pertama untuk data besar ( , )
Misalkan Anda menganalisis kumpulan data besar dengan jumlah milyaran pengamatan per hari, di mana setiap pengamatan memiliki beberapa ribu variabel yang mungkin jarang dan variabel numerik dan kategororial yang berlebihan. Katakanlah ada satu masalah regresi, satu masalah klasifikasi biner yang tidak seimbang, dan satu tugas "mencari tahu prediktor mana yang …

2
Membandingkan pengelompokan: Indeks Rand vs Variasi Informasi
Saya bertanya-tanya apakah ada yang punya wawasan atau intuisi di balik perbedaan antara Variasi Informasi dan Indeks Rand untuk membandingkan pengelompokan. Saya telah membaca makalah " Membandingkan Clusterings - Sebuah Jarak Berbasis Informasi " oleh Marina Melia (Journal of Multivariate Analysis, 2007), tetapi, selain memperhatikan perbedaan dalam definisi, saya tidak …


4
Apakah pohon keputusan hampir selalu pohon biner?
Hampir setiap contoh pohon keputusan yang saya temui kebetulan merupakan pohon biner. Apakah ini cukup universal? Apakah sebagian besar algoritma standar (C4.5, CART, dll.) Hanya mendukung pohon biner? Dari apa yang saya kumpulkan, CHAID tidak terbatas pada pohon biner, tapi itu sepertinya pengecualian. Perpecahan dua arah diikuti oleh perpecahan dua …

2
Validasi Silang (generalisasi kesalahan) setelah pemilihan model
Catatan: Kasing adalah n >> p Saya membaca Elemen Pembelajaran Statistik dan ada berbagai menyebutkan tentang cara "benar" untuk melakukan validasi silang (misalnya halaman 60, halaman 245). Secara khusus, pertanyaan saya adalah bagaimana mengevaluasi model akhir (tanpa set tes terpisah) menggunakan k-fold CV atau bootstrap ketika telah ada pencarian model? …


1
Haruskah saya membuat keputusan berdasarkan langkah-langkah evaluasi mikro-rata-rata atau rata-rata makro?
Saya menjalankan validasi silang 10 kali lipat pada algoritma klasifikasi biner yang berbeda, dengan dataset yang sama, dan menerima hasil rata-rata Mikro dan Makro. Harus disebutkan bahwa ini adalah masalah klasifikasi multi-label. Dalam kasus saya, negatif sejati dan positif sejati juga diberi bobot yang sama. Itu berarti memprediksi dengan benar …

1
Fungsi apa yang bisa menjadi kernel?
Dalam konteks pembelajaran mesin dan pengenalan pola, ada konsep yang disebut Kernel Trick . Menghadapi masalah di mana saya diminta untuk menentukan apakah suatu fungsi bisa menjadi fungsi kernel atau tidak, apa sebenarnya yang harus dilakukan? Haruskah saya periksa dulu apakah mereka dalam bentuk tiga atau empat fungsi kernel seperti …


1
Perbedaan antara model Hidden Markov dan Particle Filter (dan Kalman Filter)
Ini pertanyaan lama saya Saya ingin bertanya apakah seseorang mengetahui perbedaan (jika ada perbedaan) antara model Hidden Markov (HMM) dan Particle Filter (PF), dan sebagai konsekuensinya, Kalman Filter, atau dalam kondisi apa kami menggunakan algoritma mana. Saya seorang siswa dan saya harus melakukan proyek, tetapi pertama-tama saya harus memahami beberapa …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.