Pertanyaan yang diberi tag «machine-learning»

Algoritma pembelajaran mesin membangun model data pelatihan. Istilah "pembelajaran mesin" secara samar didefinisikan; itu termasuk apa yang juga disebut pembelajaran statistik, pembelajaran penguatan, pembelajaran tanpa pengawasan, dll. SELALU MENAMBAH TAG LEBIH SPESIFIK.

1
Statistik untuk pembelajaran mesin, makalah untuk memulai?
Saya memiliki latar belakang dalam pemrograman komputer dan teori bilangan dasar, tetapi tidak ada pelatihan statistik nyata, dan baru-baru ini "menemukan" bahwa dunia yang menakjubkan dari berbagai teknik sebenarnya adalah dunia statistik. Tampaknya faktorisasi matriks, penyelesaian matriks, tensor dimensi tinggi, embedding, estimasi kepadatan, inferensi Bayesian, partisi Markov, perhitungan eigenvektor, PageRank …

1
Bisakah model P (Y | X) dilatih melalui stochastic gradient descent dari sampel non-iid P (X) dan sampel iid dari P (Y | X)?
Ketika melatih model parameter (misalnya untuk memaksimalkan kemungkinan) melalui penurunan gradien stokastik pada beberapa set data, umumnya diasumsikan bahwa sampel pelatihan diambil di awal dari distribusi data pelatihan. Jadi, jika tujuannya adalah untuk memodelkan distribusi bersama , maka setiap sampel pelatihan harus diambil iid dari distribusi itu.P(X,Y)P(X,Y)P(X,Y)(xi,yi)(xi,yi)(x_i,y_i) Jika tujuannya adalah …


2
Regularisasi norma
Ada banyak metode untuk melakukan regularisasi - , , dan regularisasi berbasis misalnya. Menurut Friedman Hastie & Tibsharani , pembuat peraturan terbaik tergantung pada masalah: yaitu sifat fungsi target yang sebenarnya, dasar tertentu yang digunakan, rasio sinyal terhadap kebisingan, dan ukuran sampel.L 1 L 2L.0L0L_0L.1L1L_1L.2L2L_2 Adakah penelitian empiris yang membandingkan …


3
Mengenai menggunakan model bigram (N-gram) untuk membangun vektor fitur untuk dokumen teks
Pendekatan tradisional konstruksi fitur untuk penambangan teks adalah pendekatan bag-of-words, dan dapat ditingkatkan menggunakan tf-idf untuk mengatur vektor fitur yang menjadi ciri dokumen teks yang diberikan. Saat ini, saya mencoba menggunakan model bahasa bi-gram atau (N-gram) untuk membangun vektor fitur, tetapi tidak cukup tahu bagaimana melakukannya? Bisakah kita cukup mengikuti …

1
Di luar kernel Fisher
Untuk sementara, sepertinya Fisher Kernels mungkin menjadi populer, karena mereka tampaknya menjadi cara untuk membangun kernel dari model probabilistik. Namun, saya jarang melihat mereka digunakan dalam praktik, dan saya memiliki otoritas yang baik sehingga mereka cenderung tidak bekerja dengan baik. Mereka mengandalkan perhitungan Informasi Fisher - mengutip Wikipedia: informasi Fisher …



1
Apakah MFCC adalah metode optimal untuk merepresentasikan musik ke sistem pengambilan?
Teknik pemrosesan sinyal, Mel frekuensi Cepstrum , sering digunakan untuk mengekstraksi informasi dari karya musik untuk digunakan dalam tugas pembelajaran mesin. Metode ini memberikan spektrum daya jangka pendek, dan koefisien digunakan sebagai input. Dalam mendesain sistem pengambilan musik, koefisien seperti itu dianggap sebagai karakteristik dari sebuah karya (jelas tidak harus …

8
Algoritma apa yang dapat digunakan untuk memprediksi penggunaan bahan habis pakai yang diberikan data dari pembelian sebelumnya?
Berpikir tentang masalah yang seharusnya sederhana namun menarik, saya ingin menulis beberapa kode untuk memperkirakan konsumsi yang akan saya butuhkan dalam waktu dekat mengingat sejarah lengkap pembelian saya sebelumnya. Saya yakin masalah semacam ini memiliki beberapa definisi yang lebih umum dan dipelajari dengan baik (seseorang menyarankan ini terkait dengan beberapa …

6
Bandingkan R-kuadrat dari dua model Hutan Acak yang berbeda
Saya menggunakan paket randomForest dalam R untuk mengembangkan model hutan acak untuk mencoba menjelaskan hasil yang berkelanjutan dalam dataset "lebar" dengan lebih banyak prediktor daripada sampel. Secara khusus, saya memasang satu model RF yang memungkinkan prosedur untuk memilih dari serangkaian ~ 75 variabel prediktor yang menurut saya penting. Saya menguji …

2
Dasar pemikiran menggunakan AUC?
Terutama di sisi yang berorientasi pada ilmu komputer dari literatur pembelajaran mesin, AUC (area di bawah kurva karakteristik operator penerima) adalah kriteria populer untuk mengevaluasi pengklasifikasi. Apa justifikasi untuk menggunakan AUC? Misalnya, apakah ada fungsi kerugian tertentu yang keputusan optimalnya adalah pengklasifikasi dengan AUC terbaik?

1
Signifikansi koefisien regresi (GAM) ketika kemungkinan model tidak secara signifikan lebih tinggi dari nol
Saya menjalankan regresi berbasis GAM menggunakan gamls paket R dan mengasumsikan distribusi beta data nol. Saya hanya memiliki variabel penjelas tunggal dalam model saya, jadi pada dasarnya: mymodel = gamlss(response ~ input, family=BEZI). Algoritme memberi saya koefisien untuk dampak variabel penjelas ke dalam mean ( ) dan nilai-p terkait untuk …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.