Pertanyaan yang diberi tag «machine-learning»

Algoritma pembelajaran mesin membangun model data pelatihan. Istilah "pembelajaran mesin" secara samar didefinisikan; itu termasuk apa yang juga disebut pembelajaran statistik, pembelajaran penguatan, pembelajaran tanpa pengawasan, dll. SELALU MENAMBAH TAG LEBIH SPESIFIK.


2
Rumus AIC dalam Pengantar Pembelajaran Statistik
Saya sedikit bingung dengan formula yang disajikan dalam "Pengantar Pembelajaran Statistik" Hastie. Dalam Bab 6, halaman 212 (pencetakan keenam, tersedia di sini ), dinyatakan bahwa: AIC=RSSnσ^2+2dnAIC=RSSnσ^2+2dnAIC = \frac{RSS}{n\hat\sigma^2} + \frac{2d}{n} Untuk model linier dengan noise Gaussian, ddd menjadi jumlah prediktor dan σ^σ^\hat\sigmamenjadi estimasi varians kesalahan. Namun, σ^2=RSS(n−2)σ^2=RSS(n−2)\hat\sigma^2 = \frac{RSS}{(n-2)} Yang …


5
Mengapa (dan kapan) seseorang harus mempelajari fungsi hadiah dari sampel dalam pembelajaran penguatan?
Dalam pembelajaran penguatan, kami memiliki fungsi hadiah yang menginformasikan agen seberapa baik tindakan dan negara saat ini dilakukan. Dalam beberapa pengaturan umum fungsi hadiah adalah fungsi dari tiga variabel: Keadaan saat iniSSS Tindakan saat ini pada kondisi saat iniπ(s)=aπ(s)=a\pi(s) = a Keadaan selanjutnyaS′S′S' Jadi terlihat seperti: R(S,a,S′)R(S,a,S′)R(S, a, S') Apa …

2
Vektorisasi Rugi Entropi Silang
Saya berurusan dengan masalah yang berkaitan dengan menemukan gradien fungsi Cross entropy loss wrt parameter θθ\theta dimana: CE(θ)=−∑iyi∗log(y^i)CE(θ)=−∑iyi∗log(y^i)CE(\theta) = -\sum\nolimits_{i}{y_i*log({\hat{y}_{i}})} Dimana, y^i=softmax(θi)y^i=softmax(θi)\hat{y}_{i} = softmax(\theta_i) dan θiθi\theta_i adalah input vektor. Juga, yyy adalah satu vektor panas dari kelas yang benar dan y^y^\hat{y} adalah prediksi untuk setiap kelas menggunakan fungsi softmax. Oleh …



2
Bagaimana menyiapkan interaksi variabel kategorikal dalam scikit-learning?
Apa cara terbaik untuk mempersiapkan interaksi fitur-fitur kategorikal sebelum disesuaikan dengan scikit-learn? Dengan statsmodelssaya bisa dengan mudah mengatakan dalam gaya R smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()(sama di Stata dengan regress depvar i.var1##i.var2). Bisakah sklearn.preprocessing.PolynomialFeatures(dalam v0.15, saat ini dev) digunakan dengan variabel kategori?

2
Divergensi Kontrasif Persisten untuk RBM
Saat menggunakan algoritme pembelajaran CD persisten untuk Mesin Bolzmann Terbatas, kami memulai rantai pengambilan sampel Gibbs kami pada iterasi pertama pada titik data, tetapi bertentangan dengan CD normal, dalam mengikuti iterasi kami tidak memulai rantai kami. Alih-alih, kita mulai dari mana rantai sampel Gibbs dalam iterasi sebelumnya berakhir. Dalam algoritma …

4
Mengevaluasi model regresi
Untuk masalah klasifikasi saya telah menggunakan Neural Networks dan mengukur kesalahan Tipe I dan II menggunakan matriks kebingungan dan ukurannya sesuai sumber daya ini ( mirror ), yang cukup mudah. Ketika dihadapkan dengan masalah estimasi, bagaimana seseorang menilai kinerja model? Dengan asumsi bahwa tidak ada kelas dan output ditafsirkan dalam …

1
Mencoba memahami Proses Gaussian
Saya membaca buku GPML dan dalam Bab 2 (halaman 15) , buku ini menceritakan cara melakukan regresi menggunakan Proses Gaussian (GP), tetapi saya mengalami kesulitan mencari cara kerjanya. Dalam inferensi Bayesian untuk model parametrik, pertama-tama kita memilih prior pada parameter model θθ\theta, itu adalah p(θ)p(θ)p(\theta); kedua, diberikan data pelatihanDDD, kami …

3
Mengapa svm tidak sebagus pohon keputusan pada data yang sama?
Saya baru mengenal pembelajaran mesin dan mencoba menggunakan scikit-learning (sklearn) untuk menangani masalah klasifikasi. Baik DecisionTree dan SVM dapat melatih classifier untuk masalah ini. Saya menggunakan sklearn.ensemble.RandomForestClassifierdan sklearn.svm.SVCmenyesuaikan data pelatihan yang sama (sekitar 500.000 entri dengan 50 fitur per entri). The RandomForestClassifier keluar dengan classifier di sekitar satu menit. The …

2
Kumpulan data uji yang sangat tidak seimbang dan data pelatihan yang seimbang dalam klasifikasi
Saya memiliki satu set pelatihan dengan sekitar 3000 contoh positif dan 3000 contoh negatif. Tetapi kumpulan data pengujian saya sangat tidak seimbang. Set positif hanya memiliki 50 instance dan negatif memiliki 1500 instance. Hal ini menyebabkan presisi sangat rendah. Apakah ada pendekatan untuk menyelesaikan masalah ini? Saya menggunakan SVM untuk …

1
Pisau cukur Occam sudah usang?
Saya melihat buku-buku Vapnik tentang pembelajaran statistik ... Saya membaca beberapa bab pertama. Ngomong-ngomong, yang paling mengejutkanku adalah dia berpikir pisau cukur Occam sudah usang. Saya pikir itu terkait dengan situasi di mana dengan asumsi dimensi yang lebih tinggi meningkatkan kecocokan secara signifikan. Apakah saya mengerti benar? Benarkah pisau cukur …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.