Pertanyaan yang diberi tag «machine-learning»

Algoritma pembelajaran mesin membangun model data pelatihan. Istilah "pembelajaran mesin" secara samar didefinisikan; itu termasuk apa yang juga disebut pembelajaran statistik, pembelajaran penguatan, pembelajaran tanpa pengawasan, dll. SELALU MENAMBAH TAG LEBIH SPESIFIK.

1
Apa jaminan teoritis mengantongi
Saya (kurang-lebih) pernah mendengar bahwa: bagging adalah teknik untuk mengurangi varians dari algoritma prediktor / estimator / pembelajaran. Namun, saya belum pernah melihat bukti matematis formal dari pernyataan ini. Adakah yang tahu mengapa ini benar secara matematis? Sepertinya fakta yang diterima / diketahui secara luas, sehingga saya akan mengharapkan referensi …

3
Mengapa kita membaginya dengan standar deviasi dan bukan faktor standardisasi lain sebelum melakukan PCA?
Saya membaca pembenaran berikut (dari catatan kursus cs229) tentang mengapa kami membagi data mentah dengan standar menyimpang: Meskipun saya mengerti apa yang dikatakan penjelasan, tidak jelas bagi saya mengapa membagi dengan standar deviasi akan mencapai tujuan seperti itu. Dikatakan agar setiap orang lebih pada "skala" yang sama. Namun, itu tidak …

1
Apakah nilai R-squared cocok untuk membandingkan model?
Saya mencoba mengidentifikasi model terbaik untuk memprediksi harga mobil, menggunakan harga dan fitur yang tersedia di situs iklan baris mobil. Untuk ini saya menggunakan beberapa model dari perpustakaan scikit-belajar dan model jaringan saraf dari pybrain dan neurolab. Pendekatan yang saya gunakan sejauh ini adalah menjalankan jumlah data tetap melalui beberapa …


4
Apa arti "derajat kebebasan" dalam jaringan saraf?
Dalam buku Bishop "Klasifikasi Pola dan Pembelajaran Mesin", itu menggambarkan teknik untuk regularisasi dalam konteks jaringan saraf. Namun, saya tidak mengerti satu paragraf yang menjelaskan bahwa selama proses pelatihan, jumlah derajat kebebasan meningkat seiring dengan kompleksitas model. Kutipan yang relevan adalah sebagai berikut: Alternatif untuk regularisasi sebagai cara mengendalikan kompleksitas …

2
Menggunakan jaringan saraf untuk berdagang di bursa
Saya telah terjun ke bidang jaringan saraf dan saya menjadi terpesona dengan mereka. Saya akhirnya mengembangkan kerangka kerja aplikasi untuk menguji sistem perdagangan di bursa saham dan sekarang saya akan menerapkan jaringan saraf pertama saya di dalamnya. Sangat sederhana dan primitif, tidak dimaksudkan untuk perdagangan nyata, hanya untuk pemula. Saya …

1
Saya ingin membangun indeks kejahatan dan indeks ketidakstabilan politik yang didasarkan pada berita
Saya memiliki proyek sampingan ini di mana saya merangkak situs web berita lokal di negara saya dan ingin membangun indeks kejahatan dan indeks ketidakstabilan politik. Saya sudah membahas bagian pengambilan informasi dari proyek. Rencana saya adalah melakukan: Ekstraksi topik tanpa pengawasan. Mendeteksi duplikat dekat. Klasifikasi dan tingkat insiden yang diawasi …

3
Membandingkan dua hasil akurasi classifier untuk signifikansi statistik dengan uji-t
Saya ingin membandingkan keakuratan dua pengklasifikasi untuk signifikansi statistik. Kedua pengklasifikasi dijalankan pada set data yang sama. Ini membuat saya percaya bahwa saya harus menggunakan uji-t satu sampel dari apa yang telah saya baca . Sebagai contoh: Classifier 1: 51% accuracy Classifier 2: 64% accuracy Dataset size: 78,000 Apakah ini …


2
Mengapa classifier regresi ridge berfungsi cukup baik untuk klasifikasi teks?
Selama percobaan untuk klasifikasi teks, saya menemukan classifier ridge menghasilkan hasil yang secara konstan berada di atas tes di antara classifier yang lebih umum disebutkan dan diterapkan untuk tugas-tugas penambangan teks, seperti SVM, NB, kNN, dll. Meskipun, saya belum menguraikan tentang cara mengoptimalkan setiap classifier pada tugas klasifikasi teks khusus …

12
Buku-buku terbaik untuk pengantar analisis data statistik?
Terkunci . Pertanyaan ini dan jawabannya dikunci karena pertanyaannya di luar topik tetapi memiliki signifikansi historis. Saat ini tidak menerima jawaban atau interaksi baru. Saya membeli buku ini: Cara Mengukur Apa Pun: Menemukan Nilai Benda Tak Berwujud dalam Bisnis dan Analisis Data Kepala Pertama: Panduan Pelajar untuk Angka Besar, Statistik, …




5
Untuk klasifikasi dengan Random Forests di R, bagaimana seharusnya seseorang menyesuaikan ukuran kelas yang tidak seimbang?
Saya mengeksplorasi berbagai metode klasifikasi untuk proyek yang sedang saya kerjakan, dan saya tertarik untuk mencoba Hutan Acak. Saya mencoba mendidik diri sendiri seiring berjalannya waktu, dan akan menghargai setiap bantuan yang diberikan oleh komunitas CV. Saya telah membagi data saya ke dalam set pelatihan / tes. Dari percobaan dengan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.