Statistik dan Big Data machine-learning

2

Bagaimana menangani perbedaan antara distribusi set tes dan set pelatihan?

Saya pikir salah satu asumsi dasar pembelajaran mesin atau estimasi parameter adalah bahwa data yang tak terlihat berasal dari distribusi yang sama dengan set pelatihan. Namun, dalam beberapa kasus praktis, distribusi set tes akan hampir berbeda dari set pelatihan. Katakanlah untuk masalah multi-klasifikasi skala besar yang mencoba untuk mengklasifikasikan deskripsi …

23 machine-learning classification skewness unbalanced-classes multi-class

2

Apakah teknik pembelajaran mesin “algoritme aproksimasi”?

Baru-baru ini ada pertanyaan seperti ML di cstheory stackexchange, dan saya memposting jawaban yang merekomendasikan metode Powell, gradient descent, algoritma genetika, atau "algoritma aproksimasi" lainnya. Dalam komentar seseorang mengatakan kepada saya metode ini adalah "heuristik" dan bukan "algoritma perkiraan" dan sering tidak mendekati optimal teoritis (karena mereka "sering terjebak dalam …

23 machine-learning optimization approximation

3

Situs untuk kompetisi pemodelan prediktif

Saya berpartisipasi dalam kompetisi pemodelan prediktif di Kaggle , TunedIt , dan CrowdAnalytix . Saya menemukan bahwa situs-situs ini adalah cara yang baik untuk "berolahraga" untuk statistik / pembelajaran mesin. Apakah ada situs lain yang harus saya ketahui? Bagaimana perasaan Anda semua tentang kompetisi di mana tuan rumah ingin mendapat …

23 machine-learning predictive-models

5

Alternatif untuk pohon klasifikasi, dengan kinerja prediksi yang lebih baik (misalnya: CV)?

Saya mencari alternatif untuk Pohon Klasifikasi yang mungkin menghasilkan daya prediksi yang lebih baik. Data yang saya hadapi memiliki faktor untuk variabel penjelas dan penjelas. Saya ingat pernah menemukan hutan acak dan jaringan saraf dalam konteks ini, meskipun tidak pernah mencobanya sebelumnya, apakah ada kandidat lain yang baik untuk tugas …

23 r machine-learning classification cart

1

Penjelasan tentang min_child_weight dalam algoritma xgboost

The definisi parameter min_child_weight di xgboost diberikan sebagai: jumlah minimum contoh berat badan (goni) yang dibutuhkan pada anak. Jika langkah partisi pohon menghasilkan simpul daun dengan jumlah bobot contoh kurang dari min_child_weight, maka proses pembangunan akan berhenti mempartisi lebih lanjut. Dalam mode regresi linier, ini hanya sesuai dengan jumlah minimum …

23 machine-learning xgboost hessian

2

Bagaimana cara meningkatkan kerja?

Apa cara termudah untuk memahami peningkatan? Mengapa itu tidak meningkatkan penggolong yang sangat lemah "hingga tak terbatas" (kesempurnaan)?

23 machine-learning boosting

3

Statistik yang cukup untuk orang awam

Bisakah seseorang tolong jelaskan statistik yang cukup dalam istilah yang sangat mendasar? Saya berasal dari latar belakang teknik, dan saya telah melalui banyak hal tetapi gagal menemukan penjelasan yang intuitif.

23 machine-learning mathematical-statistics intuition

1

Mengapa fungsi biaya jaringan saraf non-cembung?

Ada utas serupa di sini ( Fungsi biaya jaringan saraf adalah non-cembung? ) Tapi saya tidak dapat memahami poin-poin dalam jawaban di sana dan alasan saya untuk bertanya lagi berharap ini akan menjelaskan beberapa masalah: Jika saya menggunakan jumlah fungsi biaya selisih kuadrat, saya akhirnya mengoptimalkan sesuatu dari bentuk mana …

22 machine-learning neural-networks optimization loss-functions convex

1

Backpropagation yang luar biasa melalui koneksi lewati ResNet

Saya ingin tahu tentang bagaimana gradien diperbanyak kembali melalui jaringan saraf menggunakan modul ResNet / lewati koneksi. Saya telah melihat beberapa pertanyaan tentang ResNet (mis. Jaringan saraf dengan koneksi lompatan-lapisan ) tetapi yang satu ini menanyakan secara khusus tentang back-propagation of gradien selama pelatihan. Arsitektur dasarnya ada di sini: Saya …

22 machine-learning neural-networks conv-neural-network gradient-descent backpropagation

3

Relu vs Sigmoid vs Softmax sebagai neuron lapisan tersembunyi

Saya bermain dengan Neural Network sederhana dengan hanya satu lapisan tersembunyi, oleh Tensorflow, dan kemudian saya mencoba berbagai aktivasi untuk lapisan tersembunyi: Relu Sigmoid Softmax (well, biasanya softmax digunakan di lapisan terakhir ..) Relu memberikan akurasi kereta terbaik & akurasi validasi. Saya tidak yakin bagaimana menjelaskannya. Kita tahu bahwa Relu …

22 machine-learning neural-networks conv-neural-network tensorflow sigmoid-curve

4

Apa nama grafik ini yang menunjukkan tingkat positif palsu dan benar dan bagaimana cara menghasilkannya?

Gambar di bawah ini menunjukkan kurva kontinu dari tingkat positif palsu vs. Namun, yang saya tidak segera dapatkan adalah bagaimana tarif ini dihitung. Jika suatu metode diterapkan pada dataset, ia memiliki tingkat FP tertentu dan tingkat FN tertentu. Bukankah itu berarti bahwa setiap metode harus memiliki satu titik daripada kurva? …

22 machine-learning data-visualization roc auc

1

Memilih di antara aturan penilaian yang tepat

Sebagian besar sumber daya pada aturan penilaian yang tepat menyebutkan sejumlah aturan penilaian yang berbeda seperti log-loss, Brier score atau spherical scoring. Namun, mereka sering tidak memberikan banyak panduan tentang perbedaan di antara mereka. (Bukti A: Wikipedia .) Memilih model yang memaksimalkan skor logaritmik sesuai dengan memilih model maksimum-likelihood, yang …

22 machine-learning classification model-selection theory scoring-rules

2

Langkah selanjutnya setelah "Bayesian Reasoning and Machine Learning"

Saya saat ini sedang membaca "Bayesian Reasoning and Machine Learning" oleh David Barber dan ini adalah buku yang ditulis dengan sangat baik dan menarik untuk mempelajari dasar-dasarnya. Jadi pertanyaan untuk seseorang yang sudah melakukan ini. Apa set buku berikutnya yang harus saya lalui setelah saya memiliki kemampuan yang wajar dengan …

22 machine-learning bayesian references graphical-model

3

Apakah penting bagi ahli statistik untuk mempelajari pembelajaran mesin?

Apakah pembelajaran mesin subjek penting bagi ahli statistik untuk berkenalan? Tampaknya pembelajaran mesin adalah statistik. Mengapa program statistik (sarjana dan pascasarjana) tidak membutuhkan pembelajaran mesin?

22 machine-learning careers

2

Mesin Boltzmann terbatas vs jaringan saraf multilayer

Saya ingin bereksperimen dengan jaringan saraf untuk masalah klasifikasi yang saya hadapi. Saya berlari ke kertas yang berbicara tentang RBM. Tetapi dari apa yang saya mengerti, mereka tidak berbeda dari memiliki jaringan saraf multilayer. Apakah ini akurat? Selain itu saya bekerja dengan R dan tidak melihat paket kalengan untuk RBM. …

22 r machine-learning classification neural-networks

Pertanyaan yang diberi tag «machine-learning»