Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

10
Apa penjelasan orang awam favorit Anda untuk konsep statistik yang sulit?
Saya sangat menikmati mendengar penjelasan sederhana untuk masalah yang kompleks. Apa analogi atau anekdot favorit Anda yang menjelaskan konsep statistik yang sulit? Favorit saya adalah penjelasan Murray tentang kointegrasi menggunakan pemabuk dan anjingnya. Murray menjelaskan bagaimana dua proses acak (mabuk berkeliaran dan anjingnya, Oliver) dapat memiliki unit root tetapi masih …

2
Bagaimana cara menginterpretasikan glmnet?
Saya mencoba untuk menyesuaikan model regresi linier multivariat dengan sekitar 60 variabel prediktor dan 30 pengamatan, jadi saya menggunakan paket glmnet untuk regresi yang diatur karena p> n. Saya telah melalui dokumentasi dan pertanyaan lain tetapi saya masih belum dapat menginterpretasikan hasilnya, berikut ini contoh kode (dengan 20 prediktor dan …


3
Bukti eksperimental yang mendukung visualisasi gaya Tufte?
T: Apakah ada bukti eksperimental yang mendukung visualisasi data-gaya Tufte, minimalis, data-bicara di atas visualisasi yang dibuang bagan, katakanlah, Nigel Holmes ? Saya bertanya bagaimana cara menambahkan sampah-bagan ke plot R di sini dan para responden melemparkan sejumlah besar snark kepada saya. Jadi, tentu saja, harus ada beberapa bukti eksperimental, …

4
Bagaimana cara mengambil sampel dari distribusi normal dengan mean dan varian yang dikenal menggunakan bahasa pemrograman konvensional?
Saya tidak pernah mengikuti kursus statistik, jadi saya harap saya bertanya di tempat yang tepat di sini. Misalkan saya hanya memiliki dua data yang menggambarkan distribusi normal: mean dan varians σ 2 . Saya ingin menggunakan komputer untuk secara acak mengambil sampel dari distribusi ini sehingga saya menghormati dua statistik …

4
Apa itu variabel instrumental?
Variabel instrumental menjadi semakin umum dalam ekonomi terapan dan statistik. Untuk yang belum tahu, dapatkah kita mendapatkan jawaban non-teknis untuk pertanyaan berikut: Apa itu variabel instrumental? Kapan seseorang ingin menggunakan variabel instrumental? Bagaimana seseorang menemukan atau memilih variabel instrumental?

6
Bagaimana kuasi mencocokkan dua vektor string (dalam R)?
Saya tidak yakin bagaimana ini harus disebut, jadi tolong perbaiki saya jika Anda tahu istilah yang lebih baik. Saya punya dua daftar. Salah satu dari 55 item (misalnya: vektor string), yang lain dari 92. Nama-nama item serupa tetapi tidak identik. Saya berharap untuk menemukan yang terbaik kandidat s di 92 …
36 r  text-mining 



3
Machine Learning: Haruskah saya menggunakan entropi silang kategoris atau kehilangan entropi silang biner untuk prediksi biner?
Pertama-tama, saya menyadari jika saya perlu melakukan prediksi biner, saya harus membuat setidaknya dua kelas melalui melakukan satu-hot-encoding. Apakah ini benar? Namun, apakah binary cross entropy hanya untuk prediksi dengan hanya satu kelas? Jika saya menggunakan kerugian entropi lintas kategoris yang biasanya ditemukan di sebagian besar perpustakaan (seperti TensorFlow), apakah …

5
Fungsi biaya jaringan saraf adalah non-cembung?
Fungsi biaya jaringan saraf adalah , dan diklaim non-cembung . Saya tidak begitu mengerti mengapa seperti itu, karena seperti yang saya lihat itu sangat mirip dengan fungsi biaya dari regresi logistik, kan?J(W,b)J(W,b)J(W,b) Jika non-cembung, maka turunan urutan kedua , kan?∂J∂W&lt;0∂J∂W&lt;0\frac{\partial J}{\partial W} < 0 MEMPERBARUI Berkat jawaban di bawah ini …



1
Inferensiasional versus MCMC: kapan harus memilih yang satu dari yang lain?
Saya pikir saya mendapatkan ide umum baik VI dan MCMC termasuk berbagai rasa MCMC seperti sampling Gibbs, Metropolis Hastings dll. Makalah ini memberikan paparan yang luar biasa dari kedua metode. Saya punya pertanyaan berikut: Jika saya ingin melakukan inferensi Bayesian, mengapa saya memilih satu metode daripada yang lain? Apa pro …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.