Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data


4
Bagaimana menafsirkan plot QQ
Saya bekerja dengan dataset kecil (21 pengamatan) dan memiliki plot QQ normal berikut di R: Melihat plot tidak mendukung normalitas, apa yang bisa saya simpulkan tentang distribusi yang mendasarinya? Sepertinya bagi saya bahwa distribusi yang lebih condong ke kanan akan lebih cocok, bukan? Juga, kesimpulan apa lagi yang bisa kita …

9
Kenapa tiba-tiba terpesona dengan tensor?
Saya perhatikan akhir-akhir ini bahwa banyak orang sedang mengembangkan tensor ekivalen dari banyak metode (faktorisasi tensor, kernel tensor, tensor untuk pemodelan topik, dll) Saya bertanya-tanya, mengapa dunia tiba-tiba terpesona dengan tensor? Apakah ada makalah baru / hasil standar yang sangat mengejutkan, yang menyebabkan ini? Apakah komputasi jauh lebih murah daripada …

3
Kapan saya harus menggunakan laso vs ridge?
Katakanlah saya ingin memperkirakan sejumlah besar parameter, dan saya ingin menghukum beberapa dari mereka karena saya percaya mereka harus memiliki sedikit efek dibandingkan dengan yang lain. Bagaimana cara saya memutuskan skema hukuman apa yang akan digunakan? Kapan regresi ridge lebih tepat? Kapan saya harus menggunakan laso?





3
Cheat sheet L sedikit
Ada banyak diskusi yang terjadi di forum ini tentang cara yang tepat untuk menentukan berbagai model hirarkis yang digunakan lmer. Saya pikir akan bagus jika memiliki semua informasi di satu tempat. Beberapa pertanyaan untuk memulai: Bagaimana cara menentukan beberapa level, di mana satu kelompok bersarang di dalam yang lain: apakah …

3
ROC vs kurva presisi dan penarikan
Saya mengerti perbedaan formal di antara mereka, yang ingin saya ketahui adalah ketika lebih relevan untuk menggunakan satu vs yang lain. Apakah mereka selalu memberikan wawasan pelengkap tentang kinerja sistem klasifikasi / deteksi yang diberikan? Kapan masuk akal untuk menyediakan keduanya, misalnya, di kertas? bukan hanya satu? Adakah deskriptor alternatif …


2
Generatif vs diskriminatif
Saya tahu bahwa generatif berarti "berdasarkan " dan diskriminatif berarti "berdasarkan ," tetapi saya bingung pada beberapa poin:P(x,y)P(x,y)P(x,y)P(y|x)P(y|x)P(y|x) Wikipedia (+ banyak hit lainnya di web) mengklasifikasikan hal-hal seperti SVM dan pohon keputusan sebagai diskriminatif. Tetapi ini bahkan tidak memiliki interpretasi probabilistik. Apa arti diskriminasi di sini? Apakah diskriminatif baru saja …


6
Bisakah nilai distribusi probabilitas melebihi 1 menjadi OK?
Pada halaman Wikipedia tentang pengklasifikasi naif Bayes , ada baris ini: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789 (Distribusi probabilitas lebih dari 1 adalah OK. Ini adalah area di bawah kurva lonceng yang sama dengan 1.) Bagaimana nilai bisa OK? Saya pikir semua nilai probabilitas dinyatakan dalam kisaran . Lebih lanjut, mengingat bahwa dimungkinkan …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.