Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data



2
Pertanyaan praktis tentang penyetelan Hutan Acak
Pertanyaan saya adalah tentang Hutan Acak. Konsep dari pengelompokan yang indah ini jelas bagi saya, tetapi masih ada banyak pertanyaan penggunaan praktis. Sayangnya, saya gagal menemukan panduan praktis untuk RF (saya telah mencari sesuatu seperti "Panduan Praktis untuk Pelatihan Mesin Boltzman Terbatas" oleh Geoffrey Hinton, tetapi untuk Hutan Acak! Bagaimana …



18
Pertanyaan wawancara statistik
Saya mencari beberapa statistik (dan probabilitas, saya kira) pertanyaan wawancara, dari yang paling dasar sampai yang lebih maju. Jawaban tidak perlu (meskipun tautan ke pertanyaan spesifik di situs ini akan berhasil).


5
Pandangan terpadu tentang penyusutan: apa hubungan (jika ada) antara paradoks Stein, regresi ridge, dan efek acak dalam model campuran?
Perhatikan tiga fenomena berikut. Paradoks Stein: diberikan beberapa data dari distribusi normal multivariat dalam Rn,n≥3Rn,n≥3\mathbb R^n, \: n\ge 3 , rata-rata sampel bukan penaksir yang sangat baik dari rata-rata sebenarnya. Seseorang dapat memperoleh estimasi dengan kesalahan kuadrat rata-rata yang lebih rendah jika seseorang mengecilkan semua koordinat sampel rata-rata menuju nol …

5
Bagaimana menafsirkan kovarians terbalik atau matriks presisi?
Saya bertanya-tanya apakah ada yang bisa mengarahkan saya ke beberapa referensi yang membahas interpretasi unsur-unsur matriks kovarian terbalik, juga dikenal sebagai matriks konsentrasi atau matriks presisi. Saya memiliki akses ke Dependensi Multivarian Cox dan Wermuth , tetapi yang saya cari adalah interpretasi dari setiap elemen dalam matriks invers. Wikipedia menyatakan …

5
Apa fungsi kerugian untuk tugas klasifikasi multi-kelas, multi-label dalam jaringan saraf?
Saya melatih jaringan saraf untuk mengklasifikasikan satu set objek menjadi n-kelas. Setiap objek dapat menjadi milik beberapa kelas sekaligus (multi-class, multi-label). Saya membaca bahwa untuk masalah multi-kelas umumnya direkomendasikan untuk menggunakan softmax dan entropi lintas kategorikal sebagai fungsi kerugian alih-alih mse dan saya kurang lebih mengerti mengapa. Untuk masalah saya …


8
Apakah bahasa R dapat diandalkan untuk bidang ekonomi?
Saya seorang mahasiswa pascasarjana di bidang ekonomi yang baru-baru ini dikonversi ke R dari paket statistik lain yang sangat terkenal (saya menggunakan SPSS terutama). Masalah kecil saya saat ini adalah bahwa saya adalah satu-satunya pengguna R di kelas saya. Teman-teman sekelas saya menggunakan Stata dan Gauss dan salah satu profesor …

8
Apa contoh yang baik dan meyakinkan di mana nilai-p berguna?
Pertanyaan saya dalam judul cukup jelas, tetapi saya ingin memberikan beberapa konteks. ASA merilis sebuah pernyataan awal pekan ini “ pada nilai-p: konteks, proses, dan tujuan ”, menguraikan berbagai kesalahpahaman umum tentang nilai-p, dan mendesak kehati-hatian untuk tidak menggunakannya tanpa konteks dan pemikiran (yang dapat dikatakan hampir seperti metode statistik …

4
Bagaimana menambahkan IV ke-2 membuat IV ke-1 signifikan?
Saya punya pertanyaan yang mungkin sederhana, tapi itu membingungkan saya sekarang, jadi saya berharap Anda dapat membantu saya. Saya memiliki model regresi kuadrat terkecil, dengan satu variabel independen dan satu variabel dependen. Hubungannya tidak signifikan. Sekarang saya menambahkan variabel independen kedua. Sekarang hubungan antara variabel independen pertama dan variabel dependen …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.