Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data





14
Kapan (jika pernah) adalah pendekatan yang sering secara substantif lebih baik daripada Bayesian?
Latar belakang : Saya tidak memiliki pelatihan formal dalam statistik Bayesian (walaupun saya sangat tertarik untuk belajar lebih banyak), tetapi saya cukup tahu - saya pikir - untuk mendapatkan inti mengapa banyak orang merasa seolah-olah mereka lebih disukai daripada statistik Frequentist. Bahkan para sarjana dalam statistik pengantar (dalam ilmu sosial) …


4
Hubungan antara poisson dan distribusi eksponensial
Waktu tunggu untuk distribusi poisson adalah distribusi eksponensial dengan parameter lambda. Tapi saya tidak mengerti. Poisson memodelkan jumlah kedatangan per unit waktu misalnya. Bagaimana ini terkait dengan distribusi eksponensial? Katakanlah probabilitas kedatangan k dalam satuan waktu adalah P (k) (dimodelkan dengan poisson) dan probabilitas k + 1 adalah P (k …


13
Apa peran logaritma dalam entropi Shannon?
Entropi Shannon adalah negatif dari jumlah probabilitas setiap hasil dikalikan dengan logaritma probabilitas untuk setiap hasil. Apa tujuan yang dilayani oleh logaritma dalam persamaan ini? Jawaban intuitif atau visual (sebagai lawan dari jawaban yang sangat matematis) akan diberikan poin bonus!

2
Mengapa regresi ridge disebut "ridge", mengapa itu diperlukan, dan apa yang terjadi ketika pergi hingga tak terbatas?
Perkiraan koefisien regresi punggungan adalah nilai yang meminimalkanβ^Rβ^R\hat{\beta}^R RSS+λ∑j=1pβ2j.RSS+λ∑j=1pβj2. \text{RSS} + \lambda \sum_{j=1}^p\beta_j^2. Pertanyaan saya adalah: Jika , maka kita melihat bahwa ekspresi di atas berkurang ke RSS yang biasa. Bagaimana jika ? Saya tidak mengerti penjelasan buku teks tentang perilaku koefisien.λ=0λ=0\lambda = 0λ→∞λ→∞\lambda \to \infty Untuk membantu memahami konsep …

8
Keterampilan yang sulit ditemukan di pembelajar mesin?
Tampaknya penambangan data dan pembelajaran mesin menjadi sangat populer sehingga sekarang hampir setiap siswa CS tahu tentang pengklasifikasian, pengelompokan, statistik NLP ... dll. Jadi, menemukan penambang data bukanlah hal yang sulit saat ini. Pertanyaan saya adalah: Apa keterampilan yang bisa dipelajari oleh penambang data yang akan membuatnya berbeda dari yang …

2
Memecahkan parameter regresi dalam bentuk tertutup vs gradient descent
Dalam kursus pembelajaran mesin Andrew Ng , ia memperkenalkan regresi linier dan regresi logistik, dan menunjukkan bagaimana menyesuaikan parameter model menggunakan gradient descent dan metode Newton. Saya tahu gradient descent dapat berguna dalam beberapa aplikasi pembelajaran mesin (misalnya, backpropogation), tetapi dalam kasus yang lebih umum apakah ada alasan mengapa Anda …

2
Menghapus bingkai data baris duplikat di R [ditutup]
Bagaimana saya bisa menghapus baris duplikat dari frame data contoh ini? A 1 A 1 A 2 B 4 B 1 B 1 C 2 C 2 Saya ingin menghapus duplikat berdasarkan kedua kolom: A 1 A 2 B 4 B 1 C 2 Ketertiban tidak penting.
71 r 



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.