Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data


4
Apa itu kebingungan?
Saya menemukan istilah kebingungan yang mengacu pada probabilitas invers log-rata pada data yang tidak terlihat. Artikel Wikipedia tentang kebingungan tidak memberikan makna intuitif untuk hal yang sama. Ukuran kebingungan ini digunakan dalam kertas pLSA . Adakah yang bisa menjelaskan kebutuhan dan makna intuitif dari ukuran kebingungan ?

6
Pentingnya normalisasi respons lokal di CNN
Saya telah menemukan bahwa Imagenet dan CNN besar lainnya menggunakan lapisan normalisasi respons lokal. Namun, saya tidak dapat menemukan banyak informasi tentang mereka. Seberapa penting mereka dan kapan mereka harus digunakan? Dari http://caffe.berkeleyvision.org/tutorial/layers.html#data-layers : "Lapisan normalisasi respons lokal melakukan semacam" penghambatan lateral "dengan menormalkan lebih dari daerah input lokal. Dalam …

10
Mengapa 600 dari 1000 lebih meyakinkan dari 6 dari 10?
Lihatlah kutipan ini dari "Buku pegangan keterampilan belajar", Palgrave, 2012, oleh Stella Cottrell, halaman 155: Persentase Perhatikan kapan persentase diberikan. Misalkan, pernyataan di atas berbunyi: 60% orang lebih suka jeruk; 40% mengatakan mereka lebih suka apel. Ini terlihat meyakinkan: Jumlah numerik diberikan. Tetapi apakah perbedaan antara 60% dan 40% signifikan …

9
Korelasi tidak berarti sebab-akibat; tetapi bagaimana dengan ketika salah satu variabel adalah waktu?
Saya tahu pertanyaan ini telah ditanyakan satu miliar kali, jadi, setelah mencari online, saya sepenuhnya yakin bahwa korelasi antara 2 variabel tidak menyiratkan sebab-akibat. Dalam salah satu kuliah statistik saya hari ini, kami mendapat kuliah tamu dari seorang ahli fisika, tentang pentingnya metode statistik dalam fisika. Dia mengatakan pernyataan yang …

10
Apakah peluang Anda meninggal dalam kecelakaan pesawat berkurang jika Anda terbang langsung?
Baru-baru ini saya memiliki perselisihan dengan seorang teman tentang meminimalkan kemungkinan kematian di pesawat karena kecelakaan. Ini adalah pertanyaan statistik yang belum sempurna. Dia menyatakan bahwa dia lebih suka terbang langsung ke tujuan, karena mengurangi kemungkinan dia akan mati dalam kecelakaan pesawat. Logikanya adalah jika probabilitas kecelakaan penerbangan komersial adalah …

1
Neural Networks: momentum perubahan berat badan dan penurunan berat badan
Momentum digunakan untuk mengurangi fluktuasi perubahan berat selama iterasi berurutan:αα\alpha Δ ωsaya( t + 1 ) =- η∂E∂wsaya+ α Δωsaya( t ) ,Δωsaya(t+1)=-η∂E∂wsaya+αΔωsaya(t),\Delta\omega_i(t+1) = - \eta\frac{\partial E}{\partial w_i} + \alpha \Delta \omega_i(t), mana adalah fungsi kesalahan, - vektor bobot, - tingkat pembelajaran.E( w )E(w)E({\bf w})ww{\bf w}ηη\eta Pembusukan berat menghukum perubahan …


2
Panda / Statsmodel / Scikit-belajar
Apakah Pandas, Statsmodels, dan Scikit-mempelajari berbagai implementasi pembelajaran mesin / statistik yang berbeda, atau apakah ini saling melengkapi satu sama lain? Manakah dari ini yang memiliki fungsi paling komprehensif? Yang mana yang dikembangkan dan / atau didukung secara aktif? Saya harus menerapkan regresi logistik. Adakah saran untuk yang mana yang …


5
Game bagus untuk belajar berpikir statistik?
Apakah ada game yang membuat pemain "berpikir seperti ahli statistik"? Misalnya, lightbot membuat Anda "berpikir seperti seorang programmer" (dengan cara yang sangat mendasar). Apakah ada permainan - yang dirancang untuk hiburan atau pengajaran - yang dapat membantu Anda merasa nyaman dengan konsep-konsep dasar seperti korelasi, nilai-p, kuadrat terkecil, varian, berbagai …

7
Seberapa sering Anda harus melempar dadu 6 sisi untuk mendapatkan setiap angka setidaknya satu kali?
Saya baru saja memainkan permainan dengan anak-anak saya yang pada dasarnya bermuara pada: siapa pun yang menggulung setiap angka setidaknya sekali pada die 6-sisi menang. Saya menang, akhirnya, dan yang lainnya selesai 1-2 putaran kemudian. Sekarang saya bertanya-tanya: apa harapan dari panjang permainan? Saya tahu bahwa harapan jumlah gulungan sampai …



4
OpenBugs vs. JAGS
Saya akan mencoba lingkungan gaya BUGS untuk memperkirakan model Bayesian. Apakah ada keuntungan penting untuk dipertimbangkan dalam memilih antara OpenBugs atau JAGS? Apakah salah satu akan menggantikan yang lain di masa mendatang? Saya akan menggunakan Gibbs Sampler yang dipilih dengan R. Saya belum memiliki aplikasi spesifik, tetapi saya sedang memutuskan …
41 r  software  bugs  jags  gibbs 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.