Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data



8
Apakah sebab akibat menyiratkan korelasi?
Korelasi tidak menyiratkan sebab-akibat, karena mungkin ada banyak penjelasan untuk korelasi. Tetapi apakah sebab akibat menyiratkan korelasi? Secara intuitif, saya akan berpikir bahwa kehadiran sebab-akibat berarti ada beberapa korelasi. Tetapi intuisi saya tidak selalu membantu saya dengan baik dalam statistik. Apakah sebab akibat menyiratkan korelasi?


9
Contoh numerik untuk memahami Ekspektasi-Maksimalisasi
Saya mencoba untuk mendapatkan pemahaman yang baik tentang algoritma EM, untuk dapat mengimplementasikan dan menggunakannya. Saya menghabiskan satu hari penuh membaca teori dan kertas di mana EM digunakan untuk melacak pesawat menggunakan informasi posisi yang berasal dari radar. Sejujurnya, saya pikir saya tidak sepenuhnya memahami ide yang mendasarinya. Adakah yang …


6
Mengapa nilai-p terdistribusi secara seragam di bawah hipotesis nol?
Baru-baru ini, saya menemukan di sebuah makalah oleh Klammer, et al. pernyataan bahwa nilai-p harus didistribusikan secara seragam. Saya percaya pada penulis, tetapi tidak bisa mengerti mengapa demikian. Klammer, AA, Park, CY, dan Stafford Noble, W. (2009) Kalibrasi Statistik Fungsi SEQUEST XCorr . Jurnal Penelitian Proteome . 8 (4): 2106–2113.
115 p-value  uniform 




10
Apa perbedaan antara jaringan saraf dan jaringan saraf dalam, dan mengapa jaringan yang dalam bekerja lebih baik?
Saya belum melihat pertanyaan yang dinyatakan secara tepat dalam istilah ini, dan inilah mengapa saya membuat pertanyaan baru. Apa yang saya tertarik ketahui bukanlah definisi jaringan saraf, tetapi memahami perbedaan yang sebenarnya dengan jaringan saraf yang mendalam. Untuk lebih banyak konteks: Saya tahu apa itu jaringan syaraf dan bagaimana backpropagation …

13
Apa yang salah dengan komik Frequentists vs Bayesians XKCD?
Komik xkcd ini (Frequentists vs Bayesians) mengolok-olok seorang ahli statistik yang sering mendapatkan hasil yang jelas salah. Namun bagi saya nampaknya penalarannya benar dalam arti mengikuti metodologi frequentist standar. Jadi pertanyaan saya adalah "apakah dia menerapkan metodologi frequentist dengan benar?" Jika tidak: apa yang akan menjadi kesimpulan sering yang benar …


1
Bagaimana cara membalikkan PCA dan merekonstruksi variabel asli dari beberapa komponen utama?
Analisis komponen utama (PCA) dapat digunakan untuk pengurangan dimensi. Setelah pengurangan dimensi seperti itu dilakukan, bagaimana kira-kira orang dapat merekonstruksi variabel / fitur asli dari sejumlah kecil komponen utama? Atau, bagaimana seseorang dapat menghapus atau membuang beberapa komponen utama dari data? Dengan kata lain, bagaimana cara membalikkan PCA? Mengingat bahwa …

19
Paradoks statistik paling menarik
Karena saya menemukan mereka menarik, saya ingin mendengar apa yang orang-orang di komunitas ini temukan sebagai paradoks statistik paling menarik dan mengapa.
112 paradox 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.