Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data


7
Bagaimana memilih antara uji-t atau uji non-parametrik misalnya Wilcoxon dalam sampel kecil
Hipotesis tertentu dapat diuji menggunakan uji- t Student (mungkin menggunakan koreksi Welch untuk varians yang tidak sama dalam kasus dua sampel), atau dengan tes non-parametrik seperti uji peringkat bertanda berpasangan Wilcoxon, uji Wilcoxon-Mann-Whitney U, atau uji tanda berpasangan. Bagaimana kita bisa membuat keputusan yang berprinsip tentang tes mana yang paling …



6
Apakah mungkin untuk melatih jaringan saraf tanpa backpropagation?
Banyak buku dan tutorial jaringan saraf menghabiskan banyak waktu pada algoritma backpropagation, yang pada dasarnya adalah alat untuk menghitung gradien. Mari kita asumsikan kita sedang membangun model dengan ~ 10K parameter / bobot. Apakah mungkin untuk menjalankan pengoptimalan menggunakan beberapa algoritma pengoptimalan bebas gradien? Saya pikir menghitung gradien numerik akan …



2
Berapa banyak yang kita ketahui tentang peretasan “di alam liar”?
Frasa p -hacking (juga: "pengerukan data" , "pengintai" atau "memancing") mengacu pada berbagai jenis malpraktek statistik di mana hasilnya menjadi signifikan secara statistik secara artifisial. Ada banyak cara untuk mendapatkan hasil yang "lebih penting", termasuk tetapi tidak terbatas pada: hanya menganalisis subset data yang "menarik" , di mana suatu pola …


6
Tes pemeriksaan data penting
Dalam peran pekerjaan saya, saya sering bekerja dengan kumpulan data orang lain, non-pakar membawakan saya data klinis dan saya membantu mereka untuk meringkasnya dan melakukan tes statistik. Masalah yang saya miliki adalah bahwa dataset yang saya bawa hampir selalu penuh dengan kesalahan ketik, inkonsistensi, dan segala macam masalah lainnya. Saya …

3
Bagaimana Anda menghitung presisi dan penarikan kembali untuk klasifikasi multi-kelas menggunakan matriks kebingungan?
Saya bertanya-tanya bagaimana cara menghitung presisi dan mengingat menggunakan matriks kebingungan untuk masalah klasifikasi multi-kelas. Secara khusus, pengamatan hanya dapat ditugaskan untuk kelas / label yang paling mungkin. Saya ingin menghitung: Presisi = TP / (TP + FP) Ingat kembali = TP / (TP + FN) untuk setiap kelas, dan …

10
Mengapa deret waktu harus diam?
Saya mengerti bahwa deret waktu stasioner adalah deretan mean dan varians yang konstan dari waktu ke waktu. Adakah yang bisa menjelaskan mengapa kita harus memastikan set data kita stasioner sebelum kita dapat menjalankan model ARIMA atau ARM yang berbeda? Apakah ini juga berlaku untuk model regresi normal di mana autokorelasi …

12
Who Are The Bayesians?
Ketika seseorang menjadi tertarik pada statistik, dikotomi "Frequentist" vs "Bayesian" segera menjadi biasa (dan siapa yang belum membaca The Signal and the Noise , karya Nate Silver ?). Dalam pembicaraan dan kursus pengantar, sudut pandangnya sangat sering ( MLE , value), tetapi cenderung ada sebagian kecil dari waktu yang didedikasikan …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.