Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

8
Buku untuk dibaca sebelum Elemen Pembelajaran Statistik?
Berdasarkan posting ini , saya ingin mencerna Elemen Pembelajaran Statistik. Untungnya itu tersedia secara gratis dan saya mulai membacanya. Saya tidak memiliki cukup pengetahuan untuk memahaminya. Bisakah Anda merekomendasikan buku yang merupakan pengantar yang lebih baik untuk topik dalam buku ini? Semoga sesuatu yang memberi saya pengetahuan yang dibutuhkan untuk …


5
Apa perbedaan antara N dan N-1 dalam menghitung varians populasi?
Saya tidak mengerti mengapa ada Ndan N-1sambil menghitung varians populasi. Kapan kita menggunakan Ndan kapan kita menggunakan N-1? Klik di sini untuk versi yang lebih besar Dikatakan bahwa ketika populasi sangat besar tidak ada perbedaan antara N dan N-1 tetapi tidak mengatakan mengapa ada N-1 pada awalnya. Sunting: Tolong jangan …



5
Ejaan yang benar (huruf besar, huruf miring, tanda hubung) dari "nilai-p"?
Saya menyadari ini pedantic dan basi, tetapi sebagai peneliti di bidang di luar statistik, dengan pendidikan formal yang terbatas dalam statistik, saya selalu bertanya-tanya apakah saya menulis "p-value" dengan benar. Secara khusus: Apakah "p" seharusnya dikapitalisasi? Apakah "p" seharusnya dicetak miring? (Atau dalam font matematika, dalam TeX?) Apakah seharusnya ada …


1
Pengkodean satu-panas vs dummy di Scikit-learn
Ada dua cara berbeda untuk menyandikan variabel kategori. Katakanlah, satu variabel kategori memiliki nilai n . Pengkodean satu-panas mengkonversinya menjadi n variabel, sedangkan pengkodean dummy mengubahnya menjadi variabel n-1 . Jika kita memiliki variabel k kategori, masing-masing memiliki nilai n . Satu pengkodean panas berakhir dengan variabel kn , sedangkan …

3
Apa intuisi di balik SVD?
Saya telah membaca tentang dekomposisi nilai singular (SVD). Di hampir semua buku teks disebutkan bahwa itu faktorisasi matriks menjadi tiga matriks dengan spesifikasi yang diberikan. Tapi apa intuisi di balik pemisahan matriks dalam bentuk seperti itu? PCA dan algoritma lain untuk pengurangan dimensi adalah intuitif dalam arti bahwa algoritma memiliki …

2
Apakah ada perbedaan antara 'mengendalikan untuk' dan 'mengabaikan' variabel lain dalam regresi berganda?
Koefisien variabel penjelas dalam regresi berganda memberi tahu kita hubungan variabel penjelas dengan variabel terikat. Semua ini, sambil 'mengendalikan' untuk variabel penjelas lainnya. Bagaimana saya melihatnya sejauh ini: Sementara masing-masing koefisien sedang dihitung, variabel-variabel lain tidak diperhitungkan, jadi saya menganggap mereka diabaikan. Jadi apakah saya benar ketika saya berpikir bahwa …


1
Memperoleh nilai prediksi (Y = 1 atau 0) dari model regresi logistik yang sesuai
Katakanlah saya memiliki objek kelas glm(sesuai dengan model regresi logistik) dan saya ingin mengubah probabilitas prediksi yang diberikan dengan predict.glmmenggunakan argumen type="response"menjadi respons biner, yaitu atau Y = 0 . Apa cara tercepat & paling kanonik untuk melakukan ini di R?Y=1Y=1Y=1Y=0Y=0Y=0 Sementara, sekali lagi, aku sadar predict.glm, aku tidak tahu …

4
Mengapa repot dengan masalah ganda saat memasang SVM?
Mengingat titik data dan label y 1 , … , y n ∈ { - 1 , 1 } , masalah utama hard margin SVM adalahx1,…,xn∈Rdx1,…,xn∈Rdx_1, \ldots, x_n \in \mathbb{R}^dy1,…,yn∈{−1,1}y1,…,yn∈{−1,1}y_1, \ldots, y_n \in \left \{-1, 1 \right\} s.t.minimizew,w012wTwminimizew,w012wTw \text{minimize}_{w, w_0} \quad \frac{1}{2} w^T w s.t.∀i:yi(wTxi+w0)≥1s.t.∀i:yi(wTxi+w0)≥1 \text{s.t.} \quad \forall i: y_i …
50 svm 

16
Buku yang disarankan tentang desain percobaan?
Apa rekomendasi panel untuk buku-buku tentang desain percobaan? Idealnya, buku harus masih dicetak atau tersedia secara elektronik, meskipun itu tidak selalu layak. Jika Anda merasa tergerak untuk menambahkan beberapa kata tentang apa yang baik tentang buku itu, akan lebih bagus juga. Juga, bertujuan untuk satu buku per jawaban sehingga pemungutan …

4
Mengapa ANOVA setara dengan regresi linier?
Saya membaca bahwa ANOVA dan regresi linier adalah hal yang sama. Bagaimana bisa, mengingat bahwa output ANOVA adalah beberapa nilai dan beberapa p- nilai berdasarkan yang Anda simpulkan jika sampel berarti di sampel yang berbeda adalah sama atau berbeda.FFFppp Tetapi dengan asumsi cara tidak sama (menolak hipotesis nol), ANOVA tidak …
50 regression  anova 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.