Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data


3
Bagaimana cara menghitung varians yang dikumpulkan dari dua kelompok atau lebih yang diberikan varians kelompok yang diketahui, sarana, dan ukuran sampel?
Katakanlah ada elemen m+nm+nm+n dibagi menjadi dua kelompok ( mmm dan nnn ). σ2mσm2\sigma_m^2 dari grup pertama adalah \ sigma_m ^ 2 dan varians dari grup kedua adalah σ2nσn2\sigma^2_n . Elemen-elemen itu sendiri dianggap tidak diketahui tetapi saya tahu cara μmμm\mu_m dan μnμn\mu_n . Apakah ada cara untuk menghitung varians …
32 variance  pooling 

3
Regresi logistik kernel vs SVM
Seperti diketahui oleh semua, SVM dapat menggunakan metode kernel untuk memproyeksikan titik data di ruang yang lebih tinggi sehingga titik dapat dipisahkan oleh ruang linear. Tetapi kita juga dapat menggunakan regresi logistik untuk memilih batas ini di ruang kernel, jadi apa kelebihan SVM? Karena SVM menggunakan model jarang di mana …
32 svm 


3
Apakah mungkin untuk menemukan standar deviasi gabungan?
Misalkan saya punya 2 set: Set A : jumlah item , ,n=10n=10n= 10μ=2.4μ=2.4\mu = 2.4σ=0.8σ=0.8\sigma = 0.8 Set B : jumlah item , ,n=5n=5n= 5μ=2μ=2\mu = 2σ=1.2σ=1.2\sigma = 1.2 Saya dapat menemukan mean gabungan ( ) dengan mudah, tetapi bagaimana saya bisa menemukan standar deviasi gabungan?μμ\mu

2
Bagaimana cara menemukan interval kepercayaan untuk peringkat?
" Bagaimana Tidak Mengurutkan Menurut Peringkat Rata-Rata " dari Evan Miller mengusulkan penggunaan batas bawah dari interval kepercayaan untuk mendapatkan "skor" agregat yang masuk akal untuk item yang dinilai. Namun, ini bekerja dengan model Bernoulli: peringkatnya baik jempol ke atas atau jempol ke bawah. Apa interval kepercayaan yang wajar untuk …




1
Varians pada penjumlahan nilai prediksi dari model efek campuran pada jangka waktu
Saya memiliki model efek campuran (sebenarnya model campuran aditif umum) yang memberi saya prediksi untuk jangka waktu. Untuk mengatasi autokorelasi, saya menggunakan model corCAR1, mengingat fakta saya memiliki data yang hilang. Data seharusnya memberi saya beban total, jadi saya perlu menjumlahkan seluruh interval prediksi. Tapi saya juga harus mendapatkan estimasi …


4
ANOVA pada data binomial
Saya menganalisis kumpulan data eksperimental. Data terdiri dari vektor pasangan jenis pengobatan dan hasil binomial: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... Di kolom hasil, 1 menunjukkan keberhasilan dan 0 menunjukkan kegagalan. Saya ingin mencari tahu apakah perawatan secara signifikan memvariasikan hasilnya. Ada 4 …

6
Klasifikasi statistik teks
Saya seorang programmer tanpa latar belakang statistik, dan saat ini saya sedang mencari metode klasifikasi yang berbeda untuk sejumlah besar dokumen yang berbeda yang ingin saya klasifikasikan ke dalam kategori yang telah ditentukan. Saya telah membaca tentang kNN, SVM dan NN. Namun, saya kesulitan memulai. Sumber daya apa yang Anda …


12
Apa konsep statistik paling sulit untuk dipahami?
Ini adalah pertanyaan yang mirip dengan yang ada di sini , tetapi cukup berbeda menurut saya layak untuk ditanyakan. Saya pikir saya akan menjadi starter, apa yang saya pikir salah satu yang paling sulit untuk dipahami adalah. Milik saya adalah perbedaan antara probabilitas dan frekuensi . Yang satu berada pada …
32 teaching 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.