Statistik dan Big Data

T&J untuk orang-orang yang tertarik dalam statistik, pembelajaran mesin, analisis data, penambangan data, dan visualisasi data

2
Bukti untuk pemanasan global buatan manusia mencapai 'standar emas': bagaimana mereka melakukan ini?
Pesan ini dalam artikel Reuter dari 25.02.2019 saat ini ada di seluruh berita: Bukti untuk pemanasan global buatan manusia mencapai 'standar emas' [Ilmuwan] mengatakan keyakinan bahwa aktivitas manusia yang meningkatkan panas di permukaan bumi telah mencapai level "lima-sigma", ukuran statistik yang berarti hanya ada peluang satu-dalam-sejuta bahwa sinyal akan muncul …

11
Berarti deviasi absolut vs standar deviasi
Dalam buku teks "Matematika Komprehensif Baru untuk Level O" oleh Greer (1983), saya melihat penyimpangan rata-rata dihitung seperti ini: Ringkas perbedaan absolut antara nilai tunggal dan rata-rata. Kemudian dapatkan rata-rata. Sepanjang bab istilah mean deviasi digunakan. Tetapi saya baru saja melihat beberapa referensi yang menggunakan istilah standar deviasi dan inilah …

1
Mendeteksi Pencilan dalam Time Series (LS / AO / TC) menggunakan paket tsoutliers di R. Bagaimana cara mewakili pencilan dalam format persamaan?
Komentar: Pertama saya ingin mengatakan besar terima kasih kepada penulis yang baru tsoutliers paket yang menerapkan Chen dan Liu deteksi time series outlier yang diterbitkan dalam Journal of American Association statistik pada tahun 1993 dalam perangkat lunak Open Source .RRR Paket mendeteksi 5 jenis pencilan yang berbeda secara iteratif dalam …

1
Regresi logistik: uji anova chi-square vs signifikansi koefisien (anova () vs ringkasan () dalam R)
Saya memiliki model GLM logistik dengan 8 variabel. Saya menjalankan uji chi-square di R anova(glm.model,test='Chisq')dan 2 dari variabel berubah menjadi prediksi ketika dipesan di bagian atas tes dan tidak begitu banyak ketika dipesan di bagian bawah. Itu summary(glm.model)menunjukkan bahwa koefisien mereka tidak signifikan (nilai p tinggi). Dalam hal ini tampaknya …

3
Bagaimana cara membuktikan bahwa fungsi basis radial adalah sebuah kernel?
Bagaimana untuk membuktikan bahwa fungsi dasar radial k(x,y)=exp(−||x−y||2)2σ2)k(x,y)=exp⁡(−||x−y||2)2σ2)k(x, y) = \exp(-\frac{||x-y||^2)}{2\sigma^2})adalah sebuah kernel? Sejauh yang saya mengerti, untuk membuktikan ini kita harus membuktikan salah satu dari yang berikut: Untuk setiap set vektor x1,x2,...,xnx1,x2,...,xnx_1, x_2, ..., x_n matriks K(x1,x2,...,xn)K(x1,x2,...,xn)K(x_1, x_2, ..., x_n) = (k(xi,xj))n×n(k(xi,xj))n×n(k(x_i, x_j))_{n \times n} adalah semidefinite positif. Sebuah …
35 svm  kernel-trick 

3
Kontradiksi signifikansi dalam regresi linier: uji-t signifikan untuk koefisien vs statistik F keseluruhan tidak signifikan
Saya menyesuaikan model regresi linier berganda antara 4 variabel kategori (dengan masing-masing 4 level) dan output numerik. Dataset saya memiliki 43 pengamatan. Regresi memberi saya nilai- ppp berikut dari uji- ttt untuk setiap koefisien kemiringan: .15,.67,.27,.02.15,.67,.27,.02.15, .67, .27, .02 . Dengan demikian, koefisien untuk prediktor ke-4 signifikan pada tingkat kepercayaan …

8
Berjalan acak di tepi kubus
Semut ditempatkan di sudut kubus dan tidak bisa bergerak. Seekor laba-laba mulai dari sudut yang berlawanan, dan dapat bergerak di sepanjang tepi kubus ke segala arah dengan probabilitas sama . Rata-rata, berapa banyak langkah yang diperlukan laba-laba untuk sampai ke semut?( x , y, z)(x,y,z)(x,y,z)1 / 31/31/3 (Ini bukan pekerjaan …



3
Apa itu kesalahan standar residual?
Ketika menjalankan model regresi berganda dalam R, salah satu outputnya adalah kesalahan standar residual 0,0589 pada 95,161 derajat kebebasan. Saya tahu bahwa 95,161 derajat kebebasan diberikan oleh perbedaan antara jumlah pengamatan dalam sampel saya dan jumlah variabel dalam model saya. Apa kesalahan standar residual?

4
Jumlah generik dari variabel acak Gamma
Saya telah membaca bahwa jumlah variabel acak Gamma dengan parameter skala yang sama adalah variabel acak Gamma lainnya. Saya juga telah melihat makalah oleh Moschopoulos yang menggambarkan metode untuk penjumlahan set umum variabel acak Gamma. Saya telah mencoba menerapkan metode Moschopoulos tetapi belum berhasil. Seperti apa penjumlahan set umum variabel …

2
Model Efek Campuran dengan Nesting
Saya memiliki data yang dikumpulkan dari percobaan yang diselenggarakan sebagai berikut: Dua situs, masing-masing dengan 30 pohon. 15 dirawat, 15 kontrol di setiap situs. Dari setiap pohon, kami mengambil sampel tiga potong batang, dan tiga potong akar, sehingga 6 tingkat 1 sampel per pohon yang diwakili oleh salah satu dari …

5
Bagaimana jika data regresi linier saya mengandung beberapa hubungan linier co-mingled?
Katakanlah saya sedang mempelajari bagaimana bunga bakung merespons berbagai kondisi tanah. Saya telah mengumpulkan data tentang pH tanah versus ketinggian matang bakung. Saya mengharapkan hubungan linier, jadi saya menjalankan regresi linier. Namun, saya tidak menyadari ketika saya memulai penelitian saya bahwa populasi sebenarnya mengandung dua varietas bakung, yang masing-masing merespon …



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.