Statistik dan Big Data distributions

2

Saya ingin tahu apakah ada uji statistik untuk "menguji" pentingnya distribusi bimodal. Maksud saya, seberapa banyak data saya memenuhi distribusi bimodal atau tidak? Jika demikian, apakah ada tes dalam program R?

30 r hypothesis-testing distributions bimodal

5

Strategi untuk mengajarkan distribusi sampling

Versi tl; Strategi sukses apa yang Anda pakai untuk mengajarkan distribusi sampling (dari mean sampel, misalnya) di tingkat sarjana pengantar? Latar belakang Pada bulan September saya akan mengajar kursus statistik pengantar untuk ilmu sosial tahun kedua (terutama ilmu politik dan sosiologi) siswa menggunakan The Basic Practice of Statistics oleh David …

30 distributions sampling teaching

2

Apa perbedaan antara uji normalitas Shapiro-Wilk dan uji normalitas Kolmogorov-Smirnov?

Apa perbedaan antara uji normalitas Shapiro-Wilk dan uji normalitas Kolmogorov-Smirnov? Kapan hasil dari kedua metode ini berbeda?

30 distributions statistical-significance normality-assumption kolmogorov-smirnov

3

Mengapa tidak melaporkan rata-rata distribusi bootstrap?

Ketika satu bootstrap parameter untuk mendapatkan kesalahan standar kita mendapatkan distribusi parameter. Mengapa kita tidak menggunakan rata-rata distribusi itu sebagai hasil atau perkiraan untuk parameter yang kita coba dapatkan? Bukankah seharusnya distribusi mendekati yang asli? Karena itu, kami akan mendapatkan estimasi nilai "nyata" yang baik? Namun kami melaporkan parameter asli …

30 distributions bootstrap standard-error expected-value

5

Cara menangani data hierarkis / bersarang dalam pembelajaran mesin

Saya akan menjelaskan masalah saya dengan sebuah contoh. Misalkan Anda ingin memprediksi penghasilan seseorang yang diberikan beberapa atribut: {Usia, Jenis Kelamin, Negara, Wilayah, Kota}. Anda memiliki dataset pelatihan seperti itu train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

5

Adakah penjelasan mengapa ada begitu banyak fenomena alam yang mengikuti distribusi normal?

Saya pikir ini adalah topik yang menarik dan saya tidak sepenuhnya memahaminya. Apa hukum fisika dibuat sehingga begitu banyak fenomena alam memiliki distribusi normal? Tampaknya lebih intuitif bahwa mereka akan memiliki distribusi yang seragam. Sangat sulit bagi saya untuk memahami hal ini dan saya merasa saya kehilangan beberapa informasi. Adakah …

29 distributions normal-distribution normality-assumption uniform

4

Di mana teori grafik dalam model grafis?

Pengantar model grafis menggambarkan mereka sebagai "... perkawinan antara teori grafik dan teori probabilitas." Saya mendapatkan bagian teori probabilitas tetapi saya mengalami kesulitan memahami di mana tepatnya teori grafik cocok. Wawasan apa dari teori grafik yang telah membantu memperdalam pemahaman kita tentang distribusi probabilitas dan pengambilan keputusan di bawah ketidakpastian? …

29 graphical-model graph-theory distributions

3

Apa perbedaan distribusi Poisson dengan distribusi normal?

Saya telah menghasilkan vektor yang memiliki distribusi Poisson, sebagai berikut: x = rpois(1000,10) Jika saya membuat histogram menggunakan hist(x), distribusi terlihat seperti distribusi normal berbentuk lonceng yang sudah dikenal. Namun, tes Kolmogorov-Smirnoff menggunakan ks.test(x, 'pnorm',10,3)mengatakan distribusi secara signifikan berbeda dengan distribusi normal, karena pnilai yang sangat kecil . Jadi pertanyaan …

29 distributions histogram normal-distribution poisson-distribution

6

Interpretasi uji Shapiro-Wilk

Saya cukup baru dalam bidang statistik dan saya membutuhkan bantuan Anda. Saya punya sampel kecil, sebagai berikut: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Saya menjalankan tes Shapiro-Wilk menggunakan R: shapiro.test(precisionH4U$H4U) dan saya mendapat hasil sebagai berikut: W = 0.9502, p-value = 0.6921 Sekarang, jika saya menganggap …

29 r distributions interpretation goodness-of-fit normality-assumption

3

R: Random Forest melemparkan NaN / Inf dalam kesalahan "panggilan fungsi asing" meskipun tidak ada dataset NaN [ditutup]

Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 2 tahun yang lalu . Saya menggunakan tanda sisipan untuk menjalankan hutan acak lintas divalidasi atas dataset. Variabel Y adalah faktor. Tidak ada NaN, Inf, …

29 r random-forest caret regression prediction fitting social-science poisson-distribution distributions characteristic-function bayesian prior regression normal-distribution interaction nonparametric skewness svm standard-deviation standard-error regression-coefficients igraph natural-language word2vec word-embeddings regression machine-learning sampling r regression machine-learning random-forest ensemble sampling unbiased-estimator proof estimators mse probability conditional-probability bayes anova missing-data neural-networks recommender-system r confidence-interval sample multiple-imputation r time-series forecasting mase

4

Bagaimana cara mengukur ketidakseragaman suatu distribusi?

Saya mencoba membuat metrik untuk mengukur ketidaksamaan distribusi untuk percobaan yang saya jalankan. Saya memiliki variabel acak yang harus didistribusikan secara seragam dalam banyak kasus, dan saya ingin dapat mengidentifikasi (dan mungkin mengukur tingkat) contoh kumpulan data di mana variabel tidak terdistribusi secara seragam dalam margin tertentu. Contoh tiga seri …

28 distributions variance random-variable uniform

7

Apa nama dari kekeliruan statistik dimana hasil dari koin sebelumnya mempengaruhi kepercayaan tentang koin berikutnya?

Seperti yang kita semua tahu, jika Anda melempar koin yang memiliki kesempatan yang sama untuk mendarat kepala seperti halnya ekor, maka jika Anda membalik koin berkali-kali, separuh waktu Anda akan mendapatkan kepala dan separuh waktu Anda akan mendapatkan ekor. Ketika mendiskusikan hal ini dengan seorang teman, mereka mengatakan bahwa jika …

28 probability distributions sampling

3

Distribusi Rasio Gaussian: Derivatif wrt yang mendasari 's dan s

Saya bekerja dengan dua distribusi normal independen dan , dengan mean dan dan varians dan .Y μ x μ y σ 2 x σ 2 yXXXYYYμxμx\mu_xμyμy\mu_yσ2xσx2\sigma^2_xσ2yσy2\sigma^2_y Saya tertarik dalam distribusi rasio mereka . Baik maupun memiliki rata-rata nol, jadi tidak didistribusikan sebagai Cauchy.X Y ZZ= X/ YZ=X/YZ=X/YXXXYYYZZZ Saya perlu menemukan …

28 distributions normal-distribution references mathematical-statistics cdf

1

Estimasi kemungkinan maksimum untuk distribusi terpotong

Pertimbangkan sampel independen diperoleh dari variabel acak yang diasumsikan mengikuti distribusi terpotong (mis. Distribusi terpotong ) dari nilai minimum dan maksimum yang diketahui (hingga) dan tetapi dari parameter yang tidak diketahui dan . Jika mengikuti distribusi non-terpotong, estimator kemungkinan maksimum dan untuk dan dari akan menjadi rata-rata sampelS XNNNSSSXXXb μ …

28 distributions estimation mathematical-statistics maximum-likelihood truncation

4

Ukuran kesamaan atau jarak antara dua matriks kovarian

Apakah ada ukuran kesamaan atau jarak antara dua matriks kovarians simetris (keduanya memiliki dimensi yang sama)? Saya berpikir di sini analog dengan KL divergensi dari dua distribusi probabilitas atau jarak Euclidean antara vektor kecuali diterapkan pada matriks. Saya membayangkan akan ada beberapa pengukuran kesamaan. Idealnya saya juga ingin menguji hipotesis …

28 distributions hypothesis-testing covariance-matrix kullback-leibler information-theory

Pertanyaan yang diberi tag «distributions»