Pertanyaan yang diberi tag «normal-distribution»

Distribusi normal, atau Gaussian, memiliki fungsi kepadatan yang merupakan kurva berbentuk lonceng simetris. Ini adalah salah satu distribusi paling penting dalam statistik. Gunakan tag [normalitas] untuk bertanya tentang pengujian normalitas.

5
Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?
Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


4
Asumsi distribusi residu regresi
Mengapa perlu menempatkan asumsi distribusi pada kesalahan, yaitu ϵ i ∼ N ( 0 , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , dengan .ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Kenapa tidak menulis y i ~ N ( X β , σ 2 )yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , dengan ,yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) …


2
Intuisi di balik fungsi kepadatan distribusi-t
Saya sedang mempelajari tentang distribusi-t Student dan saya mulai bertanya-tanya, bagaimana cara mendapatkan fungsi kepadatan distribusi-t (dari wikipedia, http://en.wikipedia.org/wiki/Student%27s_t-distribution ): f(t)=Γ(v+12)vπ−−√Γ(v2)(1+t2v)−v+12f(t)=Γ(v+12)vπΓ(v2)(1+t2v)−v+12f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}} di mana adalah derajat kebebasan dan Γ adalah fungsi gamma. Apa intuisi dari fungsi ini? Maksudku, jika aku melihat fungsi massa probabilitas distribusi binomial, masuk akal …

2
Ketika data memiliki distribusi gaussian, berapa banyak sampel akan mencirikannya?
Data Gaussian yang didistribusikan dalam dimensi tunggal memerlukan dua parameter untuk mengkarakterisasi (rata-rata, varians), dan rumor mengatakan bahwa sekitar 30 sampel yang dipilih secara acak biasanya cukup untuk memperkirakan parameter ini dengan kepercayaan yang cukup tinggi. Tetapi apa yang terjadi ketika jumlah dimensi bertambah? Dalam dua dimensi (mis. Tinggi, berat), …


2
Berapa jarak antara campuran Gaussian terbatas dan Gaussian?
Misalkan saya memiliki campuran banyak Gaussians dengan bobot, sarana, dan standar deviasi yang diketahui. Berarti tidak sama. Deviasi rata-rata dan standar dari campuran dapat dihitung, tentu saja, karena momen adalah rata-rata tertimbang dari momen komponen. Campuran itu bukan distribusi normal, tetapi seberapa jauh dari normal itu? Gambar di atas menunjukkan …

2
Nilai korelasi palsu yang diharapkan
Kami menarik sampel , masing-masing ukuran , secara independen dari distribusi Normal .n ( μ , σ 2 )NNNnnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) Dari sampel kami kemudian memilih 2 sampel yang memiliki korelasi Pearson tertinggi (absolut) satu sama lain.NNN Berapa nilai yang diharapkan dari korelasi ini? Terima kasih [PS Ini bukan pekerjaan rumah]

1
Paket python untuk bekerja dengan model campuran Gaussian (GMM)
Tampaknya ada beberapa opsi yang tersedia untuk bekerja dengan Gaussian Mixture Model (GMMs) dengan Python. Sekilas, setidaknya ada: PyMix - http://www.pymix.org/pymix/index.php Alat untuk pemodelan campuran PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/ yang merupakan bagian dari Scipy toolbox dan tampaknya berfokus pada Pembaruan GMM : Sekarang dikenal sebagai sklearn.mixture . PyPR - http://pypr.sourceforge.net/ pengenalan …




3
Jeffreys Prior untuk distribusi normal dengan mean dan varian tidak diketahui
Saya membaca tentang distribusi sebelumnya dan saya menghitung Jeffrey sebelumnya untuk sampel variabel acak yang terdistribusi normal dengan rerata tidak diketahui dan tidak diketahui. Menurut perhitungan saya, berikut ini berlaku untuk Jeffreys sebelumnya: Di sini, adalah matriks informasi Fisher.p(μ,σ2)=det(I)−−−−−√=det(1/σ2001/(2σ4))−−−−−−−−−−−−−−−−−−√=12σ6−−−−√∝1σ3.p(μ,σ2)=det(I)=det(1/σ2001/(2σ4))=12σ6∝1σ3. p(\mu,\sigma^2)=\sqrt{det(I)}=\sqrt{det\begin{pmatrix}1/\sigma^2 & 0 \\ 0 & 1/(2\sigma^4)\end{pmatrix}}=\sqrt{\frac{1}{2\sigma^6}}\propto\frac{1}{\sigma^3}.III Namun, saya juga sudah …

2
Distribusi probabilitas untuk gelombang sinus yang bising
Saya mencari untuk secara analitik menghitung distribusi probabilitas titik pengambilan sampel dari fungsi berosilasi ketika ada beberapa kesalahan pengukuran. Saya sudah menghitung distribusi probabilitas untuk bagian "tanpa suara" (saya akan menempatkan ini di akhir), tetapi saya tidak tahu bagaimana memasukkan "suara". Perkiraan angka Agar lebih jelas, bayangkan ada beberapa fungsi …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.