Pertanyaan yang diberi tag «mathematical-statistics»

Teori statistik matematika, berkaitan dengan definisi formal dan hasil umum.

2
Apakah bias merupakan properti dari estimator, atau estimasi tertentu?
Sebagai contoh, saya sering bertemu siswa yang tahu bahwa Observed adalah penduga yang bias dari Populasi . Kemudian, ketika menulis laporan mereka, mereka mengatakan hal-hal seperti:R 2R2R2R^2R2R2R^2 "Saya menghitung Observed dan Adjusted , dan mereka sangat mirip, menunjukkan hanya sedikit bias dalam nilai Observed kami peroleh."R 2 R 2R2R2R^2R2R2R^2R2R2R^2 Saya …

2
Apa sebenarnya yang dimaksud dengan notasi
Apa yang dimaksud dengan notasi (dot over tilde), dalam konteks seperti ? x ˙ ∼ N(0,1)∼˙∼˙\dot\simx ∼˙N( 0 , 1 )x∼˙N(0,1)x \mathrel{\dot\sim} \mathcal N(0,1) Ternyata lebih mudah untuk menemukan cara mengesetnya dengan benar: tex.SE menjelaskan bahwa seseorang harus mengetik \mathrel{\dot\sim}alih-alih hanya \dot\simuntuk memperbaiki masalah penspasian - daripada menemukan apa artinya …

1
Ketika parametrizing ulang fungsi kemungkinan, apakah cukup dengan memasukkan variabel yang ditransformasi alih-alih perubahan formula variabel?
Misalkan saya sedang mencoba untuk parametrize ulang fungsi kemungkinan yang didistribusikan secara eksponensial. Jika fungsi kemungkinan asli saya adalah: p ( y∣ θ ) = θ e- θ yp(y∣θ)=θe−θy p(y \mid \theta) = \theta e^{-\theta y} dan saya ingin mengembalikan parameter menggunakan , karena bukan variabel acak, tetapi sebuah parameter, …

1
Memahami penggunaan logaritma dalam logaritma TF-IDF
Saya sedang membaca: https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition Tapi sepertinya saya tidak bisa mengerti persis mengapa formula itu dibuat seperti itu. Apa yang saya Pahami: iDF pada tingkat tertentu harus mengukur seberapa sering suatu istilah S muncul di setiap dokumen, menurun nilainya ketika istilah itu muncul lebih sering. Dari perspektif itu saya D F( …

2
Berapakah estimasi kemungkinan maksimum dari kovarians data normal bivariat ketika mean dan varians diketahui?
Misalkan kita memiliki sampel acak dari distribusi normal bivariat yang memiliki nol sebagai mean dan varians, sehingga satu-satunya parameter yang tidak diketahui adalah kovarians. Apa MLE dari kovarian? Saya tahu itu harus seperti tapi bagaimana kita tahu ini?1n∑nj=1xjyj1n∑j=1nxjyj\frac{1}{n} \sum_{j=1}^{n}x_j y_j


2
Dalam uji-t satu sampel, apa yang terjadi jika dalam penaksir varians mean sampel digantikan oleh ?
Asumsikan t-test satu-sampel, di mana hipotesis nol adalah . Statistik ini kemudian menggunakan deviasi standar sampel . Dalam mengestimasi , satu membandingkan pengamatan dengan mean sampel :μ=μ0μ=μ0\mu=\mu_0t=x¯¯¯−μ0s/n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} s=1n−1∑ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2} . Namun, jika kita menganggap diberikan benar, kita juga bisa memperkirakan standar deviasi menggunakan sebagai ganti mean sampel :μ0μ0\mu_0s∗s∗s^*μ0μ0\mu_0x¯¯¯x¯\overline{x} s∗=1n−1∑ni=1(xi−μ0)2−−−−−−−−−−−−−−−−√s∗=1n−1∑i=1n(xi−μ0)2s^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\mu_0)^2} …

2
Nilai yang diharapkan dari variabel acak Gaussian ditransformasikan dengan fungsi logistik
Baik fungsi logistik dan standar deviasi biasanya dilambangkan σσ\sigma . Saya akan menggunakan σ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x)) dan sss untuk standar deviasi. Saya memiliki neuron logistik dengan input acak yang berarti μμ\mu dan standar deviasi sss saya tahu. Saya berharap perbedaan dari rata-rata dapat didekati dengan baik oleh beberapa noise Gaussian. …


2
Pengujian hipotesis dan total variasi jarak vs divergensi Kullback-Leibler
Dalam penelitian saya, saya telah mengalami masalah umum berikut: Saya memiliki dua distribusi dan di domain yang sama, dan sejumlah besar sampel (tetapi terbatas) dari distribusi tersebut. Sampel didistribusikan secara independen dan identik dari salah satu dari dua distribusi ini (meskipun distribusi mungkin terkait: misalnya, mungkin campuran dan beberapa distribusi …


3
Distribusi
Sebagai latihan rutin, saya mencoba mencari distribusi X2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2} mana XXXdanYYYadalahvariabelbebasU(0,1)U(0,1) U(0,1)independen. Kepadatan bersama (X,Y)(X,Y)(X,Y) adalah fX,Y(x,y)=10&lt;x,y&lt;1fX,Y(x,y)=10&lt;x,y&lt;1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right), karenacosθcos⁡θ\cos\thetaberkurang padaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]; danzsinθ&lt;1⟹θ&lt;sin−1(1z)zsin⁡θ&lt;1⟹θ&lt;sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right), karenasinθsin⁡θ\sin\thetameningkat padaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]. Jadi, untuk 1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2 , kami memilikicos−1(1z)&lt;θ&lt;sin−1(1z)cos−1⁡(1z)&lt;θ&lt;sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right). Nilai absolut dari transformasi jacobian adalah |J|=z|J|=z|J|=z Jadi densitas gabungan (Z,Θ)(Z,Θ)(Z,\Theta) diberikan oleh fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} Mengintegrasikan θθ\theta , kami memperoleh …


1
Bagaimana cara menggambar grafik yang pas dan grafik sebenarnya dari distribusi gamma dalam satu plot?
Muat paket yang dibutuhkan. library(ggplot2) library(MASS) Hasilkan 10.000 angka yang pas untuk distribusi gamma. x &lt;- round(rgamma(100000,shape = 2,rate = 0.2),1) x &lt;- x[which(x&gt;0)] Gambarkan fungsi kerapatan probabilitas, seandainya kita tidak tahu distribusi x mana yang cocok. t1 &lt;- as.data.frame(table(x)) names(t1) &lt;- c("x","y") t1 &lt;- transform(t1,x=as.numeric(as.character(x))) t1$y &lt;- t1$y/sum(t1[,2]) ggplot() …

4
Model Sejarah Acara Diskrit-Waktu (Bertahan Hidup) di R
Saya mencoba menyesuaikan model waktu-diskrit dalam R, tapi saya tidak yakin bagaimana melakukannya. Saya telah membaca bahwa Anda dapat mengatur variabel dependen dalam baris yang berbeda, satu untuk setiap pengamatan waktu, dan menggunakan glmfungsi dengan logit atau tautan cloglog. Dalam hal ini, saya memiliki tiga kolom: ID, Event(1 atau 0, …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.