Statistik dan Big Data mathematical-statistics

2

Apakah bias merupakan properti dari estimator, atau estimasi tertentu?

Sebagai contoh, saya sering bertemu siswa yang tahu bahwa Observed adalah penduga yang bias dari Populasi . Kemudian, ketika menulis laporan mereka, mereka mengatakan hal-hal seperti:R 2R2R2R^2R2R2R^2 "Saya menghitung Observed dan Adjusted , dan mereka sangat mirip, menunjukkan hanya sedikit bias dalam nilai Observed kami peroleh."R 2 R 2R2R2R^2R2R2R^2R2R2R^2 Saya …

10 mathematical-statistics terminology bias estimators

2

Apa sebenarnya yang dimaksud dengan notasi

Apa yang dimaksud dengan notasi (dot over tilde), dalam konteks seperti ? x ˙ ∼ N(0,1)∼˙∼˙\dot\simx ∼˙N( 0 , 1 )x∼˙N(0,1)x \mathrel{\dot\sim} \mathcal N(0,1) Ternyata lebih mudah untuk menemukan cara mengesetnya dengan benar: tex.SE menjelaskan bahwa seseorang harus mengetik \mathrel{\dot\sim}alih-alih hanya \dot\simuntuk memperbaiki masalah penspasian - daripada menemukan apa artinya …

10 mathematical-statistics notation

1

Ketika parametrizing ulang fungsi kemungkinan, apakah cukup dengan memasukkan variabel yang ditransformasi alih-alih perubahan formula variabel?

Misalkan saya sedang mencoba untuk parametrize ulang fungsi kemungkinan yang didistribusikan secara eksponensial. Jika fungsi kemungkinan asli saya adalah: p ( y∣ θ ) = θ e- θ yp(y∣θ)=θe−θy p(y \mid \theta) = \theta e^{-\theta y} dan saya ingin mengembalikan parameter menggunakan , karena bukan variabel acak, tetapi sebuah parameter, …

10 regression bayesian mathematical-statistics

1

Memahami penggunaan logaritma dalam logaritma TF-IDF

Saya sedang membaca: https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition Tapi sepertinya saya tidak bisa mengerti persis mengapa formula itu dibuat seperti itu. Apa yang saya Pahami: iDF pada tingkat tertentu harus mengukur seberapa sering suatu istilah S muncul di setiap dokumen, menurun nilainya ketika istilah itu muncul lebih sering. Dari perspektif itu saya D F( …

10 machine-learning clustering mathematical-statistics text-mining natural-language

2

Berapakah estimasi kemungkinan maksimum dari kovarians data normal bivariat ketika mean dan varians diketahui?

Misalkan kita memiliki sampel acak dari distribusi normal bivariat yang memiliki nol sebagai mean dan varians, sehingga satu-satunya parameter yang tidak diketahui adalah kovarians. Apa MLE dari kovarian? Saya tahu itu harus seperti tapi bagaimana kita tahu ini?1n∑nj=1xjyj1n∑j=1nxjyj\frac{1}{n} \sum_{j=1}^{n}x_j y_j

10 normal-distribution mathematical-statistics maximum-likelihood bivariate

1

Klarifikasi dalam geometri informasi

Pertanyaan ini berkaitan dengan makalah Diferensial Geometri Keluarga Kurva Eksponensial-Lengkung dan Kehilangan Informasi oleh Amari. Teksnya sebagai berikut. Biarkan menjadi manifold dimensi dari distribusi probabilitas dengan sistem koordinat , di mana diasumsikan ...n θ = ( θ 1 , … , θ n ) p θ ( x ) > …

10 mathematical-statistics statistical-learning geometry information-geometry

2

Dalam uji-t satu sampel, apa yang terjadi jika dalam penaksir varians mean sampel digantikan oleh ?

Asumsikan t-test satu-sampel, di mana hipotesis nol adalah . Statistik ini kemudian menggunakan deviasi standar sampel . Dalam mengestimasi , satu membandingkan pengamatan dengan mean sampel :μ=μ0μ=μ0\mu=\mu_0t=x¯¯¯−μ0s/n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} s=1n−1∑ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2} . Namun, jika kita menganggap diberikan benar, kita juga bisa memperkirakan standar deviasi menggunakan sebagai ganti mean sampel :μ0μ0\mu_0s∗s∗s^*μ0μ0\mu_0x¯¯¯x¯\overline{x} s∗=1n−1∑ni=1(xi−μ0)2−−−−−−−−−−−−−−−−√s∗=1n−1∑i=1n(xi−μ0)2s^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\mu_0)^2} …

10 mathematical-statistics variance t-test

2

Nilai yang diharapkan dari variabel acak Gaussian ditransformasikan dengan fungsi logistik

Baik fungsi logistik dan standar deviasi biasanya dilambangkan σσ\sigma . Saya akan menggunakan σ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x)) dan sss untuk standar deviasi. Saya memiliki neuron logistik dengan input acak yang berarti μμ\mu dan standar deviasi sss saya tahu. Saya berharap perbedaan dari rata-rata dapat didekati dengan baik oleh beberapa noise Gaussian. …

10 distributions normal-distribution neural-networks mathematical-statistics expected-value

1

Apakah regresi dengan kesalahan siswa tidak berguna?

Silakan lihat edit. Ketika Anda memiliki data dengan ekor yang berat, melakukan regresi dengan kesalahan siswa-t sepertinya hal yang intuitif untuk dilakukan. Sambil menjelajahi kemungkinan ini, saya menemukan makalah ini: Breusch, TS, Robertson, JC, & Welsh, AH (01 November 1997). Pakaian baru kaisar: kritik terhadap model regresi t multivariat. Statistica …

10 regression mathematical-statistics modeling robust

2

Pengujian hipotesis dan total variasi jarak vs divergensi Kullback-Leibler

Dalam penelitian saya, saya telah mengalami masalah umum berikut: Saya memiliki dua distribusi dan di domain yang sama, dan sejumlah besar sampel (tetapi terbatas) dari distribusi tersebut. Sampel didistribusikan secara independen dan identik dari salah satu dari dua distribusi ini (meskipun distribusi mungkin terkait: misalnya, mungkin campuran dan beberapa distribusi …

10 hypothesis-testing mathematical-statistics kullback-leibler information-theory bounds

4

Gambaran besar tentang analisis survival dan analisis data kehidupan

Saya telah mendengar tentang analisis survival dan analisis data kehidupan, tetapi tidak cukup mendapatkan gambaran besarnya. Saya bertanya-tanya topik apa yang mereka bahas? Apakah ini murni statistik, atau hanya penerapan statistik pada area tertentu? Apakah analisis tanggal kehidupan merupakan bagian dari analisis kelangsungan hidup? Terima kasih dan salam!

10 survival mathematical-statistics

3

Distribusi

Sebagai latihan rutin, saya mencoba mencari distribusi X2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2} mana XXXdanYYYadalahvariabelbebasU(0,1)U(0,1) U(0,1)independen. Kepadatan bersama (X,Y)(X,Y)(X,Y) adalah fX,Y(x,y)=10<x,y<1fX,Y(x,y)=10<x,y<1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right), karenacosθcos⁡θ\cos\thetaberkurang padaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]; danzsinθ<1⟹θ<sin−1(1z)zsin⁡θ<1⟹θ<sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right), karenasinθsin⁡θ\sin\thetameningkat padaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]. Jadi, untuk 1<z<2–√1<z<21< z<\sqrt 2 , kami memilikicos−1(1z)<θ<sin−1(1z)cos−1⁡(1z)<θ<sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right). Nilai absolut dari transformasi jacobian adalah |J|=z|J|=z|J|=z Jadi densitas gabungan (Z,Θ)(Z,Θ)(Z,\Theta) diberikan oleh fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} Mengintegrasikan θθ\theta , kami memperoleh …

10 self-study distributions mathematical-statistics uniform

1

Bukti teorema Pitman – Koopman – Darmois

Di mana saya dapat menemukan bukti teorema Pitman – Koopman – Darmois? Saya telah mencari Google untuk beberapa waktu. Anehnya, banyak catatan menyebutkan teorema ini namun tidak satupun dari mereka yang membuktikannya.

10 mathematical-statistics references inference sufficient-statistics

1

Bagaimana cara menggambar grafik yang pas dan grafik sebenarnya dari distribusi gamma dalam satu plot?

Muat paket yang dibutuhkan. library(ggplot2) library(MASS) Hasilkan 10.000 angka yang pas untuk distribusi gamma. x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] Gambarkan fungsi kerapatan probabilitas, seandainya kita tidak tahu distribusi x mana yang cocok. t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) t1$y <- t1$y/sum(t1[,2]) ggplot() …

10 r mathematical-statistics goodness-of-fit gamma-distribution ggplot2

4

Model Sejarah Acara Diskrit-Waktu (Bertahan Hidup) di R

Saya mencoba menyesuaikan model waktu-diskrit dalam R, tapi saya tidak yakin bagaimana melakukannya. Saya telah membaca bahwa Anda dapat mengatur variabel dependen dalam baris yang berbeda, satu untuk setiap pengamatan waktu, dan menggunakan glmfungsi dengan logit atau tautan cloglog. Dalam hal ini, saya memiliki tiga kolom: ID, Event(1 atau 0, …

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

Pertanyaan yang diberi tag «mathematical-statistics»