Pertanyaan yang diberi tag «data-transformation»

Ekspresi matematis, seringkali nonlinier, dari nilai data. Data sering diubah baik untuk memenuhi asumsi model statistik atau untuk membuat hasil analisis lebih dapat ditafsirkan.

2
Mengubah data proporsi: ketika arcsin kuadrat tidak cukup
Apakah ada alternatif (lebih kuat?) Untuk transformasi root arcsin kuadrat untuk data persentase / proporsi? Dalam set data yang saya kerjakan saat ini, heteroskedastisitas yang ditandai tetap setelah saya menerapkan transformasi ini, yaitu plot residual vs nilai yang dipasang masih sangat rhoid. Diedit untuk menanggapi komentar: data adalah keputusan investasi …

4
Apa nilai yang benar untuk presisi dan mengingat dalam kasus tepi?
Presisi didefinisikan sebagai: p = true positives / (true positives + false positives) Apakah benar bahwa, sebagai true positivesdan false positivespendekatan 0, presisi mendekati 1? Pertanyaan yang sama untuk diingat: r = true positives / (true positives + false negatives) Saat ini saya sedang menerapkan tes statistik di mana saya …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
Dari distribusi seragam ke distribusi eksponensial dan sebaliknya
Ini mungkin pertanyaan sepele, tapi pencarian saya telah sia-sia sejauh ini, termasuk artikel wikipedia , dan "Kompendium Distribusi" dokumen . Jika memiliki distribusi seragam, apakah ini berarti bahwa mengikuti distribusi eksponensial?XXXeXeXe^X Demikian pula, jika mengikuti distribusi eksponensial, apakah ini berarti mengikuti distribusi yang seragam?l n ( Y )YYYln(Y)ln(Y)ln(Y)


2
Apakah transformasi log merupakan teknik yang valid untuk menguji-t data yang tidak normal?
Dalam meninjau sebuah makalah, penulis menyatakan, "Variabel hasil kontinyu yang menunjukkan distribusi miring diubah, menggunakan logaritma alami, sebelum uji t dilakukan untuk memenuhi asumsi prasyarat normalitas." Apakah ini cara yang dapat diterima untuk menganalisis data yang tidak normal, terutama jika distribusi yang mendasarinya tidak selalu lognormal? Ini mungkin pertanyaan yang …


3
Apa arti "normalisasi" dan bagaimana memverifikasi bahwa sampel atau distribusi dinormalisasi?
Saya memiliki pertanyaan di mana ia meminta untuk memverifikasi apakah distribusi Uniform ( ) dinormalisasi.Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) Untuk satu, apa artinya distribusi akan dinormalisasi? Dan kedua, bagaimana kita memverifikasi apakah suatu distribusi dinormalisasi atau tidak? Saya mengerti dengan menghitung kita mendapatkan data yang dinormalisasi , tetapi di sini diminta untuk memverifikasi …


2
Membandingkan AIC dari model dan versi log-transformed-nya
Inti dari pertanyaan saya adalah ini: Misalkan Y∈RnY∈RnY \in \mathbb{R}^n menjadi variabel acak normal multivariat dengan mean μμ\mu dan matriks kovarian ΣΣ\Sigma . Misalkan Z:=log(Y)Z:=log⁡(Y)Z := \log(Y) , yaitu Zi=log(Yi),i∈{1,…,n}Zi=log⁡(Yi),i∈{1,…,n}Z_i = \log(Y_i), i \in \{1,\ldots,n\} . Bagaimana cara membandingkan AIC model yang sesuai dengan realisasi yang diamati dari YYY versus …

4
Variabel “normalisasi” untuk SVD / PCA
Misalkan kita memiliki NNN variabel terukur, (a1,a2,…,aN)(a1,a2,…,aN)(a_1, a_2, \ldots, a_N) , kita melakukan sejumlah M>NM>NM > N pengukuran, dan kemudian ingin melakukan dekomposisi nilai singular pada hasil untuk menemukan sumbu varians tertinggi untuk poin MMM dalam NNN dimensi ruang. ( Catatan: asumsikan bahwa sarana aiaia_i telah dikurangi, jadi ⟨ai⟩=0⟨ai⟩=0\langle a_i …

2
Transformasi kembali koefisien regresi
Saya melakukan regresi linier dengan variabel dependen berubah. Transformasi berikut dilakukan sehingga asumsi normalitas residual akan berlaku. Variabel dependen yang tidak ditransformasi miring secara negatif, dan transformasi berikut membuatnya mendekati normal: Y=50−Yorig−−−−−−−−√Y=50−YorigY=\sqrt{50-Y_{orig}} di mana adalah variabel dependen pada skala asli.YorigYorigY_{orig} Saya pikir masuk akal untuk menggunakan beberapa transformasi pada koefisien …

2
Mengapa log-mentransformasikan data sebelum melakukan analisis komponen utama?
Saya mengikuti tutorial di sini: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ untuk mendapatkan pemahaman yang lebih baik tentang PCA. Tutorial menggunakan dataset Iris dan menerapkan transformasi log sebelum ke PCA: Perhatikan bahwa dalam kode berikut ini kami menerapkan transformasi log ke variabel kontinu seperti yang disarankan oleh [1] dan mengatur centerdan scalesama dengan TRUEdalam panggilan …

2
Mengapa GLM berbeda dari LM dengan variabel yang diubah
Sebagaimana dijelaskan dalam handout kursus ini (halaman 1) , model linear dapat ditulis dalam bentuk: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, di mana yyy adalah variabel respon dan xixix_{i} adalah variabel penjelas ithithi^{th} . Seringkali dengan tujuan memenuhi asumsi pengujian, seseorang dapat mengubah variabel …

2
Derivasi transformasi normalisasi untuk GLM
\newcommand{\E}{\mathbb{E}} Bagaimana A ( ⋅ ) = ∫ d uV 1 / 3 ( μ )A(⋅)=∫duV1/3(μ)A(\cdot) = \displaystyle\int\frac{du}{V^{1/3}(\mu)} transformasi normalisasi untuk keluarga eksponensial berasal? Lebih khusus : Saya mencoba mengikuti sketsa ekspansi Taylor di halaman 3, geser 1 di sini tetapi memiliki beberapa pertanyaan. Dengan XXX dari keluarga eksponensial, transformasi …

4
Perangkap yang harus dihindari saat mengubah data?
Saya mencapai hubungan linier yang kuat antara variabel dan Y saya setelah mengubah responsnya. Modelnya adalah Y ∼ X tetapi saya mengubahnya menjadi √XXXYYYY∼XY∼XY\sim X meningkatkanR2dari 0,19 ke 0,76.YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X}R2R2R^2 Jelas saya melakukan beberapa operasi yang layak pada hubungan ini. Adakah yang bisa mendiskusikan kesulitan melakukan hal ini, seperti bahaya …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.