Pertanyaan yang diberi tag «data-transformation»

Ekspresi matematis, seringkali nonlinier, dari nilai data. Data sering diubah baik untuk memenuhi asumsi model statistik atau untuk membuat hasil analisis lebih dapat ditafsirkan.





1
Mengapa transformasi akar kuadrat direkomendasikan untuk menghitung data?
Sering disarankan untuk mengambil akar kuadrat ketika Anda memiliki data hitungan. (Untuk beberapa contoh pada CV, lihat jawaban @ HarveyMotulsky di sini , atau jawaban @ whuber di sini .) Di sisi lain, ketika memasang model linear umum dengan variabel respons yang didistribusikan sebagai Poisson, log adalah tautan kanonik . …


8
Apakah masuk akal untuk memperlakukan data kategorikal sebagai berkelanjutan?
Dalam menjawab pertanyaan ini pada data diskrit dan kontinu, saya dengan tegas menyatakan bahwa jarang masuk akal untuk memperlakukan data kategorikal sebagai kontinu. Di muka itu yang tampak jelas, tetapi intuisi sering menjadi panduan yang buruk untuk statistik, atau setidaknya milikku. Jadi sekarang saya bertanya-tanya: apakah itu benar? Atau adakah …

3
Kapan skala log cocok?
Saya pernah membaca bahwa menggunakan skala log ketika membuat grafik / grafik sesuai dalam keadaan tertentu, seperti sumbu y dalam bagan seri waktu. Namun, saya belum dapat menemukan penjelasan yang pasti mengapa itu yang terjadi, atau kapan lagi itu akan sesuai. Harap diingat, saya bukan ahli statistik jadi saya mungkin …


1
Pengkodean satu-panas vs dummy di Scikit-learn
Ada dua cara berbeda untuk menyandikan variabel kategori. Katakanlah, satu variabel kategori memiliki nilai n . Pengkodean satu-panas mengkonversinya menjadi n variabel, sedangkan pengkodean dummy mengubahnya menjadi variabel n-1 . Jika kita memiliki variabel k kategori, masing-masing memiliki nilai n . Satu pengkodean panas berakhir dengan variabel kn , sedangkan …

1
Bagaimana menerapkan standardisasi / normalisasi ke train- and testset jika prediksi adalah tujuannya?
Apakah saya mengubah semua data atau lipatan saya (jika CV diterapkan) secara bersamaan? misalnya (allData - mean(allData)) / sd(allData) Apakah saya mengubah trainset dan testset secara terpisah? misalnya (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Atau apakah saya mengubah trainset dan menggunakan perhitungan pada testset? misalnya (trainData …

3
Interpretasi dari prediktor dan / atau respons yang diubah log
Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log. Pertimbangkan kasus log(DV) = Intercept + B1*IV + Error Saya bisa menafsirkan IV sebagai peningkatan persen tetapi bagaimana ini berubah ketika saya punya log(DV) = Intercept + B1*log(IV) …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
Normalisasi vs penskalaan
Apa perbedaan antara data 'Normalisasi' dan data 'Skala'? Sampai sekarang saya pikir kedua istilah mengacu pada proses yang sama tetapi sekarang saya menyadari ada sesuatu yang lebih yang saya tidak tahu / mengerti. Juga jika ada perbedaan antara Normalisasi dan Penskalaan, kapan kita harus menggunakan Normalisasi tetapi tidak untuk Penskalaan …

1
Regresi: Mengubah Variabel
Saat mentransformasikan variabel, apakah Anda harus menggunakan semua transformasi yang sama? Misalnya, dapatkah saya memilih dan memilih variabel yang diubah secara berbeda, seperti pada: Biarkan, menjadi usia, lama bekerja, lama tinggal, dan penghasilan.x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Atau, haruskah Anda konsisten dengan transformasi Anda dan menggunakan semua …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.