Pertanyaan yang diberi tag «data-transformation»

Ekspresi matematis, seringkali nonlinier, dari nilai data. Data sering diubah baik untuk memenuhi asumsi model statistik atau untuk membuat hasil analisis lebih dapat ditafsirkan.

4
Menggunakan Desibel dalam Statistik
Saya sedang mengerjakan proyek yang melibatkan membaca Tag RFID dan membandingkan kekuatan sinyal yang dilihat pembaca ketika Anda mengubah konfigurasi antena (jumlah antena, posisi, dll ...). Sebagai bagian dari proyek, saya perlu membandingkan pengaturan untuk melihat mana yang paling efektif. Idealnya, saya bisa melakukan Un-paired t-Test atau ANOVA di antara …

2
Tes Bartlett vs tes Levene
Saat ini saya mencoba menangani pelanggaran terhadap asumsi ANOVA. Saya telah menggunakan Shapiro-Wilk untuk menguji normalitas, dan telah mencoba-coba dengan tes Levene dan Bartlett tentang kesetaraan varian. Sejak saat itu saya mengubah data saya untuk mencoba dan memperbaiki varian yang tidak sama. Saya memutar ulang tes Bartlett pada data transformasi …


3
Apakah formula ini untuk mengubah P, LSD, MSD, HSD, CI, untuk SE sebagai / perkiraan konservatif tepat atau meningkat dari
Latar Belakang Saya sedang melakukan meta-analisis yang mencakup data yang dipublikasikan sebelumnya. Seringkali, perbedaan antara perawatan dilaporkan dengan nilai-P, perbedaan paling signifikan (LSD), dan statistik lainnya tetapi tidak memberikan estimasi langsung dari varians. Dalam konteks model yang saya gunakan, perkiraan perbedaan terlalu tinggi tidak apa-apa. Masalah Berikut adalah daftar transformasi …


1
Interval kepercayaan kembali ditransformasikan
Setelah menemukan diskusi ini, saya mengajukan pertanyaan tentang konvensi interval kepercayaan yang ditransformasikan kembali. Menurut artikel ini , cakupan nominal back-transformed CI untuk rata-rata variabel acak log-normal adalah: LCL(X)=exp(Y+var(Y) UCL ( X) = exp( Y+ var ( Y)2+ zvar ( Y)n+ var ( Y)22 ( n - 1 )------------√) UCL(X)=exp⁡(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1))\ …

1
Berurusan dengan regresi dari variabel respons yang dibatasi secara tidak biasa
Saya mencoba untuk memodelkan variabel respons yang secara teoritis dibatasi antara -225 dan +225. Variabelnya adalah skor total yang diperoleh subjek saat bermain game. Meskipun secara teoritis dimungkinkan untuk mata pelajaran untuk mencetak +225. Meskipun demikian karena skor tidak hanya bergantung pada aksi subjek, tetapi juga aksi aksi lainnya, skor …

2
Ubah variabel kontinu untuk regresi logistik
Saya memiliki data survei besar, variabel hasil biner dan banyak variabel penjelas termasuk biner dan kontinu. Saya membangun set model (bereksperimen dengan GLM dan GLM campuran) dan menggunakan pendekatan teori informasi untuk memilih model teratas. Saya hati-hati memeriksa penjelasan (baik kontinu dan kategoris) untuk korelasi dan saya hanya menggunakan yang …

2
Masalah mengkonversi dari faktor ke variabel numerik dalam R [ditutup]
Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 7 tahun yang lalu . Saya ingin mengonversi variabel faktor menjadi yang numerik tetapi as.numerictidak memiliki efek yang saya harapkan. Di bawah ini saya mendapatkan …

2
Pengelompokan yang sangat miring, hitung data: ada saran untuk ditindaklanjuti (mengubah dll)?
Masalah dasar Inilah masalah dasar saya: Saya mencoba mengelompokkan dataset yang berisi beberapa variabel yang sangat miring dengan jumlah. Variabel mengandung banyak nol dan karenanya tidak terlalu informatif untuk prosedur pengelompokan saya - yang kemungkinan merupakan algoritma k-means. Baik, Anda berkata, hanya mengubah variabel menggunakan akar kuadrat, kotak cox, atau …

1
Variabel terpusat VS standar
Saya telah menemukan banyak posting berguna tentang variabel independen standar dan variabel bebas terpusat pada stats.stackexchange.com, tetapi saya masih agak bingung. Saya meminta Anda untuk mengevaluasi apa yang telah saya pahami. Juga, jika yang berikut ini tidak benar, bisakah Anda memperbaiki saya? Bagaimana cara standarisasi. Variabel terstandarisasi diperoleh dengan mengurangi …

4
Mengapa tidak melakukan log-transform semua variabel yang tidak menjadi perhatian utama?
Buku dan diskusi sering menyatakan bahwa ketika menghadapi masalah (yang ada beberapa) dengan prediktor, log-transformimg adalah suatu kemungkinan. Sekarang, saya mengerti bahwa ini tergantung pada distribusi dan normalitas dalam prediktor bukan asumsi regresi; tetapi transformasi log tidak membuat data lebih seragam, lebih sedikit terpengaruh oleh outlier dan sebagainya. Saya berpikir …

2
Regresi dengan variabel independen terbalik
Anggaplah saya memiliki -vektor dari variabel dependen, dan -vektor dari variabel independen. Ketika diplot terhadap , saya melihat bahwa ada hubungan linear (tren naik) di antara keduanya. Sekarang, ini juga berarti bahwa ada tren penurunan linear antara dan .Y N X Y 1NNNYYYNNNXXXYYY YX1X1X\frac{1}{X}YYYXXX Sekarang, jika saya menjalankan regresi: dan …

3
Bagaimana pembobotan data keanekaragaman Komunitas Survei Amerika akan mempengaruhi margin kesalahannya?
Latar belakang: Organisasi saya saat ini membandingkan statistik keanekaragaman tenaga kerjanya (mis.% Orang dengan disabilitas,% wanita,% veteran) dengan total ketersediaan tenaga kerja untuk kelompok-kelompok tersebut berdasarkan American Community Survey (proyek survei oleh US Census Bureau). Ini adalah tolok ukur yang tidak akurat, karena kami memiliki serangkaian pekerjaan yang sangat spesifik …

1
Bagaimana cara saya memasukkan pencilan inovatif pada pengamatan 48 dalam model ARIMA saya?
Saya sedang mengerjakan kumpulan data. Setelah menggunakan beberapa teknik identifikasi model, saya keluar dengan model ARIMA (0,2,1). Saya menggunakan detectIOfungsi dalam paket TSAdalam R untuk mendeteksi outlier inovatif (IO) pada pengamatan ke-48 set data asli saya. Bagaimana cara memasukkan pencilan ini ke dalam model saya sehingga saya dapat menggunakannya untuk …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.