Pertanyaan yang diberi tag «data-imputation»

Mengacu pada kelas umum metode yang digunakan untuk "mengisi" data yang hilang. Metode yang digunakan untuk melakukan ini biasanya terkait dengan interpolasi (http://en.wikipedia.org/wiki/Interpolation) dan memerlukan asumsi tentang mengapa data hilang (misalnya "hilang secara acak")

3
Menggabungkan dua seri waktu dengan rata-rata titik data
Saya ingin menggabungkan perkiraan dan backcasted (yaitu nilai-nilai masa lalu yang diprediksi) dari data time-series yang ditetapkan ke dalam satu time-series dengan meminimalkan Mean Squared Prediction Error. Katakanlah saya memiliki deret waktu dari 2001-2010 dengan celah untuk tahun 2007. Saya telah dapat meramalkan 2007 menggunakan data 2001-2007 (garis merah - …


2
Imputasi untuk memperhitungkan kesalahan sistematis dalam respons survei
Saya memiliki survei besar di mana para siswa ditanyai, antara lain, tingkat pendidikan ibu mereka. Beberapa melewatkannya, dan beberapa menjawab dengan salah. Saya tahu ini, karena ada sub-sampel dari ibu responden awal yang kemudian diwawancarai, dan mengajukan pertanyaan yang sama. (Saya yakin ada beberapa, jumlah yang lebih kecil, kesalahan yang …



1
Imputasi variabel yang disensor
Saya memiliki dataset medis dengan sekitar 200 variabel. Salah satu variabel adalah penanda-bio (konsentrasi enzim tertentu). Distribusinya condong ke kanan, dan masalahnya adalah bahwa nilai di atas level tertentu disensor / terputus pada level itu. Jadi, sementara rata-rata variabel sekitar 10, nilai apa pun yang lebih besar dari 50 dicatat …

1
Bagaimana cara kerja imputasi tikus?
Saya bertanya-tanya apakah ada yang punya pengalaman menggunakan fungsi mouse, seperti yang dijelaskan dalam mouse: Imputasi Multivarian oleh Chained Equations di R (JSS 2011 45 (3))? Saya memiliki dataset dengan sejumlah variabel, masing-masing dengan berbagai tingkat data yang hilang. Pertanyaan utama saya adalah: katakanlah saya menggunakan regresi linier Bayesian untuk …

1
Cara menggunakan splines kubik terbatas dengan paket imputasi tikus R
Saya bertanya-tanya bagaimana cara mengintegrasikan splines kubik terbatas (seperti dalam paket rms) dalam model imputasi dalam paket imputasi tikus. Konteks : Saya sedang melakukan penelitian biomedis dan memiliki akses ke dataset yang terdiri dari karakteristik pasien dan data tentang perkembangan penyakit pasien, di samping hasil setelah perawatan medis (misalnya kelangsungan …

3
Bagaimana melakukan SVD untuk memasukkan nilai yang hilang, contoh konkret
Saya telah membaca komentar yang bagus mengenai bagaimana menangani nilai yang hilang sebelum menerapkan SVD, tetapi saya ingin tahu cara kerjanya dengan contoh sederhana: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Mengingat matriks di atas, jika saya …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

2
Bagaimana cara menggabungkan beberapa dataset imputed?
Saya memerlukan satu set data imputed (misalnya untuk membuat dummy grup negara dari data pendapatan per kapita negara imputed). R menawarkan paket paket untuk membuat beberapa data imputasi (misalnya Amelia) dan menggabungkan hasil dari beberapa dataset (seperti dalam MItools). Kekhawatiran saya adalah jika saya dapat rata-rata semua data yang dimasukkan …

2
Imputasi dengan Hutan Acak
Saya punya dua pertanyaan tentang menggunakan hutan acak (khususnya randomForest di R) untuk hilangnya nilai imputasi (dalam ruang prediktor). 1) Bagaimana cara kerja algoritma imputasi - khususnya bagaimana dan mengapa label kelas diperlukan untuk imputasi? Apakah matriks kedekatan yang berfungsi untuk menimbang nilai rata-rata untuk menentukan nilai yang hilang yang …

1
Menggunakan beberapa imputasi untuk bahaya proporsional Cox, lalu validasi dengan paket rms?
Saya telah meneliti paket tikus , dan saya belum menemukan cara untuk menggunakan beberapa imputasi untuk membuat model Cox, kemudian memvalidasi model itu dengan fungsi paket rmsvalidate() . Berikut adalah beberapa contoh kode dari apa yang saya miliki sejauh ini, menggunakan kumpulan data veteran: library(rms) library(survival) library(mice) remove(veteran) data(veteran) veteran$trt=factor(veteran$trt,levels=c(1,2)) …

2
Tarif tidak ada dan imputasi berganda
Apakah ada batas yang paling tidak dapat diterima saat menggunakan multiple imputation (MI)? Sebagai contoh, bisakah saya menggunakan MI jika nilai yang hilang dalam suatu variabel adalah 20% dari kasus sementara dan variabel lain memiliki nilai yang hilang tetapi tidak sampai tingkat yang tinggi?
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.