Pertanyaan yang diberi tag «missing-data»

Ketika data menunjukkan kurangnya informasi (kesenjangan), yaitu, tidak lengkap. Karenanya, penting untuk mempertimbangkan fitur ini saat melakukan analisis atau pengujian.

1
Nilai yang hilang dalam variabel respons dalam JAGS
Gelman & Hill (2006) mengatakan: Dalam Bug, hasil yang hilang dalam regresi dapat ditangani dengan mudah hanya dengan memasukkan vektor data, NA, dan semuanya. Bug secara eksplisit memodelkan variabel hasil, dan oleh karena itu sepele untuk menggunakan model ini untuk, dalam pengaruh, menghitung nilai yang hilang pada setiap iterasi. Ini …


2
Skema pembobotan alternatif untuk meta analisis efek acak: tidak ada standar deviasi
Saya sedang mengerjakan meta-analisis efek acak yang mencakup sejumlah studi yang tidak melaporkan penyimpangan standar; semua penelitian melaporkan ukuran sampel. Saya tidak percaya mungkin untuk memperkirakan atau menyalahkan data SD yang hilang. Bagaimana seharusnya meta-analisis yang menggunakan perbedaan rata-rata mentah (tidak standar) sebagai ukuran efek ditimbang ketika standar deviasi tidak …

2
Memasukkan variabel penjelas yang lebih rinci dari waktu ke waktu
Saya mencoba memahami bagaimana cara terbaik saya memodelkan variabel di mana seiring waktu saya mendapatkan prediktor yang semakin rinci. Misalnya, pertimbangkan untuk memodelkan tingkat pemulihan pada pinjaman yang gagal bayar. Misalkan kita memiliki dataset dengan data 20 tahun, dan dalam 15 tahun pertama kita hanya tahu apakah pinjaman tersebut dijamin …

1
Prediksi dengan randomForest (R) ketika beberapa input memiliki nilai yang hilang (NA)
Saya memiliki randomForestmodel klasifikasi yang baik yang ingin saya gunakan dalam aplikasi yang memprediksi kelas kasus baru. Kasing baru memiliki nilai yang pasti hilang. Prediksi tidak akan berfungsi seperti itu untuk NAS. Bagaimana saya harus melakukan ini? data(iris) # create first the new case with missing values na.row<-45 na.col<-c(3,5) case.na<-iris[na.row,] …

1
Bagaimana cara membandingkan acara yang diamati dengan yang diharapkan?
Misalkan saya punya satu sampel frekuensi dari 4 peristiwa yang mungkin: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 dan saya memiliki probabilitas yang diharapkan dari peristiwa saya terjadi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dengan jumlah frekuensi yang diamati …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
Regresi berganda dengan variabel prediktor yang hilang
Misalkan kita diberi satu set data formulir dan . Kami diberi tugas untuk memprediksi berdasarkan nilai . Kami memperkirakan dua regresi di mana: ( y , x 1 , x 2 , ⋯ , x n - 1 ) y x y(y,x1,x2,⋯,xn)(y,x1,x2,⋯,xn)(y,x_{1},x_{2},\cdots, x_{n})(y,x1,x2,⋯,xn−1)(y,x1,x2,⋯,xn−1)(y,x_{1},x_{2},\cdots, x_{n-1})yyyxxxyy=f1(x1,⋯,xn−1,xn)=f2(x1,⋯,xn−1)(1)(2)(1)y=f1(x1,⋯,xn−1,xn)(2)y=f2(x1,⋯,xn−1) \begin{align} y &=f_{1}(x_{1},\cdots, x_{n-1}, x_{n}) \tag{1} …

4
Bagaimana cara mengatasi kesenjangan / NaN dalam data deret waktu ketika menggunakan Matlab untuk autokorelasi dan jaringan saraf?
Saya memiliki serangkaian pengukuran waktu (seri ketinggian-satu dimensi). Pada periode pengamatan, proses pengukuran turun untuk beberapa titik waktu. Jadi data yang dihasilkan adalah vektor dengan NaNs di mana ada kesenjangan dalam data. Menggunakan MATLAB, ini menyebabkan saya masalah ketika menghitung autokorelasi ( autocorr) dan menerapkan jaringan saraf ( nnstart). Bagaimana …

3
Memperlakukan level 'Tidak tahu / Menolak' dari variabel kategori
Saya memodelkan Prediksi Diabetes menggunakan Regresi Logistik. Dataset yang digunakan adalah Sistem Pengawasan Faktor Risiko Perilaku (BRFSS) dari Center for Disease Control (CDC). Salah satu variabel independen adalah Tekanan Darah Tinggi. Ini adalah kategori dengan level berikut 'Ya', 'Tidak', 'Tidak tahu / Ditolak'. Haruskah saya menghapus baris dengan 'Tidak tahu …



3
Kapan sebaiknya menggunakan rata-rata untuk imputasi?
Misalkan kita memiliki tes kumpulan data : 1 8 12 14 . . 19 The . Menandakan hilang nilai-nilai. Kapan akan lebih baik menggunakan rata-rata dari nilai yang tidak hilang untuk menentukan nilai yang hilang daripada mengasumsikan bahwa data tersebut berasal dari distribusi normal?


2
Apakah saya tetap bisa meninggalkan pengamatan yang hilang?
Saya memiliki dataset yang melihat aplikasi imigrasi dan penerimaan visa (pemberian visa). Tarif dihitung untuk aplikasi visa yang "diterima" dan "ditolak". Namun, dataset juga memiliki nilai untuk kasus yang ditutup. Biasanya ini adalah ketika imigran berhenti muncul untuk janji, bermigrasi ke tempat lain, atau meninggal. Karena angka-angka ini tidak digunakan …

1
Dalam analisis skor kecenderungan, apa saja pilihan untuk menghadapi kecenderungan sangat kecil atau besar?
\newcommand{\P}{\mathbb{P}} Saya prihatin dengan data pengamatan di mana tugas perawatan dapat dijelaskan dengan sangat baik. Misalnya, regresi logistik P (A=1 | X) = ( 1 + exp( - ( Xβ) ))- 1P(SEBUAH=1|X)=(1+exp⁡(-(Xβ)))-1\P(A =1 |X) = (1+ \exp(-(X\beta)))^{-1} wehre tugas perawatan dan kovariat sangat cocok dengan tes sangat tinggi atau bahkan …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.