Pertanyaan yang diberi tag «cross-section»

5
Cara menangani data hierarkis / bersarang dalam pembelajaran mesin
Saya akan menjelaskan masalah saya dengan sebuah contoh. Misalkan Anda ingin memprediksi penghasilan seseorang yang diberikan beberapa atribut: {Usia, Jenis Kelamin, Negara, Wilayah, Kota}. Anda memiliki dataset pelatihan seperti itu train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 


2
Mengapa menggunakan data cross-sectional untuk menyimpulkan / memprediksi perubahan longitudinal adalah Hal yang Buruk?
Saya mencari kertas yang saya harap ada, tetapi tidak tahu apakah itu ada. Ini bisa berupa serangkaian studi kasus, dan / atau argumen dari teori probabilitas, tentang mengapa menggunakan data cross-sectional untuk menyimpulkan / memprediksi perubahan longitudinal mungkin merupakan Hal yang Buruk (yaitu tidak selalu demikian, tetapi dapat dilakukan). Saya …

2
Apakah diperbolehkan menggunakan rata-rata pada dataset untuk meningkatkan korelasi?
Saya memiliki dataset dengan variabel dependen dan independen. Keduanya bukan deret waktu. Saya memiliki 120 pengamatan. Koefisien korelasi adalah 0,43 Setelah perhitungan ini, saya telah menambahkan kolom untuk kedua variabel dengan rata-rata untuk setiap 12 pengamatan, menghasilkan 2 kolom baru dengan 108 pengamatan (pasangan). Koefisien korelasi kolom-kolom ini adalah 0,77 …

1
Jika Anda menjalankan regresi OLS pada data cross sectional, haruskah Anda menguji autokorelasi dalam residu?
Saya memiliki serangkaian pengamatan, tidak tergantung waktu. Saya bertanya-tanya apakah saya harus menjalankan tes autokorelasi? Menurut saya itu tidak masuk akal, karena tidak ada komponen waktu dalam data saya. Namun, saya benar-benar mencoba uji LM korelasi serial, dan ini menunjukkan autokorelasi kuat dari residu. Apakah itu masuk akal? Yang saya …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.