Pertanyaan yang diberi tag «weighted-data»

5
Cara menangani data hierarkis / bersarang dalam pembelajaran mesin
Saya akan menjelaskan masalah saya dengan sebuah contoh. Misalkan Anda ingin memprediksi penghasilan seseorang yang diberikan beberapa atribut: {Usia, Jenis Kelamin, Negara, Wilayah, Kota}. Anda memiliki dataset pelatihan seperti itu train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
Koreksi bias dalam varian tertimbang
Untuk varians tak tertimbang terdapat varians sampel yang dikoreksi bias, ketika rerata diperkirakan dari data yang sama: Var(X):=1Var ( X) : = 1n∑saya( xsaya- μ )2Var(X): =1n∑saya(xsaya-μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var ( X) : = 1n - 1∑saya( xsaya- E[ X] )2Var(X): =1n-1∑saya(xsaya-E[X])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 Saya sedang mencari mean dan varian tertimbang, …

2
Menambahkan bobot pada regresi logistik untuk data yang tidak seimbang
Saya ingin memodelkan regresi logistik dengan data yang tidak seimbang (9: 1). Saya ingin mencoba opsi bobot dalam glmfungsi di R, tapi saya tidak 100% yakin apa fungsinya. Katakanlah variabel output saya c(0,0,0,0,0,0,0,0,0,1). sekarang saya ingin memberi "1" 10 kali lebih berat. jadi saya memberikan argumen bobot weights=c(1,1,1,1,1,1,1,1,1,1,1,10). Ketika saya …

2
Analisis komponen utama tertimbang
Setelah beberapa pencarian, saya menemukan sangat sedikit pada penggabungan bobot pengamatan / kesalahan pengukuran ke dalam analisis komponen utama. Apa yang saya temukan cenderung mengandalkan pendekatan berulang untuk memasukkan bobot (misalnya, di sini ). Pertanyaan saya adalah mengapa pendekatan ini perlu? Mengapa kita tidak bisa menggunakan vektor eigen dari matriks …

1
Varians tertimbang, sekali lagi
Varian tertimbang yang tidak sesuai sudah dibahas di sini dan di tempat lain tetapi tampaknya masih ada sejumlah kebingungan yang mengejutkan. Tampaknya ada konsensus terhadap formula yang disajikan dalam tautan pertama serta di artikel Wikipedia . Ini juga terlihat seperti rumus yang digunakan oleh R, Mathematica, dan GSL (tetapi bukan …

1
Hal seperti korelasi tertimbang?
Saya memiliki beberapa data menarik tentang artis-artis musik paling populer yang dialirkan dibagi berdasarkan lokasi ke sekitar 200 distrik kongres. Saya ingin melihat apakah mungkin untuk polling seseorang pada preferensi musiknya dan menentukan apakah dia "mendengarkan seperti seorang Demokrat" atau "mendengarkan seperti seorang Republikan." (Tentu ini adalah hati yang ringan, …


1
Persamaan yang benar untuk kovarians sampel tidak berat tertimbang
Saya sedang mencari persamaan yang tepat untuk menghitung kovarians sampel yang tidak bias tertimbang. Sumber-sumber internet sangat jarang pada tema ini dan mereka semua menggunakan persamaan yang berbeda. Persamaan yang paling mungkin saya temukan adalah persamaan ini: qjk=∑Ni=1wi(∑Ni=1wi)2−∑Ni=1w2i∑Ni=1wi(xij−x¯j)(xik−x¯k).qjk=∑i=1Nwi(∑i=1Nwi)2−∑i=1Nwi2∑i=1Nwi(xij−x¯j)(xik−x¯k).q_{jk}=\frac{\sum_{i=1}^{N}w_i}{\left(\sum_{i=1}^{N}w_i\right)^2-\sum_{i=1}^{N}w_i^2} \sum_{i=1}^N w_i \left( x_{ij}-\bar{x}_j \right) \left( x_{ik}-\bar{x}_k \right) . Dari: https://en.wikipedia.org/wiki/Sample_mean_and_sample_covariance#Weighted_samples Tentu …

2
Varian rata-rata tertimbang lebih besar dari rata-rata tidak tertimbang
Peninjau buku saya menanyakan alasan mengapa saya menggunakan data tidak tertimbang, alih-alih data tertimbang. Saya telah membahas masalah ini dengan seorang ahli statistik dan tanggapannya sejalan Jika Anda memiliki pengamatan independen dan Anda mengambil rata-rata keseluruhan, variansnya selalu lebih kecil dari varians dari mean tertimbang sebagai estimator. ... Jadi interval …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.