Pertanyaan yang diberi tag «correlation»

Ukuran tingkat hubungan linier di antara sepasang variabel.




4
Intuisi / interpretasi distribusi nilai eigen dari matriks korelasi?
Apa intuisi / interpretasi Anda dari distribusi nilai eigen dari matriks korelasi? Saya cenderung mendengar bahwa biasanya 3 nilai eigen terbesar adalah yang paling penting, sedangkan yang mendekati nol adalah noise. Juga, saya telah melihat beberapa makalah penelitian yang menyelidiki bagaimana distribusi nilai eigen yang terjadi secara alami berbeda dari …

2
ICC sebagai korelasi yang diharapkan antara dua unit yang ditarik secara acak yang berada dalam kelompok yang sama
Dalam pemodelan bertingkat, korelasi intraclass sering dihitung dari efek acak ANOVA ysaya j= γ00+ uj+ esaya jyij=γ00+uj+eij y_{ij} = \gamma_{00} + u_j + e_{ij} di mana kamujuju_j adalah tingkat-2 residual dan esaya jeije_{ij} adalah residual level-1. Kemudian kita mendapatkan σ^2kamuσ^u2\hat{\sigma}_u^2 dan σ 2 e untuk varians dari u j dan …

5
Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?
Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Dapatkah nilai-p untuk uji korelasi Pearson dihitung hanya dari koefisien korelasi dan ukuran sampel?
Latar belakang: Saya membaca satu artikel di mana penulis melaporkan korelasi Pearson 0,754 dari ukuran sampel 878. Menghasilkan nilai p untuk uji korelasi adalah signifikansi "bintang dua" (yaitu p <0,01). Namun, saya berpikir bahwa dengan ukuran sampel yang besar, nilai-p yang sesuai harus kurang dari 0,001 (yaitu tiga bintang signifikan). …

3
Apakah korelasi atau koefisien determinasi berhubungan dengan persentase nilai yang termasuk dalam garis regresi?
Korelasi, , adalah ukuran hubungan linier antara dua variabel. Koefisien determinasi, , adalah ukuran seberapa besar variabilitas dalam satu variabel dapat "dijelaskan oleh" variasi yang lain.r 2rrrr2r2r^2 Misalnya, jika adalah korelasi antara dua variabel, maka . Oleh karena itu, 64% dari variabilitas dalam satu dapat dijelaskan oleh perbedaan yang lain. …


1
Mengapa menggunakan variabel yang dicatat?
Mungkin, ini adalah pertanyaan yang sangat mendasar tetapi saya sepertinya tidak dapat menemukan jawaban yang kuat untuk itu. Saya harap di sini, saya bisa. Saat ini saya membaca makalah sebagai persiapan untuk tesis master saya sendiri. Saat ini, saya sedang membaca sebuah makalah yang meneliti hubungan antara tweet dan fitur …

1
Mengapa kuadrat
Ini mungkin pertanyaan dasar, tapi saya bertanya-tanya mengapa nilai dalam model regresi dapat dikuadratkan untuk memberikan gambaran varian yang dijelaskan?RRR Saya mengerti bahwa koefisien dapat memberikan kekuatan suatu hubungan, tetapi saya tidak mengerti bagaimana hanya mengkuadratkan nilai ini memberikan ukuran perbedaan yang dijelaskan.RRR Adakah penjelasan mudah tentang ini? Terima kasih …

2
Berkaitan dengan jangka waktu volume
Perhatikan grafik berikut: Garis merah (sumbu kiri) menggambarkan volume perdagangan saham tertentu. Garis biru (sumbu kanan) menjelaskan volume pesan twitter untuk stok itu. Misalnya, pada 9 Mei (05-09) sekitar 1.100 juta perdagangan dan 4.000 tweet dibuat. Saya ingin menghitung apakah ada korelasi antara jangka waktu, baik pada hari yang sama …

2
Nilai korelasi palsu yang diharapkan
Kami menarik sampel , masing-masing ukuran , secara independen dari distribusi Normal .n ( μ , σ 2 )NNNnnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) Dari sampel kami kemudian memilih 2 sampel yang memiliki korelasi Pearson tertinggi (absolut) satu sama lain.NNN Berapa nilai yang diharapkan dari korelasi ini? Terima kasih [PS Ini bukan pekerjaan rumah]


4
Pearson korelasi set data dengan mungkin nol standar deviasi?
Saya mengalami masalah menghitung koefisien korelasi pearson dari kumpulan data dengan kemungkinan nol standar deviasi (yaitu semua data memiliki nilai yang sama). Misalkan saya memiliki dua set data berikut: float x[] = {2, 2, 2, 3, 2}; float y[] = {2, 2, 2, 2, 2}; Koefisien korelasi "r", akan dihitung …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.