Statistik dan Big Data correlation

2

Kapan LASSO memilih prediktor yang berkorelasi?

Saya menggunakan paket 'lars' dalam R dengan kode berikut: > library(lars) > set.seed(3) > n <- 1000 > x1 <- rnorm(n) > x2 <- x1+rnorm(n)*0.5 > x3 <- rnorm(n) > x4 <- rnorm(n) > x5 <- rexp(n) > y <- 5*x1 + 4*x2 + 2*x3 + 7*x4 + rnorm(n) > …

13 correlation feature-selection lasso regularization ridge-regression

1

Bagaimana cara menghitung interval kepercayaan untuk korelasi peringkat Spearman?

Wikipedia memiliki transformasi Fisher dari korelasi peringkat Spearman ke perkiraan skor-z. Mungkin skor-z adalah perbedaan dari hipotesis nol (korelasi peringkat 0)? Halaman ini memiliki contoh berikut: 4, 10, 3, 1, 9, 2, 6, 7, 8, 5 5, 8, 6, 2, 10, 3, 9, 4, 7, 1 rank correlation 0.684848 "95% …

13 correlation spearman-rho

6

Paket R untuk mengidentifikasi hubungan antar variabel [ditutup]

Tutup. Pertanyaan ini di luar topik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Cross Validated. Ditutup 4 tahun yang lalu . Apakah ada paket R yang bisa saya gunakan untuk mengeksplorasi apakah ada hubungan antar variabel? Biasanya ketika saya mencari pola …

13 r data-visualization correlation eda

4

Intuisi / interpretasi distribusi nilai eigen dari matriks korelasi?

Apa intuisi / interpretasi Anda dari distribusi nilai eigen dari matriks korelasi? Saya cenderung mendengar bahwa biasanya 3 nilai eigen terbesar adalah yang paling penting, sedangkan yang mendekati nol adalah noise. Juga, saya telah melihat beberapa makalah penelitian yang menyelidiki bagaimana distribusi nilai eigen yang terjadi secara alami berbeda dari …

13 distributions correlation

2

ICC sebagai korelasi yang diharapkan antara dua unit yang ditarik secara acak yang berada dalam kelompok yang sama

Dalam pemodelan bertingkat, korelasi intraclass sering dihitung dari efek acak ANOVA ysaya j= γ00+ uj+ esaya jyij=γ00+uj+eij y_{ij} = \gamma_{00} + u_j + e_{ij} di mana kamujuju_j adalah tingkat-2 residual dan esaya jeije_{ij} adalah residual level-1. Kemudian kita mendapatkan σ^2kamuσ^u2\hat{\sigma}_u^2 dan σ 2 e untuk varians dari u j dan …

12 correlation mixed-model intraclass-correlation

5

Bagaimana cara melakukan imputasi nilai dalam jumlah poin data yang sangat besar?

Saya memiliki dataset yang sangat besar dan sekitar 5% nilai acak hilang. Variabel-variabel ini berkorelasi satu sama lain. Contoh berikut dataset R hanyalah contoh mainan dengan data berkorelasi dummy. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

Dapatkah nilai-p untuk uji korelasi Pearson dihitung hanya dari koefisien korelasi dan ukuran sampel?

Latar belakang: Saya membaca satu artikel di mana penulis melaporkan korelasi Pearson 0,754 dari ukuran sampel 878. Menghasilkan nilai p untuk uji korelasi adalah signifikansi "bintang dua" (yaitu p <0,01). Namun, saya berpikir bahwa dengan ukuran sampel yang besar, nilai-p yang sesuai harus kurang dari 0,001 (yaitu tiga bintang signifikan). …

12 hypothesis-testing correlation p-value fraud

3

Apakah korelasi atau koefisien determinasi berhubungan dengan persentase nilai yang termasuk dalam garis regresi?

Korelasi, , adalah ukuran hubungan linier antara dua variabel. Koefisien determinasi, , adalah ukuran seberapa besar variabilitas dalam satu variabel dapat "dijelaskan oleh" variasi yang lain.r 2rrrr2r2r^2 Misalnya, jika adalah korelasi antara dua variabel, maka . Oleh karena itu, 64% dari variabilitas dalam satu dapat dijelaskan oleh perbedaan yang lain. …

12 regression correlation r-squared

2

Korelasi positif dan tanda koefisien regresi negatif

Apakah mungkin untuk mendapatkan korelasi positif antara seorang regressor dan sebuah respon ( +0,43) dan, setelah itu, memperoleh koefisien negatif dalam model regresi yang sesuai untuk regressor ini? Saya tidak berbicara tentang perubahan tanda regressor di antara beberapa model. Tanda koefisien selalu tetap. Bisakah variabel yang tersisa dari model yang …

12 correlation multiple-regression regression-coefficients

1

Mengapa menggunakan variabel yang dicatat?

Mungkin, ini adalah pertanyaan yang sangat mendasar tetapi saya sepertinya tidak dapat menemukan jawaban yang kuat untuk itu. Saya harap di sini, saya bisa. Saat ini saya membaca makalah sebagai persiapan untuk tesis master saya sendiri. Saat ini, saya sedang membaca sebuah makalah yang meneliti hubungan antara tweet dan fitur …

12 correlation data-transformation logarithm

1

Mengapa kuadrat

Ini mungkin pertanyaan dasar, tapi saya bertanya-tanya mengapa nilai dalam model regresi dapat dikuadratkan untuk memberikan gambaran varian yang dijelaskan?RRR Saya mengerti bahwa koefisien dapat memberikan kekuatan suatu hubungan, tetapi saya tidak mengerti bagaimana hanya mengkuadratkan nilai ini memberikan ukuran perbedaan yang dijelaskan.RRR Adakah penjelasan mudah tentang ini? Terima kasih …

12 regression correlation r-squared

2

Berkaitan dengan jangka waktu volume

Perhatikan grafik berikut: Garis merah (sumbu kiri) menggambarkan volume perdagangan saham tertentu. Garis biru (sumbu kanan) menjelaskan volume pesan twitter untuk stok itu. Misalnya, pada 9 Mei (05-09) sekitar 1.100 juta perdagangan dan 4.000 tweet dibuat. Saya ingin menghitung apakah ada korelasi antara jangka waktu, baik pada hari yang sama …

12 time-series correlation lags

2

Nilai korelasi palsu yang diharapkan

Kami menarik sampel , masing-masing ukuran , secara independen dari distribusi Normal .n ( μ , σ 2 )NNNnnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) Dari sampel kami kemudian memilih 2 sampel yang memiliki korelasi Pearson tertinggi (absolut) satu sama lain.NNN Berapa nilai yang diharapkan dari korelasi ini? Terima kasih [PS Ini bukan pekerjaan rumah]

12 correlation normal-distribution expected-value maximum

1

Apa urutan korelasinya?

Apa yang diungkapkan oleh istilah zeroth-, pertama, kedua, ketiga, dll. Urutan korelasi? Terima kasih!

12 correlation

4

Pearson korelasi set data dengan mungkin nol standar deviasi?

Saya mengalami masalah menghitung koefisien korelasi pearson dari kumpulan data dengan kemungkinan nol standar deviasi (yaitu semua data memiliki nilai yang sama). Misalkan saya memiliki dua set data berikut: float x[] = {2, 2, 2, 3, 2}; float y[] = {2, 2, 2, 2, 2}; Koefisien korelasi "r", akan dihitung …

12 correlation

Pertanyaan yang diberi tag «correlation»