Pertanyaan yang diberi tag «pca»

Principal component analysis (PCA) adalah teknik reduksi dimensi linear. Ini mengurangi dataset multivariat ke set yang lebih kecil dari variabel yang dibangun menjaga informasi sebanyak mungkin (sebanyak varians) mungkin. Variabel-variabel ini, yang disebut komponen utama, adalah kombinasi linear dari variabel input.

2
Mengapa jumlah varians yang dijelaskan oleh PC 1 saya sangat dekat dengan korelasi berpasangan rata-rata?
Apa hubungan antara komponen utama pertama dan korelasi rata-rata dalam matriks korelasi? Sebagai contoh, dalam aplikasi empiris saya mengamati bahwa korelasi rata-rata hampir sama dengan rasio varians dari komponen utama pertama (nilai eigen pertama) dengan total varians (jumlah semua nilai eigen). Apakah ada hubungan matematis? Di bawah ini adalah bagan …

1
Bagaimana cara membandingkan acara yang diamati dengan yang diharapkan?
Misalkan saya punya satu sampel frekuensi dari 4 peristiwa yang mungkin: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 dan saya memiliki probabilitas yang diharapkan dari peristiwa saya terjadi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dengan jumlah frekuensi yang diamati …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
Kapan memilih PCA vs. LSA / LSI
Pertanyaan: Apakah ada pedoman umum sehubungan dengan karakteristik data input, yang dapat digunakan untuk memutuskan antara menerapkan PCA versus LSA / LSI? Ringkasan singkat PCA vs LSA / LSI: Principal Component Analysis (PCA) dan Latent Semantic Analysis (LSA) atau Latent Semantic Indexing (LSI) serupa dalam arti bahwa semuanya bergantung secara …

1
Bagaimana menafsirkan hasil reduksi dimensi / penskalaan multidimensi?
Saya melakukan dekomposisi SVD dan penskalaan multidimensi dari matriks data 6 dimensi, untuk mendapatkan pemahaman yang lebih baik tentang struktur data. Sayangnya, semua nilai singular memiliki urutan yang sama, menyiratkan bahwa dimensi data memang 6.. Namun, saya ingin dapat menafsirkan nilai-nilai vektor singular. Misalnya, yang pertama tampaknya kurang lebih sama …

2
Bagaimana menemukan hubungan antara berbagai jenis acara (ditentukan oleh lokasi 2D-nya)?
Saya memiliki dataset peristiwa yang terjadi selama periode waktu yang sama. Setiap acara memiliki tipe (ada beberapa tipe berbeda, kurang dari sepuluh) dan lokasi, direpresentasikan sebagai titik 2D. Saya ingin memeriksa apakah ada korelasi antara jenis peristiwa, atau antara jenis dan lokasi. Misalnya, mungkin peristiwa tipe A biasanya tidak terjadi …

2
Apakah mungkin menggunakan kernel PCA untuk pemilihan fitur?
Apakah mungkin untuk menggunakan analisis komponen utama kernel (kPCA) untuk Latent Semantic Indexing (LSI) dengan cara yang sama seperti PCA digunakan? Saya melakukan LSI dalam R menggunakan prcompfungsi PCA dan mengekstrak fitur dengan memuat tertinggi dari komponen pertama . Dengan itu saya mendapatkan fitur yang menggambarkan komponen terbaik.kkk Saya mencoba …

3
Pada penggunaan rotasi miring setelah PCA
Beberapa paket statistik, seperti SAS, SPSS, dan R, memungkinkan Anda untuk melakukan semacam rotasi faktor setelah PCA. Mengapa rotasi diperlukan setelah PCA? Mengapa Anda menerapkan rotasi miring setelah PCA mengingat bahwa tujuan PCA adalah untuk menghasilkan dimensi ortogonal?

2
Visualisasi banyak "histogram" (diagram batang)
Saya mengalami kesulitan untuk memilih cara yang tepat untuk memvisualisasikan data. Katakanlah kita memiliki toko buku yang menjual buku , dan setiap buku memiliki setidaknya satu kategori . Untuk toko buku, jika kami menghitung semua kategori buku, kami memperoleh histogram yang menunjukkan jumlah buku yang termasuk dalam kategori tertentu untuk …

2
SVD dari matriks data setelah proyeksi ortogonal ke subruang
Katakanlah saya dapat mengetahui SVD dari beberapa matriks : X = USV ^ TXXXX=USVTX=USVTX = USV^T Jika saya memiliki matriks ortogonal AAA (yaitu, AAA adalah persegi dan memiliki kolom ortonormal), maka SVD XAXAXA adalah XA=USWTXA=USWTXA = USW^T mana W=ATVW=ATVW = A^TV . Tetapi dapatkah dikatakan tentang SVD XBXBXB jika BBB …

1
Melakukan CCA vs membangun variabel dependen dengan PCA dan kemudian melakukan regresi
Diberi dua dataset multidimensi, XXX dan YYY, beberapa orang melakukan analisis multivariabel dengan membangun variabel dependen pengganti menggunakan analisis komponen utama (PCA). Yaitu, jalankan PCAYYY atur, ambil skor di sepanjang komponen pertama y′y′y', dan jalankan regresi berganda untuk skor tersebut di XXX: y′=βX+ϵy′=βX+ϵy' = \beta X+\epsilon. (Saya mendasarkan pertanyaan saya …

3
Apakah klasifikasi berbasis Neural Networks perlu pengurangan dimensi?
Saya menggunakan classifier berbasis Neural Networks untuk menjalankan klasifikasi untuk data saya dalam n-dimensional. Lalu saya pikir itu mungkin ide yang baik untuk menjalankan pengurangan dimensi seperti PCA untuk data saya pada awalnya, dan kemudian memasukkan hasil PCA ke dalam classifier (saya menyimpan 3 PC). Namun, klasifikasi pada fitur pengurangan …

3
Bagaimana cara menggunakan komponen utama sebagai prediktor dalam GLM?
Bagaimana saya menggunakan output dari analisis komponen utama (PCA) dalam model linier umum (GLM), dengan asumsi PCA digunakan untuk pemilihan variabel untuk GLM? Klarifikasi: Saya ingin menggunakan PCA untuk menghindari penggunaan variabel yang berhubungan dalam GLM. Namun, PCA memberi saya output seperti .2*variable1+.5*variable3dll. Saya terbiasa menempatkan variabel 1 dan 3 …




Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.