Pertanyaan yang diberi tag «pca»

Principal component analysis (PCA) adalah teknik reduksi dimensi linear. Ini mengurangi dataset multivariat ke set yang lebih kecil dari variabel yang dibangun menjaga informasi sebanyak mungkin (sebanyak varians) mungkin. Variabel-variabel ini, yang disebut komponen utama, adalah kombinasi linear dari variabel input.

1
Pertanyaan tentang PCA: kapan PC independen? mengapa PCA sensitif terhadap penskalaan? mengapa PC dibatasi menjadi orthogonal?
Saya mencoba memahami beberapa deskripsi PCA (dua yang pertama dari Wikipedia), penekanan ditambahkan: Komponen utama dijamin independen hanya jika kumpulan data terdistribusi secara normal . Apakah independensi komponen utama sangat penting? Bagaimana saya bisa mengerti deskripsi ini? PCA sensitif terhadap skala relatif dari variabel asli. Apa artinya 'penskalaan' di sana? …

3
Kapan Anda akan menggunakan PCA daripada LDA dalam klasifikasi?
Saya membaca artikel ini tentang perbedaan antara Analisis Komponen Utama dan Analisis Diskriminan Berganda (Analisis Diskriminan Linier), dan saya mencoba memahami mengapa Anda akan menggunakan PCA daripada MDA / LDA. Penjelasannya dirangkum sebagai berikut: secara kasar berbicara dalam PCA kami mencoba untuk menemukan sumbu dengan varian maksimum di mana data …

1
Bagaimana cara mendapatkan "nilai eigen" (persentase dari varian yang dijelaskan) dari vektor yang bukan vektor eigen PCA?
Saya ingin memahami bagaimana saya bisa mendapatkan persentase varians dari kumpulan data, bukan di ruang koordinat yang disediakan oleh PCA, tetapi terhadap serangkaian vektor (rotasi) yang sedikit berbeda. set.seed(1234) xx <- rnorm(1000) yy <- xx * 0.5 + rnorm(1000, sd = 0.6) vecs <- cbind(xx, yy) plot(vecs, xlim = c(-4, …



1
Apa yang dimaksud dengan PCA hanya mempertahankan jarak berpasangan yang besar?
Saat ini saya membaca tentang teknik visualisasi t-SNE dan disebutkan bahwa salah satu kelemahan menggunakan analisis komponen utama (PCA) untuk memvisualisasikan data dimensi tinggi adalah bahwa ia hanya mempertahankan jarak berpasangan yang besar antara titik-titik. Makna titik-titik yang berjauhan dalam ruang dimensi tinggi juga akan tampak berjauhan dalam subruang dimensi …

1
Apakah PCA skala besar bahkan mungkin?
Cara klasik analisis komponen utama '(PCA) adalah untuk melakukannya pada input data matriks yang kolom memiliki rata-rata nol (maka PCA dapat "memaksimalkan varians"). Ini dapat dicapai dengan mudah dengan memusatkan kolom. Namun, ketika matriks input jarang, matriks tengah sekarang akan lebih jarang, dan - jika matriks sangat besar - dengan …

1
Mengapa semua komponen PLS bersama-sama hanya menjelaskan sebagian dari varian data asli?
Saya memiliki dataset yang terdiri dari 10 variabel. Saya menjalankan partial least square (PLS) untuk memprediksi variabel respon tunggal oleh 10 variabel ini, mengekstraksi 10 komponen PLS, dan kemudian menghitung varians dari masing-masing komponen. Pada data asli saya mengambil jumlah varians dari semua variabel yaitu 702. Kemudian saya membagi varian …


2
Menerapkan PCA untuk menguji data untuk tujuan klasifikasi
Saya baru-baru ini belajar tentang PCA yang luar biasa dan saya telah melakukan contoh yang diuraikan dalam dokumentasi scikit-learn . Saya tertarik untuk mengetahui bagaimana saya bisa menerapkan PCA ke titik data baru untuk tujuan klasifikasi. Setelah memvisualisasikan PCA dalam bidang 2 dimensi (sumbu x, y), saya melihat bahwa saya …

1
Bingung tentang penjelasan visual vektor eigen: bagaimana set data yang berbeda secara visual dapat memiliki vektor eigen yang sama?
Banyak buku teks statistik memberikan ilustrasi intuitif tentang apa vektor eigen dari matriks kovarians: Vektor u dan z membentuk vektor eigen (well, eigenaxes). Ini masuk akal. Tetapi satu hal yang membingungkan saya adalah bahwa kita mengekstrak vektor eigen dari matriks korelasi , bukan data mentah. Lebih lanjut, dataset mentah yang …

2
Apa metrik yang baik untuk menilai kualitas kecocokan PCA, untuk memilih jumlah komponen?
Apa metrik yang baik untuk menilai kualitas analisis komponen utama (PCA)? Saya melakukan algoritma ini pada dataset. Tujuan saya adalah mengurangi jumlah fitur (informasinya sangat berlebihan). Saya tahu persentase varians yang disimpan adalah indikator yang baik tentang seberapa banyak informasi yang kami simpan, apakah ada metrik informasi lain yang dapat …


1
Bagaimana menafsirkan biplot PCA ini yang berasal dari survei di bidang apa yang diminati orang?
Latar belakang: Saya bertanya kepada ratusan peserta dalam survei saya berapa banyak mereka tertarik pada bidang-bidang tertentu (dengan lima poin skala Likert dengan 1 menunjukkan "tidak tertarik" dan 5 menunjukkan "tertarik"). Lalu saya mencoba PCA. Gambar di bawah ini adalah proyeksi ke dalam dua komponen utama pertama. Warna digunakan untuk …

3
Memilih sejumlah komponen utama untuk dipertahankan
Salah satu metode yang disarankan kepada saya adalah dengan melihat plot scree dan memeriksa "siku" untuk menentukan jumlah PC yang tepat untuk digunakan. Tetapi jika plotnya tidak jelas, apakah R memiliki perhitungan untuk menentukan angka? fit <- princomp(mydata, cor=TRUE)
10 r  pca 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.