Pertanyaan yang diberi tag «pca»

Principal component analysis (PCA) adalah teknik reduksi dimensi linear. Ini mengurangi dataset multivariat ke set yang lebih kecil dari variabel yang dibangun menjaga informasi sebanyak mungkin (sebanyak varians) mungkin. Variabel-variabel ini, yang disebut komponen utama, adalah kombinasi linear dari variabel input.

3
Apakah optimasi PCA cembung?
Fungsi objektif dari Principal Component Analysis (PCA) adalah meminimalkan kesalahan rekonstruksi dalam norma L2 (lihat bagian 2.12 di sini . Pandangan lain sedang mencoba untuk memaksimalkan varians pada proyeksi. Kami juga memiliki posting yang sangat baik di sini: Apa fungsi tujuan PCA ? ). Pertanyaan saya adalah apakah optimasi PCA …



4
Pemilihan model PCA menggunakan AIC (atau BIC)
Saya ingin menggunakan Akaike Information Criterion (AIC) untuk memilih jumlah faktor yang tepat untuk diekstraksi dalam PCA. Satu-satunya masalah adalah saya tidak yakin bagaimana menentukan jumlah parameter. Pertimbangkan matriks , di mana mewakili jumlah variabel dan jumlah pengamatan, sehingga . Karena matriks kovarians simetris, maka estimasi kemungkinan maksimum dapat menetapkan …

2
PCA dan hutan acak
Untuk kompetisi Kaggle baru-baru ini, saya (secara manual) mendefinisikan 10 fitur tambahan untuk set pelatihan saya, yang kemudian akan digunakan untuk melatih classifier hutan acak. Saya memutuskan untuk menjalankan PCA pada dataset dengan fitur-fitur baru, untuk melihat bagaimana mereka dibandingkan satu sama lain. Saya menemukan bahwa ~ 98% varians dibawa …

5
Bisakah saya menggunakan PCA untuk melakukan pemilihan variabel untuk analisis klaster?
Saya harus mengurangi jumlah variabel untuk melakukan analisis cluster. Variabel saya sangat berkorelasi, jadi saya berpikir untuk melakukan Analisis Faktor PCA (analisis komponen utama). Namun, jika saya menggunakan skor yang dihasilkan, cluster saya tidak terlalu benar (dibandingkan dengan klasifikasi sebelumnya dalam literatur). Pertanyaan: Dapatkah saya menggunakan matriks rotasi untuk memilih …

2
Apa yang memaksimalkan faktor
Dalam analisis komponen utama, komponen utama adalah arah orthogonal dengan varians maksimum. Dengan kata lain, komponen utama pertama dipilih untuk menjadi arah varians maksimum, komponen utama kedua dipilih untuk menjadi arah ortogonal ke yang pertama dengan varian maksimum, dan seterusnya.kkkkkkk Apakah ada interpretasi yang serupa untuk Analisis Faktor? Sebagai contoh, …


1
Perbedaan antara implementasi scikit-learn PCA dan TruncatedSVD
Saya memahami hubungan antara Analisis Komponen Utama dan Dekomposisi Nilai Singular pada tingkat aljabar / eksak. Pertanyaan saya adalah tentang implementasi scikit-learning . Dokumentasi mengatakan: " [TruncatedSVD] sangat mirip dengan PCA, tetapi beroperasi pada vektor sampel secara langsung, bukan pada matriks kovarians. ", Yang akan mencerminkan perbedaan aljabar antara kedua …
12 pca  scikit-learn  svd  scipy 


4
Melakukan PCA dengan hanya matriks jarak
Saya ingin mengelompokkan dataset besar yang saya hanya memiliki jarak berpasangan. Saya menerapkan algoritma k-medoid, tetapi butuh waktu terlalu lama untuk dijalankan sehingga saya ingin memulai dengan mengurangi dimensi masalah saya dengan menerapkan PCA. Namun, satu-satunya cara saya tahu untuk melakukan metode ini adalah dengan menggunakan matriks kovarians yang tidak …

2
Apakah solusi PCA unik?
Ketika saya menjalankan PCA pada set data tertentu, apakah solusi yang diberikan kepada saya unik? Yaitu, saya mendapatkan satu set koordinat 2d, berdasarkan jarak interpoint. Apakah mungkin untuk menemukan setidaknya satu pengaturan poin lagi yang akan memenuhi kendala ini? Jika jawabannya ya, bagaimana saya bisa menemukan solusi yang berbeda?
12 pca 

4
Bagaimana cara melakukan PCA untuk data berdimensi sangat tinggi?
Untuk melakukan analisis komponen utama (PCA), Anda harus mengurangi rata-rata setiap kolom dari data, menghitung matriks koefisien korelasi dan kemudian menemukan vektor eigen dan nilai eigen. Yah, lebih tepatnya, inilah yang saya lakukan untuk mengimplementasikannya dengan Python, kecuali hanya bekerja dengan matriks kecil karena metode untuk menemukan matriks koefisien korelasi …
12 pca  python 

3
Arti “kesalahan rekonstruksi” dalam PCA dan LDA
Saya menerapkan PCA, LDA, dan Naif Bayes, masing-masing untuk kompresi dan klasifikasi (menerapkan LDA untuk kompresi dan klasifikasi). Saya memiliki kode yang ditulis dan semuanya berfungsi. Apa yang perlu saya ketahui, untuk laporan ini, adalah apa definisi umum kesalahan rekonstruksi . Saya dapat menemukan banyak matematika, dan menggunakannya dalam literatur …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.