Bagaimana cara menginterpretasikan PCA pada data deret waktu?

Saya mencoba untuk memahami penggunaan PCA dalam artikel jurnal terbaru berjudul "Memetakan aktivitas otak pada skala dengan komputasi cluster" Freeman et al., 2014 (pdf gratis tersedia di situs web lab ). Mereka menggunakan PCA pada data deret waktu, dan menggunakan bobot PCA untuk membuat peta otak.

Data tersebut adalah data pencitraan rata-rata percobaan, disimpan sebagai matriks (disebut di kertas) dengan voxels (atau lokasi pencitraan di otak) titik waktu (panjang satu stimulasi ke otak). $\hat {\mathbf Y}$ $n$ $\times \hat t$

Mereka menggunakan SVD yang menghasilkan ( menunjukkan transpose dari matriks ).

\hat{Y} = {U S V}^{⊤}

$\hat {\mathbf Y} = \mathbf{USV}^\top$

V^{⊤}

$\mathbf V^\top$

V

$\mathbf V$

Penulis menyatakan itu

Komponen utama (kolom ) adalah vektor panjang , dan skor (kolom ) adalah vektor panjang (jumlah voxels), yang menggambarkan proyeksi setiap voxel pada arah diberikan oleh komponen yang sesuai, membentuk proyeksi pada volume, yaitu peta seluruh otak. $\mathbf V$ $\hat t$ $\mathbf U$ $n$

Jadi PC adalah vektor dengan panjang . Bagaimana saya bisa mengartikan bahwa "komponen utama pertama menjelaskan perbedaan paling banyak" seperti yang umumnya dinyatakan dalam tutorial PCA? Kami mulai dengan matriks banyak seri waktu yang sangat berkorelasi - bagaimana seri waktu PC tunggal menjelaskan perbedaan dalam matriks asli? Saya memahami keseluruhan "rotasi awan Gaussian poin ke sumbu paling bervariasi", tetapi saya tidak yakin bagaimana ini berhubungan dengan deret waktu. Apa yang penulis maksudkan dengan arah ketika mereka menyatakan: "skor (kolom ) adalah vektor panjang $\hat t$ $\mathbf U$ $n$ (jumlah voxel), yang menggambarkan proyeksi masing-masing voxel pada arah yang diberikan oleh komponen yang sesuai "? Bagaimana mungkin komponen waktu utama memiliki arah?

Untuk melihat contoh deret waktu yang dihasilkan dari kombinasi linier komponen utama 1 dan 2 dan peta otak yang terkait, buka tautan berikut dan arahkan mouse ke titik-titik dalam plot XY.

Freman et al.

Pertanyaan kedua saya terkait dengan lintasan (ruang-negara) yang mereka buat menggunakan skor komponen utama.

Ini dibuat dengan mengambil 2 skor pertama (dalam kasus contoh "optomotor" yang telah saya uraikan di atas) dan memproyeksikan uji coba individual (digunakan untuk membuat matriks rata-rata uji coba yang dijelaskan di atas) ke dalam subruang utama dengan persamaan:

J = U^{⊤} Y .

$\mathbf J = \mathbf U^\top \mathbf Y.$

Seperti yang dapat Anda lihat dari film-film terkait, setiap jejak di ruang negara mewakili aktivitas otak secara keseluruhan.

Adakah yang bisa memberikan intuisi untuk apa arti "bingkai" film ruang angkasa negara, dibandingkan dengan gambar yang mengaitkan plot XY dari skor 2 PC pertama. Apa artinya pada "bingkai" tertentu untuk 1 percobaan percobaan berada di 1 posisi di ruang-XY dan percobaan lain berada di posisi lain? Bagaimana posisi plot XY dalam film terkait dengan jejak komponen utama dalam gambar tertaut yang disebutkan di bagian pertama pertanyaan saya?

Freeman et al.

— statHacker
sumber

+1 Saya mengedit pertanyaan Anda, lihat bagaimana seseorang dapat memformat persamaan tex di sini. Selain itu, saya tahu makalahnya dengan baik, jadi akan menjawab nanti.

— Amuba mengatakan Reinstate Monica

Ini tidak persis seperti yang diinginkan OP, tetapi mungkin berguna dalam menafsirkan komponen utama ketika diambil dari data deret waktu, karena saya selalu melakukan ini setiap saat. Saya biasanya suka untuk menafsirkan PCA sebagai ekspansi Karhunen-Loeve: mengekspresikan serangkaian waktu tertentu,

(berbeda waktu-seri yang Anda terapkan PCA untuk), sebagai kombinasi linear dari seri berkorelasi waktu (yaitu, komponen utama). Bobot dari setiap deret waktu dalam kasus ini diberikan oleh vektor eigen yang diperoleh dari matriks kovarians.

X_{t}

$X_t$

— Néstor

(Lihat ini untuk penjelasan yang lebih mendalam tentang poin saya: astro.puc.cl/~nespino/files/Ch2_PCA_nespinoza.pdf )

— Néstor

Saya menambahkan beberapa tangkapan layar ke pertanyaan Anda.

— Amoeba berkata Reinstate Monica

bagaimana Anda menambahkan gambar?

— statHacker

Jawaban:

T1: Apa hubungan antara seri waktu PC dan "varian maksimum"?

$\hat t$ $n$ $\hat t$ $n$ $\mathbb R^n$

$1$ $\hat t$ $\mathbb R^n$ $\mathbb R^n$ $\hat t$

Saya setuju dengan interpretasi @ Nestor di atas: setiap fitur asli kemudian dapat dilihat sebagai kombinasi linear dari PC, dan karena PC tidak berkorelasi satu sama lain, orang dapat menganggapnya sebagai fungsi dasar di mana fitur asli diuraikan menjadi. Ini sedikit mirip dengan analisis Fourier, tetapi alih-alih mengambil dasar tetap sinus dan cosinus, kami menemukan dasar "paling tepat" untuk dataset khusus ini, dalam arti bahwa PC pertama-tama menyumbang sebagian besar varian, dll.

"Akuntansi untuk sebagian besar varian" di sini berarti bahwa jika Anda hanya mengambil satu fungsi dasar (seri waktu) dan mencoba memperkirakan semua fitur Anda dengannya, maka PC pertama akan melakukan pekerjaan terbaik. Jadi intuisi dasar di sini adalah bahwa PC pertama adalah fungsi deret waktu yang cocok untuk semua deret waktu yang tersedia, dll.

Mengapa bagian ini dalam Freeman et al. sangat membingungkan?

$\hat{\mathbf Y}$

\hat{Y} = {U S V}^{⊤} .

$\hat {\mathbf Y} = \mathbf{USV}^\top.$

U

$\mathbf U$

R^{n}

$\mathbb R^n$

S V

$\mathbf{SV}$

\hat{t}

$\hat t$

Kalimat yang Anda kutip dari Freeman et al. memang cukup membingungkan:

$\mathbf V$ $\hat t$ $\mathbf U$ $n$

$\mathbf V$ $\mathbf U$ $n$ $\hat t$ $\hat t$ $\mathbf U$

Saya menemukan ini sangat membingungkan dan saya menyarankan untuk mengabaikan pilihan kata-kata mereka, tetapi hanya melihat formula. Dari titik ini saya akan terus menggunakan istilah yang saya suka, bukan bagaimana Freeman et al. gunakan itu.

T2: Apa lintasan ruang negara?

$\mathbf U$ $\hat{\mathbf Y}$ $\hat t$

$\mathbf Y$ $\hat t$

$\mathbf Y$

— amuba kata Reinstate Monica
sumber

Saya mengajukan pertanyaan ini sebagai komentar di bawah, tetapi mungkin @amoeba dapat membantu? Apakah komponen utama bobot vektor hanya seri waktu rata-rata runtuh di semua voxels? Jika itu adalah rata-rata, itu akan menghasilkan skor terkecil agar sesuai dengan jejak data individu. -

— statHacker

Jawaban singkatnya adalah tidak , umumnya bukan deret waktu rata-rata, meskipun dalam banyak kasus bisa sangat dekat. Sebagai contoh, pikirkan kumpulan deret waktu yang semuanya garis lurus dengan kemiringan berbeda (positif dan negatif) semuanya melewati nol. Kemudian deret waktu rata-rata adalah sekitar nol konstan. Tetapi PC pertama akan menjadi garis linier yang kuat. BTW, saya pikir ini adalah pertanyaan yang sangat baik dan jika Anda ingin lebih detail dan / atau angka, silakan tanyakan (lagi) sebagai pertanyaan terpisah. Pastikan untuk tidak menggandakan bagian mana pun dari pertanyaan ini tentang Freeman et al.; buat mereka terpisah.

— Amoeba berkata Reinstate Monica

(atau siapa pun yang tertarik pada respons) - berkenaan dengan Q2, apa yang Anda maksud dengan "memproyeksikan [setiap percobaan] ke dua [PC] pertama". Secara matematis sangat jelas bahwa U adalah vektor dengan panjang n voxels, dan ketika matriks dikalikan dengan panjang n matriks Y, kita mencapai pengurangan dimensionalitas ke 2 PC pertama. Bisakah Anda memberikan intuisi sehubungan dengan U menjadi matriks skor (yaitu jarak masing-masing voxel dari 2 PC pertama). Dapatkah saya menganggap setiap titik waktu J sebagai rata-rata 2-d dari proyeksi setiap posisi voxel dalam plot 2 dimensi dari gambar 1 di atas?

— statHacker

U

$U$

U

$U$

S V

$\mathbf{SV}$

$p$ $\bf V$ $\hat t$

$\bf \hat Y$ $n \times \hat t$ $\bf U$ $n \times n$ $\bf V$ $\hat t \times \hat t$

Sehubungan dengan pertanyaan kedua. Persamaan yang diberikan adalah

$\bf J = \bf U^T Y$

$\bf J$ $\times t$

$t \ne \hat t$ $\bf J$

$\hat t$

Saya belum pernah membahas metodologi pewarnaan sebelumnya, dan perlu beberapa saat sebelum saya percaya diri untuk mengomentari aspek itu. Saya menemukan komentar tentang kesamaan dengan Gambar 4c membingungkan karena pewarnaan diperoleh di sana oleh regresi per-voxel. Sedangkan pada Gambar 6 setiap jejak adalah artefak seluruh gambar. Kecuali jika saya mengatakannya dengan benar saya pikir itu adalah arah dari stimulus selama segmen waktu itu sesuai dengan komentar pada Gambar.

— dugaan
sumber

Gambar pertama di atas mengacu pada percobaan dengan stimulus visual yang sama yang disajikan setiap saat. Ada gambar dan film yang berbeda untuk data tersebut. Gambar kedua di atas mengacu pada percobaan yang berbeda di mana rangsangan adalah rangsangan visual dengan orientasi yang berbeda, jejak pada gambar 2 di atas diwarnai untuk hanya sesuai dengan orientasi rangsangan visual yang berbeda.

— statHacker

Y

$\mathbf Y$

\hat{T}

$\hat {\mathbf T}$

\n

$\n$

V

$\mathbf V$

S

$\mathbf S$

J = U^{⊤} Y .

$\mathbf J = \mathbf U^\top \mathbf Y.$

U

$\mathbf U$

Saya sudah mengatur kembali hal-hal. Permintaan maaf, adalah sisa dari sebelum saya menyelesaikan sesuatu yang lain.

— Dugaan

Terima kasih atas seluruh bantuan Anda. Apakah komponen utama bobot vektor hanya seri waktu rata-rata runtuh di semua voxels? Jika itu adalah rata-rata, itu akan menghasilkan skor terkecil agar sesuai dengan jejak data individu.

— statHacker