Intuisi / interpretasi distribusi nilai eigen dari matriks korelasi?


13

Apa intuisi / interpretasi Anda dari distribusi nilai eigen dari matriks korelasi? Saya cenderung mendengar bahwa biasanya 3 nilai eigen terbesar adalah yang paling penting, sedangkan yang mendekati nol adalah noise. Juga, saya telah melihat beberapa makalah penelitian yang menyelidiki bagaimana distribusi nilai eigen yang terjadi secara alami berbeda dari yang dihitung dari matriks korelasi acak (sekali lagi, membedakan suara dari sinyal).

Silahkan menguraikan wawasan Anda.


Apakah Anda memikirkan aplikasi tertentu, yaitu apakah Anda mencari saran umum tentang berapa EV yang perlu kita pertimbangkan selain dari aplikasi apa pun (yaitu pada sisi matematika murni) atau haruskah itu berlaku untuk konteks tertentu (misalnya analisis faktor, PCA, dll.)?
chl

Saya lebih tertarik pada sisi matematika, yaitu nilai eigen sebagai properti dari data yang mendasari matriks korelasi. Jika masuk akal untuk membahas hal ini dalam konteks tertentu, jangan ragu untuk melakukannya juga.
Eduardas

Jawaban:


4

Saya cenderung mendengar bahwa biasanya 3 nilai eigen terbesar adalah yang paling penting, sedangkan yang mendekati nol adalah noise

Anda dapat menguji untuk itu. Lihat makalah yang tertaut dalam posting ini untuk detail lebih lanjut. Sekali lagi jika Anda berurusan dengan seri waktu keuangan, Anda mungkin ingin mengoreksi leptokurtisitas terlebih dahulu (yaitu pertimbangkan serangkaian pengembalian yang disesuaikan dengan garch, bukan pengembalian mentah).

Saya telah melihat beberapa makalah penelitian yang menyelidiki bagaimana distribusi nilai eigen yang terjadi secara alami berbeda dari yang dihitung dari matriks korelasi acak (sekali lagi, membedakan suara dari sinyal).

Edward:> Biasanya, orang akan melakukannya dengan cara lain: lihat distribusi multivariat dari nilai eigen (dari matriks korelasi) yang berasal dari aplikasi yang Anda inginkan. Setelah Anda mengidentifikasi kandidat yang kredibel untuk distribusi nilai eigen, seharusnya cukup mudah untuk menghasilkannya.

Prosedur terbaik tentang cara mengidentifikasi distribusi multivariat dari nilai eigen Anda bergantung pada berapa banyak aset yang ingin Anda pertimbangkan secara bersamaan (yaitu apa dimensi dari matriks korelasi Anda). Ada trik yang rapi jika ( p menjadi jumlah aset).p10p

Edit (komentar oleh Shabbychef)

prosedur empat langkah:

  1. Misalkan Anda memiliki sub sampel data multivarian. Anda memerlukan estimator dari matriks varians-kovarian ˜ C j untuk setiap sub-sampel j (Anda dapat menggunakan estimator klasik atau alternatif yang kuat seperti MCD cepat , yang diterapkan dengan baik di matlab, SAS, S, R ,. ..) Seperti biasa, jika Anda berurusan dengan seri waktu keuangan Anda ingin mempertimbangkan serangkaian pengembalian yang disesuaikan dengan garch, bukan pengembalian mentah.j=1,...,JC~jj
  2. jΛ~j= log(λ~1j)log(λ~pj)C~j
  3. CV(Λ~)J×pΛ~j
  4. CV(Λ~)wiCV(Λ~)wi=γii=1pγiγi

J2


1
Saya ingin tahu: apa masalahnya?
shabbychef

C~

λ1

Ini adalah prosedur yang sangat aneh; apakah sudah diterbitkan di suatu tempat?
shabbychef

@ Shabbychev:> tidak, tetapi saya memiliki kesempatan untuk bekerja pada masalah terkait (tidak hanya melibatkan satu rangkaian waktu) beberapa waktu lalu (masalah yang sama seperti yang ini stats.stackexchange.com/questions/2572/… )
user603

11

Nilai eigen memberikan besaran komponen utama penyebaran data.



(3001)π/4


2

k

Biasanya portofolio eigen pertama hampir sama bobotnya di setiap nama, yang berarti portofolio 'pasar' yang terdiri dari semua aset dengan bobot dolar yang sama. Portofolio eigen kedua mungkin memiliki makna semantik, tergantung pada periode waktu yang Anda lihat: misalnya sebagian besar stok energi, atau stok bank, dll. Dalam pengalaman saya, Anda akan sulit sekali membuat cerita dari portofolio eigen kelima atau lebih, dan ini tergantung pada beberapa bagian seleksi alam semesta dan periode waktu yang dipertimbangkan. Ini baik-baik saja karena biasanya nilai eigen kelima atau lebih tidak terlalu jauh melampaui batas yang ditentukan oleh distribusi Marchenko-Pastur.


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.