Sambil belajar menghitung kovarian dan matriks korelasi dan inversinya dalam VB dan T-SQL beberapa tahun yang lalu, saya belajar bahwa berbagai entri memiliki sifat menarik yang dapat membuatnya berguna dalam skenario penambangan data yang tepat. Salah satu contoh yang jelas adalah adanya varian pada diagonal matriks kovarians; beberapa contoh yang kurang jelas yang belum saya gunakan, tetapi bisa berguna di beberapa titik, adalah varians faktor inflasi dalam matriks korelasi terbalik dan korelasi parsial dalam matriks kovarians terbalik.
Satu hal yang belum saya lihat secara langsung dibahas dalam literatur, bagaimanapun, adalah bagaimana menafsirkan faktor-faktor penentu dari matriks ini. Karena faktor penentu sering dihitung untuk jenis matriks lainnya, saya berharap menemukan banyak informasi tentangnya, tetapi saya hanya sedikit sekali muncul dalam pencarian biasa di forum StackExchange dan seluruh Internet. Sebagian besar penyebutan yang saya temui berputar di sekitar menggunakan determinan sebagai langkah tunggal dalam proses menghitung tes statistik dan algoritma lainnya, seperti Analisis Komponen Komponen (PCA) dan salah satu tes Hotelling; tidak ada yang secara langsung membahas bagaimana menafsirkan penentu ini, sendiri. Apakah ada alasan praktis mengapa mereka tidak sering dibahas dalam literatur tentang data mining? Lebih penting, apakah mereka memberikan informasi yang berguna dengan cara yang berdiri sendiri dan jika demikian, bagaimana saya bisa menginterpretasikan masing-masing faktor penentu? Saya menyadari bahwa determinan adalah jenis volume yang ditandatangani yang diinduksi oleh transformasi linier, jadi saya curiga bahwa determinan-determinan dari determinan-determinan khusus ini mungkin menandakan semacam ukuran volumetrik kovarians atau korelasi dll. Pada seluruh rangkaian, atau sesuatu yang berpengaruh ( sebagai lawan dari kovarians dan korelasi biasa, yang berada di antara dua atribut atau variabel). Itu juga menimbulkan pertanyaan tentang volume apa yang akan diwakili oleh invers mereka. Saya tidak cukup akrab dengan topik atau matematika matriks berat yang terlibat untuk berspekulasi lebih lanjut, tetapi saya mampu mengkodekan keempat jenis matriks dan penentu mereka. Pertanyaan saya tidak mendesak, tetapi dalam jangka panjang saya harus membuat keputusan apakah perlu memasukkan matriks-matriks ini dan faktor-faktor penentu mereka secara teratur dalam proses penambangan data eksplorasi saya atau tidak. Lebih murah untuk hanya menghitung kovarians dan korelasi dalam satu-satu, cara bivariat dalam bahasa-bahasa khusus ini, tetapi saya akan bekerja lebih keras dan menerapkan perhitungan penentu jika saya dapat memperoleh beberapa wawasan yang lebih dalam yang membenarkan biaya dalam hal sumber daya pemrograman. Terima kasih sebelumnya. Saya akan bekerja lebih keras dan menerapkan perhitungan penentu jika saya bisa mendapatkan beberapa wawasan yang lebih dalam yang membenarkan biaya dalam hal sumber daya pemrograman. Terima kasih sebelumnya. Saya akan bekerja lebih keras dan menerapkan perhitungan penentu jika saya bisa mendapatkan beberapa wawasan yang lebih dalam yang membenarkan biaya dalam hal sumber daya pemrograman. Terima kasih sebelumnya.