Pada posting ini , Anda dapat membaca pernyataan:
Model biasanya diwakili oleh titik pada manifold dimensi terbatas.
Pada Diferensial Geometri dan Statistik oleh Michael K Murray dan John W Rice konsep-konsep ini dijelaskan dalam prosa dapat dibaca bahkan mengabaikan ekspresi matematika. Sayangnya, hanya ada sedikit ilustrasi. Hal yang sama berlaku untuk posting ini di MathOverflow.
Saya ingin meminta bantuan dengan representasi visual untuk dijadikan sebagai peta atau motivasi menuju pemahaman yang lebih formal tentang topik tersebut.
Apa poin di manifold? Kutipan dari pencarian online ini , tampaknya mengindikasikan bahwa itu bisa berupa titik data, atau parameter distribusi:
Statistik pada manifold dan geometri informasi adalah dua cara berbeda di mana geometri diferensial memenuhi statistik. Sementara dalam statistik manifold, itu adalah data yang terletak pada manifold, dalam geometri informasi data berada di , tetapi keluarga parameter dari fungsi kepadatan probabilitas yang diminati diperlakukan sebagai manifold. Manifold semacam itu dikenal sebagai manifold statistik.
Saya telah menggambar diagram ini yang terinspirasi oleh penjelasan ruang singgung di sini :
Kesetaraan (atau salah satu dari kesetaraan yang diterapkan pada statistik) dibahas di sini , dan akan berkaitan dengan kutipan berikut :
LATAR BELAKANG STUFF:
Dari catatan saya percaya konsep-konsep ini tidak langsung berkaitan dengan pengurangan dimensi non-linear dalam ML. Mereka tampak lebih mirip dengan geometri informasi . Berikut ini kutipannya:
Informasi berikut dari Statistik pada Manifol dengan Aplikasi ke Pemodelan Bentuk Deformasi oleh Oren Freifeld :
terletak sepenuhnya di salah satu sisinya. Elemen TpM disebut vektor singgung.
[...] Pada bermacam-macam, model statistik sering dinyatakan dalam ruang singgung.
[...]
Let dan mewakili dua, mungkin tidak diketahui, poin di . Diasumsikan bahwa kedua dataset memenuhi aturan statistik berikut:
[...]
Dengan kata lain, ketika diekspresikan (sebagai vektor garis singgung) di ruang tangen (ke ) di , itu dapat dilihat sebagai satu set sampel iid dari Gaussian mean-nol dengan kovarians . Demikian juga, ketika diekspresikan dalam ruang singgung di dapat dilihat sebagai satu set sampel iid dari Gaussian mean-nol dengan kovarians . Ini menggeneralisasi kasus Euclidean.
Pada referensi yang sama, saya menemukan contoh online terdekat (dan hanya praktis) dari konsep grafis ini yang saya tanyakan:
Apakah ini menunjukkan bahwa data terletak pada permukaan manifold yang dinyatakan sebagai vektor singgung, dan parameter akan dipetakan pada bidang Cartesian?