Ketika kita membaca buku, memahami notasi memainkan peran yang sangat penting dalam memahami konten. Sayangnya, komunitas yang berbeda memiliki konvensi notasi yang berbeda untuk perumusan model dan masalah optimisasi. Bisakah seseorang meringkas beberapa notasi formulasi di sini dan memberikan kemungkinan alasan?
Saya akan memberikan contoh di sini: Dalam literatur aljabar linier, buku klasik adalah pengantar Strang untuk aljabar linier . Notasi yang paling banyak digunakan dalam buku ini adalah
Di mana adalah matriks koefisien , adalah variabel yang harus dipecahkan dan adalah vektor di sisi kanan persamaan . The Alasan buku memilih notasi ini adalah tujuan utama dari aljabar linier memecahkan sistem linear dan mencari tahu apa yang vektor . Mengingat formulasi seperti itu masalah optimasi OLS adalah
Dalam melek statistik atau pembelajaran mesin (dari buku Elemen Pembelajaran Statistik ) orang menggunakan notasi yang berbeda untuk mewakili hal yang sama:
Di mana adalah matriks data , adalah koefisien atau bobot yang harus dipelajari , adalah jawabannya. The alasan orang menggunakan ini karena orang-orang dalam statistik atau komunitas pembelajaran mesin adalah data driven , sehingga data yang dan respon adalah hal yang paling menarik bagi mereka, di mana mereka menggunakan dan untuk mewakili.
Sekarang kita dapat melihat semua kebingungan yang mungkin ada di sana: dalam persamaan pertama sama dengan dalam persamaan kedua. Dan dalam persamaan kedua bukanlah sesuatu yang perlu dipecahkan. Juga untuk istilah: adalah matriks koefisien dalam aljabar linier, tetapi ini adalah data dalam statistik. juga disebut "koefisien".
Selain itu, saya sebutkan bukan apa yang banyak digunakan orang dalam pembelajaran mesin, orang menggunakan versi setengah vektor yang meringkas semua poin data. Seperti
Saya pikir alasan untuk ini adalah bahwa itu baik ketika berbicara tentang penurunan gradien stokastik dan fungsi kerugian yang berbeda lainnya. Juga, notasi matriks ringkas menghilang untuk masalah selain regresi linier.
Notasi matriks untuk regresi logistik
Adakah yang bisa memberikan lebih banyak rangkuman tentang notasi yang melintasi berbagai literatur? Saya berharap jawaban cerdas untuk pertanyaan ini dapat digunakan sebagai referensi yang baik untuk orang yang membaca buku-buku lintas literatur yang berbeda.
tolong jangan dibatasi oleh contoh saya dan . Ada banyak lainnya. Seperti
Mengapa ada dua formulasi / notasi kerugian logistik yang berbeda?