Norma - Apa yang khusus tentang


13

Sebuah L1 norma adalah unik (setidaknya sebagian) karena p=1 adalah pada batas antara non-cembung dan cembung. Sebuah L1 norma adalah 'yang paling jarang' cembung norma (kanan?).

Saya mengerti bahwa p=2 norma Euclidean memiliki akar dalam geometri dan memiliki interpretasi yang jelas ketika dimensi memiliki unit yang sama. Tapi saya tidak mengerti mengapa ini digunakan secara istimewa di atas bilangan real lainnya p>1 : p=1.5 ? p=π ? Mengapa tidak menggunakan rentang kontinu penuh sebagai hyperparameter?

Apa yang saya lewatkan?


1
"Digunakan istimewa" di aplikasi mana, khususnya? Norma ada di mana-mana dalam matematika, statistik, dan fisika; di beberapa subbidang beberapa norma lebih lazim daripada yang lain karena lebih bermakna atau lebih mudah untuk dikerjakan. Karena alasan ini, jawaban atas pertanyaan ini kemungkinan akan banyak dan beragam (sangat beragam, bahkan, secara pribadi saya menemukan ini tidak dapat dijawab). Karena itu saya telah membuat ini "Wiki Komunitas" (CW) pos; tetapi jika Anda memiliki aplikasi tertentu atau bidang sempit dalam pikiran, maka dengan membuat pertanyaan Anda lebih tepat, mungkin untuk menghapus status CW.
whuber

Jawaban:


12

Penjelasan yang lebih matematis adalah bahwa ruang , yang terdiri dari semua seri yang berkumpul di p-norma, hanya Hilbert dengan p = 2 dan tidak ada nilai lain. Ini berarti bahwa ruang ini lengkap dan norma pada ruang itu dapat disebabkan oleh produk dalam (pikirkan produk titik yang dikenal dalam R n ), jadi ini sedikit lebih baik untuk digunakan.lpp=2Rn


4

Berikut adalah beberapa alasan:


  1. 2z2zx22=xxp

  2. x f(x)22=2 f(x)f(x)

2

Meskipun ada banyak alasan lain tetapi AFAIK p = 2 lebih disukai karena alasan berikut:

  • Ukuran kesamaan / perbedaan: Untuk p = 2, norma Euclidean memberikan ukuran kesamaan atau perbedaan antara dua vektor yang selanjutnya dapat digunakan untuk mendapatkan wawasan yang lebih baik tentang data. Jawaban yang lebih terperinci tentang hal ini dapat ditemukan di sini .
  • Regularisasi: Norma L2 digunakan untuk regularisasi dalam pembelajaran mesin dan lebih disukai karena dua alasan - 1) Mudah dibedakan 2) Dengan regularisasi L2, bobot cenderung berkurang secara proporsional dengan bobot. Oleh karena itu regularisasi L2 menghukum bobot yang lebih besar lebih banyak dibandingkan dengan bobot yang lebih kecil.

1

Kesalahan kuadrat dalam model linier sering lebih disukai karena:

  • hubungan dengan ortogonalitas, yang berperilaku baik sehubungan dengan beberapa fenomena acak yang dianggap sebagai kebisingan (tidak berkorelasi)
  • L1
  • itu menghasilkan algoritma optimisasi penurut sebagai turunan berubah menjadi sistem linier

L11p0<p<1

000p1p0p0

1/21/2

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.