Embeddings distorsi rata-rata


11

Pertimbangkan dua ruang metrik dan , dan embedding . Penyematan ruang metrik tradisional mengukur kualitas sebagai rasio terburuk dari asli ke jarak final: (X,d)(Y,f)μ:XYμ

ρ=maxp,qX{d(x,y)f(μ(x),μ(y)),f(μ(x),μ(y))d(x,y)}

Ada beberapa ukuran kualitas lainnya: Dhamdhere dkk mempelajari distorsi "rata-rata":

σ=d(x,y)f(μ(x),μ(y)).

Namun, ukuran saya tertarik di sini adalah yang digunakan oleh metode seperti MDS, yang melihat rata-rata kesalahan aditif :

ε2=|d(x,y)f(μ(x),μ(y))|2

Meskipun metode MDS seperti dipelajari secara luas di luar komunitas theoryCS, saya menyadari hanya satu makalah ( oleh Dhamdhere et al ) yang meneliti optimasi di bawah ukuran ini, dan itu juga untuk masalah terbatas menanamkan ke garis ( Y=R ) (catatan: tesis MS 2005 Tasos Sidiropoulos memiliki ulasan yang bagus tentang pekerjaan sebelumnya)

Adakah pekerjaan baru yang diketahui orang tentang analisis kualitas yang ketat di bawah gagasan kesalahan ini? Sementara masalah-masalah ini umumnya NP-keras, apa yang saya lebih tertarik adalah perkiraan apa pun.

Jawaban:


3

Ini pertanyaan yang bagus. Saya tidak tahu tentang algoritma aproksimasi, tetapi hasil kekerasan yang diketahui untuk mendekati distorsi minimum (dan masalah terkait seperti pelabelan metrik) juga harus menunjukkan bahwa sulit diperkirakan.ϵ2

Alasannya adalah bahwa mereka memberikan pengurangan dari masalah NP-hard sehingga dalam kasus YA distorsi adalah dan dalam kasus TIDAK distorsi adalah untuk setidaknya sebagian kecil konstan dari tepi. Oleh karena itu, dalam kasus YA akan menjadi faktor lebih kecil daripada dalam kasus TIDAK. Untuk detailnya, lihat misalnya makalahnya oleh Khot-Saket: www.cs.cmu.edu/~rsaket/pubs/approx.pdfO(1)Ω(k)ϵ2k

Saya tidak yakin faktor kekerasan mana yang mengikuti dari makalah mereka, tetapi seharusnya tidak sulit untuk mencari tahu. (Saya kira setidaknya faktor yang Anda dapatkan untuk pelabelan metrik harus diikuti.)logc(n)


itu saran yang bagus. Saya pasti akan melihat ke dalam pekerjaan pelabelan metrik. Diketahui bahwa bahkan menyematkan MAX SNP-keras, tetapi akan menarik (meskipun mengecewakan) untuk melihat hasil yang lebih kuat.
Suresh Venkat

2

Saya mungkin melewatkan sesuatu, tetapi mengapa ? Kami tertarik dengan perkiraan secara additif, jadi kami tidak dapat membuat skala untuk membuat untuk semua , kan?ϵ2(ρ1)d(x,y)2f(μ(x),μ(y))d(x,y)x,y

Satu keuntungan di sini adalah bahwa kita dapat melakukan hal buruk dalam jangka pendek dan akhirnya baik-baik saja. Juga, apakah masalahnya mudah (untuk perkiraan, bahkan) jika, katakanlah kita ingin menanamkan ke ? (bisakah kita menulis program matematika untuk menangkap pertanyaan?)2


Poin bagus. Saya mengubah jawaban saya.
Moritz

itu tergantung pada formulasi. Jika Anda mengajukan masalah sebagai meminimalkan untuk subruang target dimensi-tetap, maka batasan peringkat menyebabkan beberapa masalah. Jika Anda menggunakan formulasi "JL-style" (yaitu memperbaiki kesalahan dan menemukan dimensi yang tepat), maka sesuatu mungkin bisa dilakukan. ϵ
Suresh Venkat

Kuantitas yang mungkin berguna untuk "bersaing dengan" adalah . Pertimbangkan masalah penyematan ke (saya sarankan sebelumnya, tetapi memiliki sqrt yang berantakan). Kita harus dengan jelas bertujuan untuk memperoleh embeddings yang memiliki menjadi (dalam arti yang kabur, ini berarti kita aktif secara multiplikatif untuk sebagian besar . Bisakah kita mendapatkan embedding seperti itu untuk, katakanlah (const degree) ekspander? (atau buktikan tidak mungkin?)S:=d(x,y)212ϵ2o(S)(1+o(1))x,y
aditya
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.