Bukti bahwa multiplikasi matriks dapat dilakukan dalam waktu kuadratik?


59

Secara luas diduga bahwa , eksponen optimal untuk perkalian matriks, sebenarnya sama dengan 2. Pertanyaan saya sederhana:ω

Apa alasan yang kita miliki untuk meyakini bahwa ?ω=2

Saya mengetahui algoritma cepat seperti Coppersmith-Winograd, tapi saya tidak tahu mengapa ini dianggap bukti untuk .ω=2

Secara naif, menurut saya seperti contoh klasik di mana sebuah komunitas hanya berharap bahwa hasilnya benar-benar murni untuk alasan estetika. Saya ingin tahu apakah pada dasarnya itulah yang terjadi di sini.


12
Saya menduga jawabannya sebagian besar adalah estetika, dan kurangnya alasan yang baik untuk menjadi lebih besar dari 2. Ada sebuah makalah di FOCS '05 yang memberikan beberapa konstruksi teori kelompok untuk matriks mult yang cocok dengan eksponen yang dikenal saat ini dan juga memberi 2 kelompok dugaan teori yang menyiratkan . PDFω=2
Mark Reitblatt

5
Beberapa tahun yang lalu, saya berbicara dengan Strassen di mana dia mengatakan dia percaya . Saya tidak yakin apa alasannya. ω>2
Ryan Williams

2
@Ryan, semoga Strassen membaca cstheory.stackexchange. :)
Steve Flammia

3
Ada batas bawah (di bawah beberapa batasan) karena Ran Raz, jadi dugaan yang lebih baik adalah bahwa ω = 2 tidak tercapai (tapi infimumnya memang 2 ). Ω(nlogn)ω=22
Yuval Filmus

5
@Yuval, @Steve: 1) biasanya didefinisikan sebagai batas. 2) Kita sudah tahu bahwa apa pun ω itu, itu tidak tercapai (itu adalah inf dan bukan min). Lihat makalah Coppersmith-Winograd ini: dx.doi.org/10.1137/0211038 . Dari abstrak: "eksponen untuk perkalian matriks adalah titik batas, yaitu, tidak dapat diwujudkan dengan algoritma tunggal." (Mengingat perincian hasil mereka, saya pikir pernyataan ini tidak bisa diterima secara naif pada nilai nominalnya, tetapi ini sebagian besar merupakan masalah teknis.)ωω
Joshua Grochow

Jawaban:


20

Saya ingin menambahkan komentar Mark Reitblatt dan jawaban Amir Shpilka. Pertama, salah satu dugaan yang diajukan oleh Cohn, Kleinberg, Szegedy, dan Umans bukan teori kelompok tetapi murni kombinatorial (Konj. 3.4 dalam makalah FOCS '05 mereka ). Dugaan ini mengatakan bahwa "kapasitas USP yang kuat adalah "Coppersmith dan Winograd, dalam menunjukkan algoritma terbaik mereka saat ini untuk perkalian matriks, menunjukkan bahwa kapasitas USP adalah nomor yang sama ini3322/3 (meskipun mereka tidak frase itu cukup dengan cara ini). Meskipun ada perbedaan antara USP yang kuat dan USP, ini adalah beberapa bukti bahwa dugaan mereka setidaknya masuk akal.322/3

(Untuk dugaan 4.7 mereka yang lain, yang merupakan teori kelompok, saya tidak tahu adanya bukti yang masuk akal yang serupa, di luar sekadar intuisi.)

Kedua, saya setuju dengan Amir Shpilka bahwa rangkaian algoritma masa lalu memiliki nuansa ad-hoc. Namun, salah satu hal yang menyenangkan tentang pendekatan kelompok-teori adalah bahwa hampir semua (tidak semua) dari algoritma sebelumnya dapat diungkapkan dalam pendekatan ini. Meskipun berbagai konstruksi teori-kelompok dalam [CKSU] mungkin tampak sedikit ad-hoc di luar, dalam konteks kerangka teori-kelompok mereka terlihat secara signifikan lebih alami dan lebih sedikit ad-hoc (setidaknya bagi saya) daripada banyak dari algoritma sebelumnya.


Ketika saya berpikir tentang Kapasitas, saya berpikir tentang set dan klik independen. Apa kamus antara USP dan konstruksi eksplisit dari grafik yang mendasarinya dan apakah ada struktur untuk grafik ini?
T ....


20

ω=2

ABnnC=ABC(i,j)=k=1nA(i,k)B(k,j)ABnC=ABC(i)=k=1nA(k)B(ik)O~(n)O(n2)O~(n2)algoritma waktu untuk perkalian matriks. Pertanyaannya adalah: apa analog dari transformasi Fourier yang dapat membantu untuk perkalian matriks?


-1

O(n2log(n2))ω=2


1
ωcO(nc)O(n2log10n)2Ω(n2logn)

@SashoNikolov Terima kasih telah menunjukkan itu. Adakah yang pernah mencoba melatih jaring saraf untuk boolean matmul A * B = C? [Entri A, entri B, entri C] -> Bool (kalikan benar atau salah). Ingin tahu sirkuit apa yang layak / dropout gradien datang dengan; jika sirkuit terlatih memiliki penarik dekat dekomposisi prima. Pada 3x3, 4x4, 5x5, 6x6 sepertinya satu jam GPU akan memberikan beberapa hasil menarik.
Chad Brewbaker
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.