Masalah keputusan vs masalah "nyata" yang tidak ya-atau-tidak

Saya membaca di banyak tempat bahwa beberapa masalah sulit untuk diperkirakan ( sulit untuk memperkirakannya ). Tetapi pendekatan bukanlah masalah keputusan: jawabannya adalah bilangan real dan bukan Ya atau Tidak. Juga untuk setiap faktor perkiraan yang diinginkan, ada banyak jawaban yang benar dan banyak yang salah, dan ini berubah dengan faktor perkiraan yang diinginkan!

Jadi bagaimana orang bisa mengatakan bahwa masalah ini NP-hard?

(Terinspirasi oleh peluru kedua di Seberapa sulit menghitung jumlah jalur sederhana antara dua node dalam grafik terarah? )

— Ran G.
sumber

Seperti yang Anda katakan, tidak ada keputusan untuk dibuat, sehingga kelas kompleksitas baru dan jenis pengurangan baru diperlukan untuk sampai pada definisi NP-hardness yang tepat untuk masalah optimisasi .

Salah satu cara untuk melakukan ini adalah memiliki dua kelas baru NPO dan PO yang berisi masalah optimasi dan mereka tentu saja meniru kelas NP dan P untuk masalah keputusan. Pengurangan baru juga dibutuhkan. Kemudian kita dapat membuat ulang versi NP-hardness untuk masalah optimasi di sepanjang garis yang berhasil untuk masalah keputusan. Tetapi pertama-tama kita harus setuju apa masalah optimasi .

Definisi: Misalkan $O=(X,L,f,opt)$ menjadi optimasi-masalah . $X$ adalah himpunan input atau instance yang cocok dikodekan sebagai string. $L$ adalah fungsi yang memetakan setiap instance $x\in X$ ke serangkaian string, solusi yang layak dari instance $x$ . Ini adalah himpunan karena ada banyak solusi untuk masalah optimasi. Jadi kita haven sebuah fungsi objektif $f$ yang memberitahu kita untuk setiap pasangan $(x, y)$ $y\in L(x)$ contoh dan solusibiayaataunilainya. $opt$ memberitahu kita apakah kita memaksimalkan atau meminimalkan.

Ini memungkinkan kita untuk menentukan apa solusi optimal : Biarkan $y_{opt}\in L(x)$ menjadi solusi optimal dari instance $x\in X$ dari masalah optimasi $O=(X,L,f,opt)$ dengan

f (x, y_{o p t}) = o p t {f (x, y^{'}) ∣ y^{'} \in L (x)} .

$f(x,y_{opt})=opt\{f(x,y')\mid y'\in L(x)\}.$ Solusi optimal sering dilambangkan dengan

y^{*}

$y^*$ .

Sekarang kita dapat mendefinisikan kelas NPO : Misalkan $NPO$ adalah himpunan semua masalah optimasi $O=(X,L,f,opt)$ dengan:

$X\in P$
Ada polinomial $p$ dengan $|y|\le p(|x|)$ untuk semua instance $x\in X$ dan semua solusi yang layak $y\in L(x)$ . Selanjutnya ada algoritma deterministik yang memutuskan dalam waktu polinomial apakah $y\in L(x)$ .
$f$ dapat dievaluasi dalam waktu polinomial.

Intuisi di baliknya adalah:

Kami dapat memverifikasi secara efisien jika $x$ sebenarnya adalah contoh valid dari masalah optimasi kami.
Ukuran solusi yang layak dibatasi secara polinomi dalam ukuran input, dan kita dapat memverifikasi secara efisien jika $y\in L(x)$ adalah solusi fesible dari instance $x$ .
Nilai solusi $y\in L(x)$ dapat ditentukan secara efisien.

Ini mencerminkan bagaimana $NP$ didefinisikan, sekarang untuk PO : Misalkan $PO$ adalah himpunan semua masalah dari $NPO$ yang dapat diselesaikan dengan algoritma deterministik dalam waktu polinomial.

Sekarang kita dapat mendefinisikan apa yang ingin kita sebut pendekatan-algoritma : Sebuah pendekatan-algoritma dari optimasi-masalah adalah sebuah algoritma yang menghitung solusi yang layak untuk sebuah contoh . $O=(X,L,f,opt)$ $y\in L(x)$ $x\in X$

Catatan: Bahwa kami tidak meminta solusi optimal, kami hanya memiliki apa yang layak .

Sekarang kita memiliki dua jenis kesalahan: Kesalahan absolut dari solusi yang layak dari instance dari optimasi-masalah adalah . $y\in L(x)$ $x\in X$ $O=(X,L,f,opt)$ $|f(x,y)-f(x,y^*)|$

Kami menyebut kesalahan absolut dari algoritme aproksimasi untuk masalah optimasi dibatasi oleh jika algoritma menghitung untuk setiap instance solusi yang layak dengan kesalahan absolut yang dibatasi oleh . $A$ $O$ $k$ $A$ $x\in X$ $k$

Contoh: Menurut Teorema Vizing yang indeks kromatik dari grafik (jumlah warna di tepi mewarnai dengan jumlah paling sedikit warna yang digunakan) adalah salah atau , di mana adalah derajat maksimal simpul. Dari pembuktian teorema, suatu algoritma-aproksimasi dapat dirancang yang menghitung pewarnaan tepi dengan warna. Oleh karena itu kami memiliki algoritma-aproksimasi untuk $\Delta$ $\Delta+1$ $\Delta$ $\Delta+1$ -Masalah di mana kesalahan absolut dibatasi oleh . $\mathsf{Minimum-EdgeColoring}$ $1$

Contoh ini merupakan pengecualian, kesalahan absolut kecil jarang terjadi, jadi kami mendefinisikan kesalahan relatif dari aproksimasi-algoritma pada contoh dari masalah optimasi dengan untuk semua dan menjadi $\epsilon_A(x)$ $A$ $x$ $O=(X,L,f,opt)$ $f(x,y)>0$ $x\in X$ $y\in L(x)$

ϵ_{A} (x) := {\begin{cases} 0 & f (x, A (x)) = f (x, y^{*}) \\ \frac{| f (x, A (x)) - f (x, y^{*}) |}{max {f (x, A (x)), f (x, y^{*})}} & f (x, A (x)) \neq f (x, y^{*}) \end{cases}

$\epsilon_A(x):=\begin{cases}0&f(x,A(x))=f(x,y^*)\\\frac{|f(x,A(x))-f(x,y^*)|}{\max\{f(x,A(x)),f(x,y^*)\}}&f(x,A(x))\ne f(x,y^*)\end{cases}$

di mana adalah solusi yang layak dihitung dengan pendekatan-algoritma . $A(x)=y\in L(x)$ $A$

Kita sekarang dapat menentukan pendekatan-algoritma untuk optimasi-masalah menjadi -approximation-algoritma untuk jika kesalahan relatif dibatasi oleh untuk setiap instance , dengan demikian $A$ $O=(X,L,f,opt)$ $\delta$ $O$ $\epsilon_A(x)$ $\delta\ge 0$ $x\in X$

ϵ_{A} (x) \leq δ \forall x \in X .

$\epsilon_A(x)\le \delta\qquad \forall x\in X.$

Pilihan dalam penyebut definisi kesalahan relatif dipilih untuk membuat definisi simetris untuk memaksimalkan dan meminimalkan. Nilai kesalahan relatif . Dalam hal masalah pemaksimalan, nilai solusi tidak pernah kurang dari $\max\{f(x,A(x)),f(x,y^*)\}$ $\epsilon_A(x)\in[0,1]$ dan tidak pernah lebih besar dari untuk masalah meminimalkan. $(1-\epsilon_A(x))\cdot f(x,y^*)$ $1/(1-\epsilon_A(x))\cdot f(x,y^*)$

Sekarang kita dapat memanggil masalah optimasi -dapat diperkirakan jika ada -aproksimasi-algoritma untuk yang berjalan dalam waktu polinomial. $\delta$ $\delta$ $A$ $O$

Kami tidak ingin melihat kesalahan untuk setiap instance , kami hanya melihat pada kasus terburuk. Jadi kita mendefinisikan , kesalahan relativ maksimal aproksimasi-algoritma untuk optimisasi-masalah menjadi $x$ $\epsilon_A(n)$ $A$ $O$

ϵ_{A} (n) = sup {ϵ_{A} (x) ∣ | x | \leq n} .

$\epsilon_A(n)=\sup\{\epsilon_A(x)\mid |x|\le n\}.$

Dimana harus menjadi ukuran instance. $|x|$

Contoh: Pencocokan maksimal dalam grafik dapat ditransformasikan menjadi penutup simpul minimal dengan menambahkan semua simpul insiden dari pencocokan ke penutup simpul. Jadi ujung-ujungnya tertutup. Karena setiap penutup vertex termasuk optimal seseorang harus memiliki salah satu node dari setiap tepi tertutup, jika tidak maka dapat ditingkatkan, kami memiliki . Oleh karena itu $C$ $1/2\cdot |C|$ $1/2\cdot |C|\cdot f(x,y^*)$ Jadi algoritma serakah untuk pencocokan maksimal adalah-approximatio-algoritma untuk. Oleh karena ituadalah-approximable.

\frac{| C | - f (x, y^{*})}{| C |} \leq \frac{1}{2}

$\frac{|C|-f(x,y^*)}{|C|}\le\frac{1}{2}$

1 / 2

$1/2$

M i n i m a l - V e r t e x C o v e r

$\mathsf{Minimal-VertexCover}$

M i n i m a l - V e r t e x C o v e r

$\mathsf{Minimal-VertexCover}$

1 / 2

$1/2$

Sayangnya kesalahan relatif tidak selalu merupakan gagasan kualitas terbaik untuk perkiraan seperti contoh berikut ini menunjukkan:

Contoh: Algoritma serakah yang sederhana dapat mendekati . Analisis menunjukkan bahwa $\mathsf{Minimum-SetCover}$ dan dengan demikianakan menjadi

\frac{| C |}{| C^{*} |} \leq H_{n} \leq 1 + \ln (n)

$\frac{|C|}{|C^*|}\le H_n\le 1+\ln(n)$

M i n i m u m - S e t C o v e r

$\mathsf{Minimum-SetCover}$

-dapat diperkirakan.

\frac{\ln (n)}{1 + \ln (n)}

$\frac{\ln(n)}{1+\ln(n)}$

Jika kesalahan relatif mendekati , definisi berikut ini menguntungkan. $1$

Mari menjadi optimasi-masalah dengan untuk semua dan dan sebuah pendekatan-algoritma untuk . The pendekatan-rasio dari solusi yang layak $O=(X,L,f,opt)$ $f(x, y)>0$ $x\in X$ $y\in L(x)$ $A$ $O$ $r_A(x)$ dari instance adalah $A(x)=y\in L(x)$ $x\in X$

r_{A} (x) = {\begin{cases} 1 & f (x, A (x)) = f (x, y^{*}) \\ max {\frac{f (x, A (x))}{f (x, y^{*})}, \frac{f (x, y^{*})}{f (x, A (x))}} & f (x, A (x)) \neq f (x, y^{*}) \end{cases}

$r_A(x)=\begin{cases}1&f(x,A(x))=f(x,y^*)\\\max\left\{ \frac{f(x,A(x))}{f(x, y^*)},\frac{f(x, y^*)}{f(x, A(x))}\right\}&f(x,A(x))\ne f(x,y^*)\end{cases}$

Seperti sebelumnya kita sebut perkiraan-algoritma sebuah -approximation-algoritma untuk optimasi-masalah jika pendekatan-rasio dibatasi oleh untuk setiap masukan . Dan lagi-lagi jika kita memiliki -approximation-algoritma untuk optimasi-masalah maka disebut -approximable $A$ $r$ $O$ $r_A(x)$ $r\ge1$ $x\in X$

r_{A} (x) \leq r

$r_A(x)\le r$

r

$r$

A

$A$

O

$O$

O

$O$ $r$ . Sekali lagi kami hanya peduli pada kasus terburuk dan mendefinisikan aproksimasi-rasio maksimal

menjadi

Dengan demikian, aproksimasi-rasio lebih besar dari

untuk solusi suboptimal. Dengan demikian solusi yang lebih baik memiliki rasio yang lebih kecil. Untuk

r_{A} (n)

$r_A(n)$

r_{A} (n) = sup {r_{A} (x) ∣ | x | \leq n} .

$r_A(n)=\sup\{r_A(x)\mid |x|\le n\}.$

1

$1$

kita sekarang dapat menulis bahwa itu adalah

-approximable. Dan dalam kasus

kita tahu dari contoh sebelumnya bahwa itu

diperkirakan. Antara kesalahan relatif dan aproksimasi-rasio kami memiliki hubungan sederhana:

M i n i m u m - S e t C o v e r

$\mathsf{Minimum-SetCover}$

(1 + \ln (n))

$(1+\ln(n))$

M i n i m u m - V e r t e x C o v e r

$\mathsf{Minimum-VertexCover}$

2

$2$

r_{A} (x) = \frac{1}{1 - ϵ_{A} (x)} ϵ_{A} (x) = 1 - \frac{1}{r_{A} (x)} .

$r_A(x)=\frac{1}{1-\epsilon_A(x)}\qquad \epsilon_A(x)=1-\frac{1}{r_A(x)}.$

Untuk penyimpangan kecil dari optimal dan kesalahan relatif menguntungkan atas pendekatan-rasio, yang menunjukkan kekuatan untuk penyimpangan besar dan . $\epsilon<1/2$ $r<2$ $\epsilon\ge 1/2$ $r\ge 2$

Dua versi -approximable tidak tumpang tindih karena satu versi selalu dan yang lainnya . Kasus tidak bermasalah karena ini hanya dicapai oleh algoritma yang menghasilkan solusi yang tepat dan akibatnya tidak perlu diperlakukan sebagai algoritma perkiraan. $\alpha$ $\alpha\le 1$ $\alpha\ge 1$ $\alpha=1$

Kelas lain sering muncul APX . Hal ini mendefinisikan sebagai himpunan semua optimasi-masalah dari yang haven sebuah -approximation-algoritma dengan yang berjalan dalam waktu polinomial. $O$ $NPO$ $r$ $r\ge1$

Kita hampir lewat. Kami ingin menyalin ide sukses reduksi dan kelengkapan dari teori kompleksitas. Pengamatan adalah bahwa banyak varian keputusan sulit dari optimasi-masalah dapat direduksi satu sama lain sementara varian optimasi mereka memiliki sifat yang berbeda mengenai perkiraannya. Hal ini disebabkan oleh pengurangan waktu polinomial-Karp yang digunakan dalam pengurangan kelengkapan NP, yang tidak mempertahankan fungsi objektif. Dan bahkan jika fungsi objektif dipertahankan, pengurangan waktu polinomial-Karp dapat mengubah kualitas solusi.

Yang kita butuhkan adalah versi reduksi yang lebih kuat, yang tidak hanya memetakan instance dari optimasi-masalah ke instance , tetapi juga solusi yang baik dari kembali ke solusi yang baik dari . $O_1$ $O_2$ $O_2$ $O_1$

Oleh karena itu kita mendefinisikan pendekatan-melestarikan-pengurangan selama dua optimasi-masalah dan dari . Kami menyebutnya direduksi menjadi $O_1=(X_1,L_1,f_1,opt_1)$ $O_2=(X_2,L_2,f_2,opt_2)$ $NPO$ $O_1$ $AP$ $O_2$ , ditulis sebagai , jika ada dua fungsi dan dan konstanta dengan: $O_1\le_{AP} O_2$ $g$ $h$ $c$

untuk semua dan rasional $g(x_1, r)\in X_2$ $x_1\in X_1$ $r>1$
jika untuk semua dan rasional $L_2(g(x, r_1))\ne\emptyset$ $L_1(x_1)\ne\emptyset$ $x_1\in X_1$ $r>1$
untuk semua dan rasional dan untuk semua $h(x_1, y_2, r)\in L_1(x_1)$ $x_1\in X_1$ $r>1$ $y_2\in L_2(g(x_1,r))$
Untuk tetap, kedua fungsi dan dapat dihitung dengan dua algoritma dalam waktu polinomial dalam panjang inputnya. $r$ $g$ $h$
Kami memiliki untuk semua dan rasional dan untuk semua $f_{2} (g (x_{1}, r), y_{2}) \leq r \Rightarrow f_{1} (x_{1}, h (x_{1}, y_{2}, r)) \leq 1 + c \cdot (r - 1)$ $f_2(g(x_1,r),y_2)\le r \Rightarrow f_1(x_1,h(x_1,y_2,r))\le 1+c\cdot(r-1)$ $x_1\in X_1$ $r>1$ $y_2\in L_2(g(x_1,r))$

Dalam definisi ini dan tergantung pada kualitas solusi . Jadi untuk kualitas yang berbeda fungsi dapat berbeda. Keumuman ini tidak selalu diperlukan dan kami hanya bekerja dengan dan . $g$ $h$ $r$ $g(x_1)$ $h(x_1, y_2)$

Sekarang kita memiliki gagasan pengurangan untuk masalah optimasi, kita akhirnya dapat mentransfer banyak hal yang kita ketahui dari teori kompleksitas. Sebagai contoh jika kita tahu bahwa dan kita menunjukkan bahwa maka juga. $O_2\in APX$ $O_1\le_{AP} O_2$ $O_1\in APX$

Akhirnya kita dapat mendefinisikan apa yang kita maksud dengan -hard dan -complete untuk masalah optimasi: $\mathcal{C}$ $\mathcal{C}$

Mari menjadi optimasi-masalah dari dan kelas optimasi-masalah dari kemudian disebut -Hard terhadap jika untuk semua memegang . $O$ $NPO$ $\mathcal{C}$ $NPO$ $O$ $\mathcal{C}$ $\le_{AP}$ $O'\in\mathcal{C}$ $O'\le_{AP} O$

Jadi sekali lagi kita memiliki gagasan tentang masalah yang paling sulit di kelas. Tidak mengherankan sebuah -Hard $\mathcal{C}$ masalah disebut -Lengkap terhadap jika itu adalah unsur . $\mathcal{C}$ $\le_{AP}$ $\mathcal{C}$

$NPO$ $APX$ $NPO$ $\mathsf{SAT}$ $\mathsf{Weighted-Satisfiability}$ $NPO$ $\mathsf{Maximum-3SAT}$ $APX$

— uli
sumber

Oh dan tolong terima permintaan maaf saya untuk posting yang relatif panjang ini, tetapi saya tidak punya waktu untuk menulis yang lebih pendek.

— uli

garis pukulan tentu saja adalah bahwa dengan teorema PCP Anda dapat menautkan MAX3SAT dan SAT, sehingga menunjukkan bahwa NP-sulit untuk memperkirakan MAX 3SAT lebih baik daripada beberapa konstanta. Itu setara dengan teorema Cook-Levin, dalam arti tertentu.

— Suresh

@ Suresh Tentu saja, tapi hasil ini yang Anda sebutkan membutuhkan pengurangan kesenjangan-menjaga sejauh yang saya ingat. Dan seperti yang sudah Anda tulis tentang mereka di posting Anda, saya tidak ingin menduplikasi mereka di sini.

— uli

Jawaban bagus, +1! Saya ingin tahu apakah jawaban Anda didasarkan pada beberapa referensi?

— Tim

@Tim Tentu saja ada buku, saya mencantumkan beberapa di komentar dari jawaban

— uli

Biasanya yang ditampilkan adalah NP-hardness dari versi "Gap" masalah. Misalnya, Anda ingin menunjukkan bahwa sulit untuk memperkirakan SET COVER hingga dalam faktor 2.

Anda menetapkan contoh "janji" SET COVER yang akan kami panggil 2-GAP-SET-COVER:

$\ell$

$\ell$
$2\ell$

Misalkan kita menunjukkan bahwa masalah dalam memutuskan mana dari dua kasus yang menjadi masalah adalah NP-complete. Kemudian kami telah menunjukkan bahwa mendekati SET COVER ke dalam faktor 2 adalah NP-hard, karena kita bisa menggunakan algoritma seperti itu untuk membedakan kedua kasus ini.

— Suresh
sumber

Dua jawaban yang ada sangat informatif tetapi saya tidak berpikir salah satu dari mereka benar-benar menjawab pertanyaan, yaitu, "Bagaimana masalah yang bahkan bukan masalah keputusan menjadi NP-hard, ketika NP adalah kelas masalah keputusan ? "

$L$ $L$ $L$

Beberapa contoh.

$L$ $L$ $L$ $L$
#SAT adalah masalah menghitung jumlah penugasan yang memuaskan ke rumus CNF. Jelas bukan dalam NP karena, seperti yang Anda amati, NP adalah kelas masalah keputusan dan #SAT bukan salah satunya. Namun, #SAT adalah NP-hard di bawah pengurangan Turing polinomial-waktu karena kita dapat mengurangi SAT untuk itu. Diberikan contoh SAT, kami bertanya berapa banyak tugas yang memuaskan ada: jika ada setidaknya satu, kita mengatakan "memuaskan"; jika tidak, "tidak memuaskan".
$\varphi$ $\varphi$ $\varphi$ $\varphi'=\varphi \wedge (Z_1\vee \dots \vee Z_{10})$ $Z_i$ $\varphi'$ $\varphi$ $\varphi'$ $\varphi$ $\varphi'$

— David Richerby
sumber