Apa relevansi AIXI pada penelitian kecerdasan buatan saat ini?


14

Dari Wikipedia:

AIXI ['ai̯k͡siː] adalah formalisme matematika teoretis untuk kecerdasan umum buatan. Ini menggabungkan induksi Solomonoff dengan teori keputusan sekuensial. AIXI pertama kali diusulkan oleh Marcus Hutter pada tahun 2000 [1] dan hasilnya di bawah ini dibuktikan dalam buku Universal Intelligence Buatan Hutter 2005. [2]

Meskipun tidak dapat dikomputasi , perkiraan dimungkinkan, seperti AIXItl . Menemukan perkiraan untuk AIXI bisa menjadi cara obyektif untuk menyelesaikan AI.

Apakah AIXI benar-benar masalah besar dalam penelitian kecerdasan umum buatan ? Bisakah itu dianggap sebagai konsep sentral untuk lapangan? Jika demikian, mengapa kita tidak memiliki lebih banyak publikasi tentang hal ini (atau mungkin kita miliki dan saya tidak menyadarinya)?

Jawaban:


8

"Penelitian kecerdasan buatan saat ini" adalah bidang yang cukup luas. Dari tempat saya duduk, di sebagian besar ranah CS, orang berfokus pada kecerdasan sempit yang dapat melakukan pekerjaan yang relevan secara ekonomi pada tugas sempit. (Yaitu, memperkirakan kapan komponen akan gagal, memprediksi iklan mana yang akan diklik pengguna, dan sebagainya.)

Untuk alat-alat semacam itu, generalisasi formalisme seperti AIXI adalah kelemahan, bukan kekuatan. Anda tidak perlu mengambil AI yang secara teori bisa menghitung apa saja, dan kemudian perlahan-lahan melatihnya untuk fokus pada apa yang Anda inginkan, ketika Anda bisa langsung membentuk alat yang merupakan cermin dari tugas Anda.

Saya tidak begitu akrab dengan riset AGI itu sendiri, tetapi kesan saya adalah bahwa AIXI adalah, sampai batas tertentu, ide paling sederhana yang dapat bekerja - itu mengambil semua bagian yang sulit dan mendorongnya ke dalam perhitungan, jadi ini 'hanya tantangan rekayasa . ' (Ini adalah sedikit tentang 'menemukan perkiraan untuk AIXI.') Pertanyaan kemudian menjadi, apakah mulai di AIXI dan mencoba untuk memperkirakan jalur penelitian yang kurang lebih berbuah daripada memulai pada sesuatu yang kecil dan fungsional, dan mencoba membangun?

Kesan saya adalah yang terakhir jauh lebih umum, tetapi sekali lagi, saya hanya melihat sudut kecil ruang ini.


Anda sebenarnya tidak menjawab pertanyaan di pos saat ini . Pertanyaan pertama adalah "apakah AIXI benar-benar masalah besar dalam penelitian kecerdasan umum buatan ?". Pertanyaannya dengan ketat menanyakan tentang pentingnya AIXI dalam penelitian AGI , tidak menanyakan apakah Anda berpikir alat spesifik lainnya lebih baik untuk tugas yang sesuai daripada mempersempit perkiraan model AGI untuk tugas spesifik yang sama. Dalam posting tersebut, pertanyaan lain adalah: "mengapa kita tidak memiliki lebih banyak publikasi tentang hal ini?" Tidak ada jawaban untuk pertanyaan ini di pos Anda.
nbro

5

Apakah AIXI benar-benar masalah besar dalam penelitian kecerdasan umum buatan?

Ya, ini merupakan kontribusi teoretis yang bagus untuk AGI. AFAIK, ini adalah upaya paling serius untuk membangun kerangka kerja teoritis atau landasan untuk AGI. Karya serupa adalah Mesin Gödel Schmidhuber dan arsitektur SOAR .

AIXI adalah kerangka abstrak dan non- antropomorfik untuk AGI yang dibangun di atas bidang pembelajaran penguatan, tanpa beberapa asumsi biasa (misalnya, tanpa asumsi Markov dan ergodisitas , yang menjamin bahwa agen dapat dengan mudah pulih dari kesalahan yang dibuat di masa lalu). Meskipun beberapa sifat optimalitas AIXI telah terbukti, itu (Turing) tidak dapat dihitung (tidak dapat dijalankan pada komputer), dan itu adalah kegunaan praktis yang sangat terbatas. Meskipun demikian, dalam buku Hutter Universal Artificial Intelligence: Keputusan Berurutan berdasarkan Kemungkinan Algoritmik(2005), di mana beberapa properti AIXI dibuktikan secara ketat, versi AIXI yang dapat dihitung tetapi tidak dapat digunakan, AIXItl, juga dijelaskan. Selanjutnya, dalam makalah A Monte Carlo AIXI Approximation (2009), oleh Joel Veness et al., Pendekatan AIXI yang dapat dihitung dan dapat ditelusuri diperkenalkan. Jadi, ada beberapa upaya untuk membuat AIXI praktis bermanfaat.

Artikel Apa itu AIXI? - Pengantar Pembelajaran Penguatan Umum (2015), oleh Jan Leike, yang merupakan salah satu kontributor untuk pengembangan dan evolusi kerangka kerja AIXI, memberikan pengantar yang lembut kepada agen AIXI. Lihat juga Arsitektur AIXI di Stanford Encyclopedia of Philosophy untuk pengenalan yang mungkin lebih lembut untuk AIXI.

Bisakah itu dianggap sebagai konsep sentral untuk lapangan?

Ya, pengenalan AIXI dan penelitian terkait telah berkontribusi pada evolusi bidang AGI. Ada beberapa diskusi dan makalah yang diterbitkan, setelah diperkenalkan pada tahun 2000 oleh Hutter dalam makalah A Theory of Universal Artificial Intelligence berdasarkan Kompleksitas Algoritma .

Lihat misalnya bagian 7, "Contoh Kecerdasan Super ", dari makalah Kecerdasan Umum Buatan dan Model Manusia Mental (2012), oleh Roman V. Yampolskiy dan Joshua Fox. Lihat juga https://wiki.lesswrong.com/wiki/AIXI yang berisi diskusi tentang beberapa masalah terkait AIXI, yang perlu dipecahkan atau mungkin dihindari dalam kerangka kerja AGI di masa depan. Selanjutnya, lihat juga ini dan artikel ini .

Jika demikian, mengapa kita tidak memiliki lebih banyak publikasi tentang hal ini (atau mungkin kita miliki dan saya tidak menyadarinya)?

Ada beberapa publikasi, terutama oleh Marcus Hutter dan peneliti terkait. Anda dapat melihat publikasi Marcus Hutter di halaman web berikut: http://www.hutter1.net/official/publ.htm .

Jika Anda tertarik untuk berkontribusi dalam teori ini, ada beberapa cara. Jika Anda berpendidikan baik secara matematis, Anda dapat mencoba menyelesaikan beberapa masalah yang dijelaskan di sini (yang juga disebutkan dalam buku Hutter 2005 yang disebutkan di atas). Selain itu, Anda juga dapat berkontribusi pada perkiraan baru atau peningkatan perkiraan yang ada dari agen AIXI. Akhirnya, Anda dapat membangun kerangka kerja AGI baru Anda dengan menghindari masalah yang terkait dengan kerangka kerja AIXI. Lihat juga proyek yang dipromosikan oleh Hutter . Mungkin juga merupakan ide yang baik untuk mempertimbangkan misalnya Mesin Gödel dan pekerjaan terkait, sebelum mencoba memperkenalkan kerangka kerja baru (asalkan Anda mampu melakukannya).

Saya pikir teori ini belum menarik lebih banyak orang mungkin karena sangat teknis dan matematis (jadi tidak mudah untuk dipahami kecuali Anda memiliki latar belakang yang sangat kuat dalam pembelajaran penguatan, teori probabilitas, dll.). Saya juga berpikir bahwa kebanyakan orang (dalam komunitas AI) tidak tertarik pada teori, tetapi mereka terutama dipandu oleh hasil praktis dan bermanfaat.


4

AIXI benar-benar kerangka kerja konseptual. Semua kerja keras untuk menekan lingkungan masih ada.

Untuk lebih lanjut membahas pertanyaan yang diajukan dalam jawaban Matthew Graves: mengingat tingkat kemampuan kami yang terbatas saat ini untuk mewakili lingkungan yang kompleks, bagi saya tampaknya tidak ada banyak perbedaan praktis apakah Anda memulai dengan AIXI sebagai mendefinisikan 'puncak' dari sistem dan bekerja turun (misalnya melalui metode kompresi yang seharusnya digeneralisasi) atau mulai dari bawah 'dan mencoba memecahkan masalah dalam satu domain melalui metode spesifik domain yang (Anda harap) selanjutnya dapat diabstraksi untuk memberikan kompresi lintas domain.


Paragraf kedua adalah hasil dari satu-satunya pendapat Anda. Anda tidak memberikan argumentasi / penjelasan mengapa Anda berpikir seperti itu. Bagi saya, "mengingat tingkat kemampuan terbatas kami saat ini untuk mewakili lingkungan yang kompleks" jelas bukan penjelasan atau argumentasi yang memadai.
nbro

@nbro Mengutip periset AI terkenal: "Kami belum mewakili satu konsep pun di komputer", tentu saja tidak dengan jenis kelenturan yang datang secara alami kepada manusia. Jadi dalam praktiknya, sulit untuk menentukan kegunaan AIXI karena kami tidak memiliki gagasan yang kuat tentang jenis representasi yang perlu dimanipulasi, atau bagaimana ia dapat memanipulasi mereka.
NietzscheanAI
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.