Kamu bertanya:
dalam kasus di mana š¯‘› adalah 10 dari jutaan apakah regresi proses Gaussian masih berfungsi?
Tidak dalam arti standar membangun dan membalikkan matriks besar. Anda memiliki dua opsi: 1) memilih model yang berbeda atau 2) membuat perkiraan.
1) Beberapa model berbasis GP dapat ditingkatkan ke set data yang sangat besar, seperti mesin komite Bayesian yang terhubung dalam jawaban di atas. Saya menemukan pendekatan ini agak tidak memuaskan: ada alasan bagus untuk memilih model GP, dan jika kita ingin beralih ke model yang lebih komputabel kita mungkin tidak mempertahankan sifat-sifat model asli. Variasi prediktif BCM sangat bergantung pada pemisahan data, misalnya.
2) Pendekatan 'klasik' untuk aproksimasi dalam dokter adalah untuk mendekati matriks kernel. Ada ulasan yang bagus tentang metode-metode ini di sini: http://www.jmlr.org/papers/volume6/quinonero-candela05a/quinonero-candela05a.pdf . Faktanya, kita biasanya dapat melihat pendekatan matriks ini sebagai pendekatan model, dan menggabungkannya dengan mesin komite Bayesian: mereka berubah menjadi model dan sulit untuk memahami kapan perubahan itu mungkin bersifat patologis. Inilah ulasan super: https://papers.nips.cc/paper/6477-understanding-probabilistic-sparse-gaussian-process-approximations.pdf
Cara saya menganjurkan untuk membuat perkiraan untuk dokter besar adalah untuk menghindari mendekati matriks kernel atau model, dan memperkirakan distribusi posterior menggunakan inferensi variasional. Banyak perhitungan yang tampak seperti aproksimasi matriks 'peringkat rendah', tetapi ada satu sifat yang sangat diinginkan: semakin banyak perhitungan yang Anda gunakan (semakin banyak "peringkat") semakin dekat aproksimasi ke posterior sejati, sebagaimana diukur oleh KL perbedaan.
Artikel-artikel ini adalah titik awal yang baik: http://proceedings.mlr.press/v5/titsias09a/titsias09a.pdf
https://arxiv.org/pdf/1309.6835
Saya menulis artikel yang lebih panjang tentang argumen yang sama di sini: https://www.prowler.io/blog/sparse-gps-approximate-the-posterior-not-the-model
Dalam praktiknya, pendekatan variasional bekerja sangat baik dalam banyak kasus. Saya sudah menggunakannya secara luas dalam aplikasi nyata. Dan baru-baru ini ada beberapa teori yang sangat baik untuk mendukung mengapa itu harus berhasil ( https://arxiv.org/abs/1903.03571 ).
Steker terakhir: inferensi variasional dalam dokter diterapkan di gpflow ( https://github.com/GPflow/GPflow )