Apa yang ada di balik Google Prediction API?

Google Prediction API adalah layanan cloud di mana pengguna dapat mengirimkan beberapa data pelatihan untuk melatih beberapa classifier misterius dan kemudian memintanya untuk mengklasifikasikan data yang masuk, misalnya untuk mengimplementasikan filter spam atau memprediksi preferensi pengguna.

Tapi apa yang ada di balik layar?

machine-learning

Saya curiga mereka berharap merahasiakannya secara komersial!

— onestop

Ini mungkin benar, namun video (dari musim panas 2010) menunjukkan bahwa mereka masih bereksperimen pada saat itu; jadi saya memposting Q ini berharap beberapa kebocoran muncul sejak itu.

Ada "beberapa" algoritma yang dapat dipilih API Prediksi saat melatih / memprediksi data Anda. Mesin memilih salah satu yang terbaik. Beberapa pengguna telah meminta kontrol lebih besar atas pemilihan itu, goo.gl/mod/5EoA , bahkan jika algoritme tidak diketahui. Redditor berspekulasi pada nyali di sini, reddit.com/r/MachineLearning/comments/evdxb/… , tetapi stat -icara hilang pada saya.

— hyperslug

@ hyperslug Posting sebagai jawaban, ini cukup berguna jadi saya ingin menerimanya.

Google menggunakan berbagai teknik pembelajaran mesin dan algoritma untuk pelatihan dan prediksi. Strategi untuk pembelajaran terawasi skala besar: 1. Sub-sampel 2. Paralel memalukan beberapa algoritma 3. Penurunan gradien terdistribusi 4. Suara mayoritas 5. Campuran parameter 6. Campuran parameter berulang

Mereka harus melatih dan memprediksi model dengan teknik pembelajaran mesin yang berbeda dan menggunakan algoritma untuk memutuskan model dan prediksi terbaik untuk kembali.

Sub-sampling memberikan kinerja yang lebih rendah
Campuran parameter membaik, tetapi tidak sebagus semua data
Algoritma terdistribusi mengembalikan pengklasifikasi yang lebih baik lebih cepat
Campuran parameter berulang mencapai semua data

Tapi tentu saja itu tidak terlalu jelas dalam dokumentasi API.

— 404Dreamer_ML
sumber