Google menggunakan berbagai teknik pembelajaran mesin dan algoritma untuk pelatihan dan prediksi. Strategi untuk pembelajaran terawasi skala besar: 1. Sub-sampel 2. Paralel memalukan beberapa algoritma 3. Penurunan gradien terdistribusi 4. Suara mayoritas 5. Campuran parameter 6. Campuran parameter berulang
Mereka harus melatih dan memprediksi model dengan teknik pembelajaran mesin yang berbeda dan menggunakan algoritma untuk memutuskan model dan prediksi terbaik untuk kembali.
- Sub-sampling memberikan kinerja yang lebih rendah
- Campuran parameter membaik, tetapi tidak sebagus semua data
- Algoritma terdistribusi mengembalikan pengklasifikasi yang lebih baik lebih cepat
- Campuran parameter berulang mencapai semua data
Tapi tentu saja itu tidak terlalu jelas dalam dokumentasi API.