Salah satu opsi adalah untuk mendapatkan frekuensi semua kombinasi pembelian produk; pilih beberapa kombinasi yang paling umum; kemudian buat model regresi untuk memprediksi kombinasi yang dipilih masing-masing individu. Misalnya, dengan regresi logistik biner, Anda dapat memperkirakan pembelian a) Anggur Putih, Brie, Stroberi dan Anggur vs. b) Anggur Merah, Cheddar dan Gouda. Dengan lebih dari 2 kombinasi seperti itu, atau jika Anda ingin memasukkan kategori "tidak satu pun di atas," regresi logistik multinomial mungkin akan menjadi metode pilihan.
Perhatikan bahwa memasukkan hanya kombo yang sama berarti Anda akan memiliki angka masing-masing yang lebih bisa diterapkan tetapi Anda tidak akan memasukkan yang lain, setidaknya dari prosedur ini. Saya bisa membayangkan 7 item menciptakan puluhan kombo yang masing-masing dipilih oleh setidaknya beberapa orang. Ini mungkin terlalu banyak kategori untuk ukuran sampel Anda. Selain itu, jika kombo dipilih oleh hanya beberapa orang, model Anda akan memiliki informasi yang sangat sedikit untuk dikerjakan.
Pilihan lain adalah menggunakan analisis kluster untuk sampai pada beberapa set barang yang cenderung dibeli bersama. Dengan 7 item, Anda mungkin akan memiliki kurang dari 4 cluster, yang mungkin membuat tugas Anda lebih mudah. Jika Anda mencoba analisis kluster dan menemukan hasilnya tidak bisa dijalankan, tidak ada alasan mengapa Anda harus menggunakannya: cukup kembali ke pendekatan berbasis frekuensi yang dijelaskan di atas. Dalam hal ini, jika saya membacanya dengan benar, Anda sedang mencari berbagai kategori yang paling deskriptif dan menarik, dan dalam menetapkan itu, Anda tidak perlu khawatir tentang derajat kebebasan atau beberapa perbandingan atau masalah apa pun yang mungkin berlaku jika Anda mencoba beberapa metode dalam melakukan beberapa tes inferensial.