Jawaban:
Ya, ini akan membuat perbedaan besar pada hasilnya. Opsi kedua adalah cara yang Anda inginkan.
Dalam kasus pertama Anda, pencarian fuzzy akan menggabungkan ketiga bidang sebagai string tunggal, dan kemudian mengevaluasi% kesamaan berdasarkan # karakter di seluruh string.
Dalam kasus kedua Anda, memiliki tiga kolom pencocokan terpisah akan memberikan bobot yang sama untuk setiap perbandingan. Perhitungan terpisah sedang dilakukan pada warna dan buah.
Alasan memiliki bidang terpisah (perhitungan terpisah) lebih akurat adalah, katakanlah nama buah rata-rata panjangnya 12 karakter, dan warna rata-rata panjangnya 6 karakter. Jika Anda menggabungkan dua string menjadi satu, nama akan lebih berat hanya karena mengandung lebih banyak karakter. Ketika Anda menghitung setiap bidang secara terpisah, kesamaan% akan membandingkan nama vs nama, menghasilkan skor, lalu mengambil warna vs warna dan menghasilkan skor terpisah. % Similarity the average kedua skor bersama-sama untuk mendapatkan% Similarity akhir.
Pada akhirnya jawabannya bisa berbeda, tergantung pada apa yang Anda cari, tetapi opsi kedua mengevaluasi setiap bidang secara merata terlepas dari panjang kata dalam string itu.
...Semoga ini membantu! Saya mengalami banyak trial and error yang membuat frustasi sebelum menemukan ini sendiri;)