Membandingkan Beberapa Set Data


0

Saya bertanya-tanya apa cara terbaik untuk membandingkan beberapa set data. Saya memiliki sekitar 25 tabel data yang merupakan nama Produk Makanan. Saya perlu melihat produk makanan mana yang sama di semua set ini, namun masalahnya adalah bahwa nama produk makanan sedikit berbeda di setiap set data.

Sebagai contoh, itu bisa menjadi Natural Organics 100% Aloe Vera Tea dalam satu set data dan yang lain itu bisa Natural Organics Aloe 100% Tea. Jadi itu menjadi sangat mudah berantakan.

Satu saran oleh superuser lain adalah menggunakan Fuzzy Lookup di Excel yang telah saya lakukan, kecuali Anda hanya dapat membandingkan 2 tabel sekaligus. Apakah ada proses di mana saya dapat skala ini melakukan ini?

Atau ada cara pemrograman untuk melakukan ini?


Saya akan mengatakan SQL Server dan mengikat kunci ID unik untuk semua produk di semua tabel dan bergabung dengan tabel dengan kunci ID unik. Jadi misalnya, Natural Organics 100% Aloe Vera Tea akan menjadi keyid 1, dan Natural Organics Aloe 100% Tea akan keyid 2, nama produk berikutnya akan keyid 3 dan seterusnya. Di setiap tabel, nama produk yang sama akan diberikan keyid yang sama sehingga Anda dapat menggabungkan data dari semua tabel dengan logika TSQL oleh keyid .... lihat di sini: w3schools.com/sql/sql_join.asp
Pimp Juice IT

Untuk memperluas saran Homey, langkah pertama perlu membersihkan data ke formulir yang dapat digunakan. Setelah Anda memiliki kunci unik yang bersih, ada banyak cara untuk mencapai hasilnya. Satu saran adalah melakukan pembersihan dalam beberapa lintasan. Saat Anda menemukan kecocokan yang mudah diidentifikasi, keluarkan dari daftar mentah. Item yang tersisa akan menjadi lebih mudah untuk dikerjakan dan menemukan contoh aturan baru yang dapat Anda terapkan. Anda juga dapat bekerja dari kedua arah. Selain menemukan dan menghapus kecocokan, Anda dapat mengidentifikasi dan menghapus item yang unik.
fixer1234

@ fixer1234 Terima kasih untuk itu, Itulah yang saya lakukan sekarang :)!
Bahtfeng

@ fixer1234 Pada topik yang sama, apakah ada yang tahu cara terbaik untuk menemukan perkiraan kecocokan di kolom yang sama? Saya membuat dua tabel identik dari data yang sama dan melakukan pencarian fuzzy, namun ada banyak duplikat karena EXACT (1,00) cocok. Masalah lain adalah bahwa kadang-kadang pertandingan EXACT (1,00) salah, IE Natural Organics 100% Aloe Vera Tea 100ML & Natural Organics 100% Aloe Vera Tea - 100ML akan memberi saya EXACT (1,00) cocok sehingga sulit untuk menyaring positif palsu. dari yang asli.
Bahtfeng
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.