User1282637 bertanya apakah ada cara untuk menyelesaikan tugas ini dan meminta bantuan dalam melakukan itu. Masalahnya bukan mekanika Excel sebanyak bagaimana menangani ambiguitas dalam data. Parsing Kode ZIP dan deskripsi secara langsung (kecuali Anda memiliki campuran 5 digit dan 9 digit ZIP). Masalah yang sulit adalah memisahkan jalan dari kota, jadi saya akan fokus pada hal itu. Ini tidak dimaksudkan sebagai langkah-demi-langkah bagaimana melakukannya dengan rumus Excel. Itu hanya berbagi beberapa wawasan tentang masalah dan menjelaskan pendekatan untuk mencapai hasil untuk bagian yang sulit.
Masalahnya adalah bahwa tidak ada pembatas di antara bidang yang berbeda. Itu bukan masalah untuk mengupas deskripsi atau ZIP karena mudah diidentifikasi. Masalahnya menentukan di mana Street berakhir dan City dimulai. Pertimbangkan variasi-variasi ini di bagian Jalan (jauh dari daftar lengkap):
120 Lemon Street
120 Lemon Drop Street
120 Lemon Street NW
120 East Lemon Street
120 Lemon Street Apt 3
Jumlah "kata" di jalan dapat bervariasi dari serendah 1 atau 2, hingga 7 atau 8, sehingga tidak berguna untuk penguraian. "Jenis" jalan juga tidak terlalu berguna. Ada pada urutan 50-100 kata yang digunakan hanya untuk "tipe" jalan (jalan, jalan, bulevar, jalan, jalan tol, jalur, lapangan, lingkaran, teras, dll.). Gabungkan bahwa dengan penggunaan singkatan untuk jenis jalan, baik yang benar maupun yang salah, dan daftarnya ada dalam ratusan. Plus, penunjukan ini tidak selalu kata terakhir di bidang jalan. Jalan adalah bagian tersulit untuk diidentifikasi sehingga pendekatan logis adalah untuk mengidentifikasi sisanya dan sisanya adalah jalan.
Kota ini dapat terdiri dari beberapa kata. Gedung Pengadilan Washington, OH adalah tiga kata. Kemudian pertimbangkan situasi seperti St Marys, OH. Apakah "St" bagian dari nama kota atau sebutan tipe jalan; bidang apa yang dimilikinya? Atau South Euclid, OH - apakah "Selatan" bagian dari nama kota atau arah yang merupakan bagian dari alamat jalan? City memiliki masalah tetapi ada cara untuk menghadapinya.
Bahkan menggunakan kode ZIP untuk mengidentifikasi kota memiliki masalah. Tidak selalu ada kecocokan 1: 1 antara nama kota dan ZIP.
Cara paling praktis untuk menyerang masalah adalah dengan menggunakan "kamus": daftar kota, dan direktori Kode Pos. Ini adalah bagian alamat yang paling jelas. Ini dapat ditemukan online atau dari Layanan Pos. Untuk melakukan perbandingan, Anda mungkin perlu membersihkan data atau daftar Anda. Mereka akan membutuhkan gaya huruf besar yang sama dan ruang ekstra di data Anda akan mencegah kecocokan yang tepat.
Jika data atau daftar Anda menggunakan singkatan, Anda harus menghadapinya. Entah menerjemahkan yang tidak disatukan ke singkatan standar atau melakukan kecocokan sekunder terhadap kamus singkatan (juga tersedia online atau dari Layanan Pos), ketika perbedaan-perbedaan itu ditemukan.
ZIP dapat dengan mudah diurai, dan itu adalah tempat yang baik untuk memulai. Lakukan pencarian Kode ZIP terhadap direktori Kode ZIP. Jika hasilnya persis cocok dengan serangkaian kata yang tepat sebelum ZIP, yang mengidentifikasi bagian rekaman mana yang merupakan bidang kota.
Jika tidak ada kecocokan yang pasti atau tidak ambigu, pindah ke perbandingan nama kota. Ulangi daftar nama kota. Untuk setiap nama, tentukan jumlah kata yang dikandungnya dan bandingkan dengan jumlah kata yang tepat sebelum ZIP.
Jika Anda mendapatkan kecocokan melalui proses mana pun, semua yang tersisa di sebelah kiri kota adalah alamat jalan.
Aplikasi jenis ini jauh lebih mudah dilakukan dengan aplikasi database daripada dengan spreadsheet. Bagaimanapun, Anda dapat melihat bahwa mencoba melakukan ini dengan cara otomatis bukanlah tugas yang mudah. Anda tidak dapat melakukannya dengan beberapa rumus spreadsheet.
Tidak peduli seberapa keras pemrograman Anda, Anda mungkin masih memiliki catatan yang harus diurai dengan tangan, dan mengurai kesalahan yang perlu Anda perbaiki dengan tangan. Anda tidak menunjukkan berapa banyak catatan yang Anda miliki. Mungkin kurang bekerja untuk melakukannya secara manual.
Jika angkanya besar dan saya harus melakukannya, saya akan menyisihkan daftarnya. Cocokkan catatan yang mudah, seperti pertandingan ZIP yang jelas. Lalu biarkan jumlah data mengatur seberapa jauh Anda memprogram pencocokan otomatis.
Untuk catatan yang tersisa, dengan asumsi Anda sudah melepas ZIP dan deskripsi, berikut adalah cara untuk mempercepat proses manual. Lihatlah catatan dan identifikasi secara visual jumlah "kata" di kota, yang merupakan tugas mental yang cepat. Masukkan itu dalam sel yang ditentukan dan gunakan rumus untuk memisahkan jalan dari kota berdasarkan jumlah jeda ruang (pisahkan pada ruang Nth di mana N = total ruang + 1 - jumlah kata dalam nama kota).