Saya memiliki dua file dengan masing-masing sekitar 12900 dan 4400 entri, yang ingin saya gabung. File tersebut berisi informasi lokasi untuk semua stasiun pengamatan cuaca darat di seluruh dunia. File terbesar diperbarui setiap dua minggu, dan yang lebih kecil setahun sekali atau lebih. File asli dapat ditemukan di sini ( http://www.wmo.int/pages/prog/www/ois/volume-a/vola-home.htm dan http://weather.rap.ucar.edu/surface/ station.txt ). File yang saya miliki sudah dimanipulasi oleh saya dengan beberapa campuran awk, sed, dan skrip bash. Saya menggunakan file untuk memvisualisasikan data menggunakan paket GEMPAK, yang tersedia secara bebas dari Unidata. File terbesar akan bekerja dengan GEMPAK, tetapi tidak dengan kemampuan penuhnya. Untuk ini diperlukan sebuah join.
File 1 berisi informasi lokasi untuk stasiun pengamat cuaca, di mana 6 digit pertama adalah pengidentifikasi stasiun yang unik. Parameter yang berbeda (nomor stasiun, nama stasiun, kode negara, garis lintang, dan ketinggian stasiun) hanya ditentukan oleh posisinya di garis, yaitu tidak ada tab.
060090 AKRABERG FYR DN 6138 -666 101
060100 VAGA FLOGHAVN DN 6205 -728 88
060110 TORSHAVN DN 6201 -675 55
060120 KIRKJA DN 6231 -631 55
060130 KLAKSVIK HELIPORT DN 6221 -656 75
060160 HORNS REV A DN 5550 786 21
060170 HORNS REV B DN 5558 761 10
060190 SILSTRUP DN 5691 863 0
060210 HANSTHOLM DN 5711 858 0
060220 TYRA OEST DN 5571 480 43
060240 THISTED LUFTHAVN DN 5706 870 8
060290 GROENLANDSHAVNEN DN 5703 1005 0
060300 FLYVESTATION AALBORG DN 5708 985 13
060310 TYLSTRUP DN 5718 995 0
060320 STENHOEJ DN 5736 1033 56
060330 HIRTSHALS DN 5758 995 0
060340 SINDAL FLYVEPLADS DN 5750 1021 28
File 2 berisi pengidentifikasi unik dalam File 1 dan yang kedua, pengidentifikasi 4 karakter (ICAO locator).
060100 EKVG
060220 EKGF
060240 EKTS
060300 EKYT
060340 EKSN
060480 EKHS
060540 EKHO
060600 EKKA
060620 EKSV
060660 EKVJ
060700 EKAH
060780 EKAT
Saya ingin bergabung dengan dua file, sehingga file yang dihasilkan akan memiliki pengidentifikasi 4 karakter dalam 4 posisi pertama di baris, yaitu pengidentifikasi harus mengganti 4 spasi.
060090 AKRABERG FYR DN 6138 -666 101
EKVG 060100 VAGA FLOGHAVN DN 6205 -728 88
060110 TORSHAVN DN 6201 -675 55
060120 KIRKJA DN 6231 -631 55
060130 KLAKSVIK HELIPORT DN 6221 -656 75
060160 HORNS REV A DN 5550 786 21
060170 HORNS REV B DN 5558 761 10
060190 SILSTRUP DN 5691 863 0
060210 HANSTHOLM DN 5711 858 0
EKGF 060220 TYRA OEST DN 5571 480 43
EKTS 060240 THISTED LUFTHAVN DN 5706 870 8
060290 GROENLANDSHAVNEN DN 5703 1005 0
EKYT 060300 FLYVESTATION AALBORG DN 5708 985 13
060310 TYLSTRUP DN 5718 995 0
060320 STENHOEJ DN 5736 1033 56
060330 HIRTSHALS DN 5758 995 0
EKSN 060340 SINDAL FLYVEPLADS DN 5750 1021 28
Apakah mungkin menyelesaikan tugas ini dengan skrip bash dan / atau awk?