Saat ini saya sedang membangun sebuah instance di EC2 untuk mengimpor seluruh snapshot Planet.osm dari seluruh data Bumi untuk beberapa proyek yang sedang kami kerjakan. Saya telah memutar contoh besar Ubuntu x64 dan melampirkan banyak penyimpanan terpisah pada volume EBS untuk database Postgres dan memodifikasinya untuk menampung data PGSQL di sana.
Sekarang server mengalami kesulitan menggunakan osm2pgsql
untuk mengimpor snapshot ... Setelah beberapa upaya dengan konfigurasi memori yang berbeda dan yang lainnya, proses terus menghasilkan "Dibunuh" setelah mendapatkan sebagian besar jalan melalui; setelah itu terbunuh ketika "pergi cara tertunda" dan waktu berikutnya, setelah sedikit menyesuaikan cache ramping, itu mencapai "cara pemrosesan" sebelum crash. Dari apa yang saya baca, ini umumnya karena masalah memori.
Inilah upaya terakhir saya untuk menjalankan impor:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
Dan berikut adalah spesifikasi untuk contoh besar pada EC2:
Memori Instance Besar 7,5 GB, 4 Unit Komputasi EC2 (2 core virtual dengan 2 Unit Komputasi EC2), penyimpanan instance lokal 850 GB, platform 64-bit
Pertanyaan saya adalah - apakah ada beberapa sumber daya tolok ukur yang baik untuk menentukan persyaratan penyetelan untuk osm2pgsql dan Postgres? Kecepatan impor bahkan tidak terlalu penting bagi saya, saya hanya ingin memastikan prosesnya selesai dengan aman, bahkan jika perlu 4 atau 5 hari ... Saya sudah membaca " Mengoptimalkan rendering dari Frederick Ramm dokumen rantai "(PDF) dari SOTM tahun lalu, tetapi apakah ada pendapat / sumber daya lain yang bagus?