Menggunakan browser web (IE atau Chrome) saya dapat menyimpan halaman web (.html) dengan Ctl-S, memeriksanya dengan editor teks apa pun, dan melihat data dalam format tabel. Salah satu angka yang ingin saya ekstrak, tetapi bagi banyak, banyak halaman web, terlalu banyak untuk dilakukan secara manual. Jadi saya ingin menggunakan WGET untuk mendapatkan halaman web tersebut satu demi satu, dan menulis program lain untuk mem-parsing .html dan mengambil nomor yang saya inginkan. Tetapi file .html disimpan oleh WGET saat menggunakan URL yang sama dengan browser tidak berisi tabel data. Kenapa tidak? Seolah-olah server mendeteksi permintaan datang dari WGET dan bukan dari browser web, dan memasok halaman web kerangka, kurang tabel data. Bagaimana saya bisa mendapatkan halaman web yang sama persis dengan WGET? - Terima kasih!
INFO LEBIH LANJUT:
Contoh URL yang saya coba ambil adalah: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US di mana string ICENX adalah simbol ticker reksa dana reksa dana , yang akan saya ubah menjadi salah satu dari sejumlah simbol ticker yang berbeda. Ini mengunduh tabel data ketika dilihat di browser, tetapi tabel data tidak ada jika diambil dengan WGET.