Biarkan saya menambahkan 2 ¢ saya, itu tugas saya untuk mendapatkan data yang baik dan bersih untuk dana lindung nilai, saya telah melihat cukup banyak feed data dan penyedia data historis. Ini terutama tentang data stok AS.
Untuk mulai dengan, jika Anda memiliki uang jangan repot-repot dengan mengunduh data dari Yahoo, dapatkan data akhir hari langsung dari data CSI , ini adalah di mana Yahoo mendapatkan data EOD mereka juga AFAIK. Mereka memiliki API tempat Anda dapat mengekstrak data ke format apa pun yang Anda inginkan. Saya pikir berlangganan data tahunan adalah beberapa $ 100 dolar.
Masalah utama dengan mengunduh data dari layanan gratis adalah Anda hanya mendapatkan stok yang masih ada, ini disebut Survivorship Bias dan dapat memberi Anda hasil yang salah jika Anda melihat banyak stok, karena Anda hanya akan memasukkan yang membuatnya begitu jauh dan bukan yang tidak terdaftar.
Untuk bermain-main dengan beberapa data intraday saya akan melihat ke IQFeed , mereka menyediakan beberapa API untuk mengekstrak data historis, meskipun mereka terutama pakaian untuk feed real-time. Tetapi di sini ada beberapa opsi, beberapa broker bahkan menyediakan unduhan data historis melalui API mereka, jadi pilih saja racun Anda.
TAPI biasanya semua data ini tidak terlalu bersih, setelah Anda benar-benar mulai menguji kembali Anda akan melihat bahwa stok tertentu hilang atau muncul sebagai dua simbol yang berbeda, atau stock split tidak diperhitungkan dengan benar, dll. Dan kemudian Anda menyadari bahwa historis data dividen juga diperlukan dan Anda mulai berjalan dalam lingkaran, menambal data bersama dari 100 sumber data yang berbeda dan seterusnya. Jadi untuk memulai dengan umpan data "diskon" akan dilakukan, tetapi segera setelah Anda menjalankan backtests yang lebih komprehensif Anda mungkin mengalami masalah tergantung pada apa yang Anda lakukan. Jika Anda hanya melihat, katakanlah, saham S&P 500 ini tidak akan menjadi masalah dan feed intraday "murah" akan berlaku.
Apa yang tidak akan Anda temukan adalah data intraday gratis. Maksud saya Anda mungkin menemukan beberapa contoh, saya yakin ada 5 tahun data kutu MSFT beredar tetapi itu tidak akan membuat Anda terlalu jauh.
Kemudian, jika Anda membutuhkan barang nyata (buku pesanan level II, semua kutu seperti yang terjadi di semua bursa) satu "terjangkau", namun pilihan yang sangat baik adalah Nanex . Mereka benar-benar akan mengirimkan Anda sebuah drive dengan data terabyte. Jika saya ingat benar tentang data sekitar $ 3k-4K per tahun. Tapi percayalah, setelah Anda memahami betapa sulitnya mendapatkan data intraday yang baik, Anda tidak akan berpikir ini adalah uang yang sangat banyak.
Bukan untuk mengecilkan hati Anda tetapi untuk mendapatkan data yang baik itu sulit, begitu sulit bahkan banyak hedge-fund dan bank menghabiskan ratusan ribu dolar per bulan untuk mendapatkan data yang dapat mereka percayai. Sekali lagi, Anda dapat mulai di suatu tempat dan kemudian pergi dari sana tetapi ada baiknya melihatnya sedikit dalam konteks.
Sunting: Jawaban di atas adalah dari pengalaman saya sendiri. Artikel ini dari Caltech tentang umpan data yang tersedia akan memberikan lebih banyak wawasan, dan terutama merekomendasikan QuantQuote .