Saya mencoba menggunakan panda untuk memanipulasi file .csv tapi saya mendapatkan kesalahan ini:
pandas.parser.CParserError: Kesalahan tokenizing data. C error: Diharapkan 2 bidang pada baris 3, lihat 12
Saya telah mencoba membaca panda docs, tetapi tidak menemukan apa pun.
Kode saya sederhana:
path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)
Bagaimana saya bisa menyelesaikan ini? Haruskah saya menggunakan csv
modul atau bahasa lain?
File dari Morningstar
pd.read_csv("<path>", sep=";")
. Jangan gunakan Excel untuk memeriksa karena kadang-kadang menempatkan data ke dalam kolom secara default dan karenanya menghapus pemisah.
pandas.to_csv()
, itu MUNGKIN karena ada '\ r' dalam nama kolom, dalam hal ini to_csv () akan benar-benar menulis nama kolom berikutnya ke dalam kolom pertama dari frame data, menyebabkan perbedaan antara jumlah kolom dalam baris X pertama. Perbedaan ini adalah salah satu penyebab kesalahan C.