Saya menjelajahi peralihan ke python dan panda sebagai pengguna SAS lama.
Namun, ketika menjalankan beberapa tes hari ini, saya terkejut bahwa python kehabisan memori ketika mencoba pandas.read_csv()
file csv 128mb. Itu memiliki sekitar 200.000 baris dan 200 kolom yang sebagian besar data numerik.
Dengan SAS, saya dapat mengimpor file csv ke dalam dataset SAS dan ukurannya bisa sebesar hard drive saya.
Apakah ada analogi pandas
?
Saya secara teratur bekerja dengan file besar dan tidak memiliki akses ke jaringan komputasi terdistribusi.