Saya ingin membaca beberapa file csv dari direktori menjadi panda dan menggabungkannya menjadi satu DataFrame besar. Saya belum bisa mengetahuinya. Inilah yang saya miliki sejauh ini:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Saya kira saya butuh bantuan dalam for for loop ???
big_frame = pd.concat(dfs, ignore_index=True)
?, toh begitu Anda memiliki daftar kerangka data, Anda perlu mengulangi daftar itu dan big_frame
dfs
sekarang, jadi sesuatu seperti for df in dfs: big_frame.concat(df, ignore_index=True)
harus bekerja, Anda juga bisa mencoba, append
bukan concat
juga.
concat
seharusnya menangani daftar DataFrames baik-baik saja seperti yang Anda lakukan. Saya pikir ini adalah pendekatan yang sangat bagus.
dfs
daftar Anda , jangan Anda ingin mengganti barisdata = pd.read_csv(filename)
dengandfs.append(pd.read_csv(filename)
. Anda kemudian perlu untuk mengulang daftar danconcat
, saya tidak berpikirconcat
akan bekerja pada daftardf
s.