Saya ingin membaca beberapa file csv dari direktori menjadi panda dan menggabungkannya menjadi satu DataFrame besar. Saya belum bisa mengetahuinya. Inilah yang saya miliki sejauh ini:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Saya kira saya butuh bantuan dalam for for loop ???
big_frame = pd.concat(dfs, ignore_index=True)?, toh begitu Anda memiliki daftar kerangka data, Anda perlu mengulangi daftar itu dan big_frame
dfssekarang, jadi sesuatu seperti for df in dfs: big_frame.concat(df, ignore_index=True)harus bekerja, Anda juga bisa mencoba, appendbukan concatjuga.
concatseharusnya menangani daftar DataFrames baik-baik saja seperti yang Anda lakukan. Saya pikir ini adalah pendekatan yang sangat bagus.
dfsdaftar Anda , jangan Anda ingin mengganti barisdata = pd.read_csv(filename)dengandfs.append(pd.read_csv(filename). Anda kemudian perlu untuk mengulang daftar danconcat, saya tidak berpikirconcatakan bekerja pada daftardfs.