Bagaimana saya bisa membaca dalam file .csv (tanpa header) dan ketika saya hanya ingin subset kolom (katakanlah 4 dan 7 dari total 20 kolom), menggunakan panda? Sepertinya saya tidak bisa melakukannyausecols
Bagaimana saya bisa membaca dalam file .csv (tanpa header) dan ketika saya hanya ingin subset kolom (katakanlah 4 dan 7 dari total 20 kolom), menggunakan panda? Sepertinya saya tidak bisa melakukannyausecols
Jawaban:
Jawaban sebelumnya baik dan benar, tetapi menurut saya, names
parameter tambahan akan membuatnya sempurna, dan itu harus menjadi cara yang disarankan, terutama ketika csv tidak headers
.
usecols
dan names
parameterdf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
atau gunakan header=None
untuk secara eksplisit memberi tahu orang-orang bahwa csv
tidak ada tajuk (toh kedua baris identik )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Sehingga Anda dapat mengambil data Anda dengan
# with `names` parameter
df['colA']
df['colB']
dari pada
# without `names` parameter
df[0]
df[1]
Berdasarkan read_csv , ketika names
dilewatkan secara eksplisit, maka header
akan berperilaku seperti None
alih - alih 0
, sehingga seseorang dapat melewati header=None
ketika names
ada.