Bagaimana saya bisa membaca dalam file .csv (tanpa header) dan ketika saya hanya ingin subset kolom (katakanlah 4 dan 7 dari total 20 kolom), menggunakan panda? Sepertinya saya tidak bisa melakukannyausecols
Bagaimana saya bisa membaca dalam file .csv (tanpa header) dan ketika saya hanya ingin subset kolom (katakanlah 4 dan 7 dari total 20 kolom), menggunakan panda? Sepertinya saya tidak bisa melakukannyausecols
Jawaban:
Jawaban sebelumnya baik dan benar, tetapi menurut saya, namesparameter tambahan akan membuatnya sempurna, dan itu harus menjadi cara yang disarankan, terutama ketika csv tidak headers.
usecolsdan namesparameterdf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
atau gunakan header=Noneuntuk secara eksplisit memberi tahu orang-orang bahwa csvtidak ada tajuk (toh kedua baris identik )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Sehingga Anda dapat mengambil data Anda dengan
# with `names` parameter
df['colA']
df['colB']
dari pada
# without `names` parameter
df[0]
df[1]
Berdasarkan read_csv , ketika namesdilewatkan secara eksplisit, maka headerakan berperilaku seperti Nonealih - alih 0, sehingga seseorang dapat melewati header=Noneketika namesada.