Saya menggunakan panda sebagai pengganti db karena saya memiliki banyak basis data (oracle, mssql, dll) dan saya tidak dapat membuat urutan perintah menjadi setara dengan SQL.
Saya memiliki tabel yang dimuat dalam DataFrame dengan beberapa kolom:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
Dalam SQL, untuk menghitung jumlah klien yang berbeda per tahun adalah:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Dan hasilnya akan seperti itu
201301 5000
201302 13245
Bagaimana saya bisa melakukannya di panda?
value_counts
mungkin jawaban yang Anda cari: pandas.pydata.org/pandas-docs/stable/generated/…