Saya memiliki kerangka data dengan nilai berulang di kolom A. Saya ingin menjatuhkan duplikat, menjaga baris dengan nilai tertinggi di kolom B.
Jadi ini:
A B
1 10
1 20
2 30
2 40
3 10
Harus berubah menjadi ini:
A B
1 20
2 40
3 10
Wes telah menambahkan beberapa fungsionalitas yang bagus untuk menjatuhkan duplikat: http://wesmckinney.com/blog/?p=340 . Tapi AFAICT, ini dirancang untuk duplikat yang tepat, jadi tidak disebutkan kriteria untuk memilih baris mana yang disimpan.
Saya menduga mungkin ada cara mudah untuk melakukan ini --- mungkin semudah mengurutkan dataframe sebelum menjatuhkan duplikat --- tapi saya tidak tahu logika internal groupby cukup baik untuk mengetahuinya. Ada saran?