Jawaban:
panda menyediakan alat manipulasi data tingkat tinggi yang dibangun di atas NumPy. NumPy dengan sendirinya adalah alat tingkat yang cukup rendah, mirip dengan MATLAB. panda di sisi lain menyediakan fungsionalitas deret waktu yang kaya, penyelarasan data, statistik ramah-NA, berkelompok, menggabungkan dan menggabungkan metode, dan banyak kemudahan lainnya. Ini telah menjadi sangat populer dalam beberapa tahun terakhir dalam aplikasi keuangan. Saya akan memiliki bab yang didedikasikan untuk analisis data keuangan menggunakan panda dalam buku saya yang akan datang.
NA-friendly statistics
, disebutkan dalam jawaban Anda.
Numpy diperlukan oleh panda (dan oleh hampir semua alat numerik untuk Python). Scipy tidak sepenuhnya diperlukan untuk panda tetapi terdaftar sebagai "ketergantungan opsional". Saya tidak akan mengatakan bahwa panda adalah alternatif untuk Numpy dan / atau Scipy. Alih-alih, ini adalah alat tambahan yang menyediakan cara kerja yang lebih ramping dengan data numerik dan tabular dalam Python. Anda dapat menggunakan struktur data panda tetapi secara bebas menggunakan fungsi Numpy dan Scipy untuk memanipulasi mereka.
Panda menawarkan cara yang bagus untuk memanipulasi tabel, karena Anda dapat membuat binning mudah ( binning dataframe dalam panda dengan Python ) dan menghitung statistik. Hal lain yang hebat dalam panda adalah kelas Panel yang Anda dapat bergabung dengan serangkaian lapisan dengan properti yang berbeda dan menggabungkannya menggunakan fungsi groupby.