Pertanyaan yang diberi tag «pandas»

Pandas adalah pustaka Python untuk manipulasi dan analisis data, misalnya kerangka data, rangkaian waktu multidimensi, dan kumpulan data cross-sectional yang biasa ditemukan dalam statistik, hasil sains eksperimental, ekonometrik, atau keuangan. Panda adalah salah satu pustaka sains data utama di Python.



7
Apa perbedaan antara bergabung dan bergabung di Panda?
Misalkan saya memiliki dua DataFrames seperti itu: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Saya ingin menggabungkan mereka, jadi saya mencoba sesuatu seperti ini: pd.merge(left, right, left_on='key1', right_on='key2') Dan saya senang key1 lval key2 rval 0 foo 1 foo 4 1 …
208 python  pandas  dataframe  join 

7
Kelompok Panda-oleh dan jumlah
Saya menggunakan bingkai data ini: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes …

9
Pertahankan hanya bagian tanggal saat menggunakan panda.to_datetime
Saya menggunakan pandas.to_datetimeuntuk menguraikan tanggal dalam data saya. Panda secara default mewakili tanggal dengan datetime64[ns]meskipun tanggal semua hanya harian. Saya bertanya-tanya apakah ada cara yang elegan / pintar untuk mengubah tanggal menjadi datetime.dateatau datetime64[D]sehingga, ketika saya menulis data ke CSV, tanggal tidak ditambahkan 00:00:00. Saya tahu saya bisa mengonversi tipe …
201 python  pandas  csv  datetime  series 


17
Mendeteksi dan mengecualikan pencilan dalam bingkai data Pandas
Saya memiliki bingkai data panda dengan beberapa kolom. Sekarang saya tahu bahwa baris tertentu outlier berdasarkan nilai kolom tertentu. Misalnya kolom 'Vol' memiliki semua nilai sekitar 12xxdan satu nilai adalah 4000(outlier). Sekarang saya ingin mengecualikan baris-baris yang memiliki Volkolom seperti ini. Jadi, pada dasarnya saya perlu meletakkan filter pada bingkai …

8
Pilih baris DataFrame antara dua tanggal
Saya membuat DataFrame dari csv sebagai berikut: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) DataFrame memiliki kolom tanggal. Apakah ada cara untuk membuat DataFrame baru (atau hanya menimpa yang sudah ada) yang hanya berisi baris dengan nilai tanggal yang termasuk dalam rentang tanggal yang ditentukan atau antara dua nilai …
198 python  pandas 

7
Tambahkan label x dan y ke plot panda
Misalkan saya memiliki kode berikut yang memplot sesuatu yang sangat sederhana menggunakan panda: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video streaming dropout by category') Bagaimana cara saya dengan mudah mengatur label …

11
Bagaimana cara membagi kolom menjadi dua kolom?
Saya memiliki bingkai data dengan satu kolom dan saya ingin membaginya menjadi dua kolom, dengan satu tajuk kolom sebagai ' fips'dan yang lainnya'row' Kerangka data saya dfterlihat seperti ini: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour …
196 python  dataframe  pandas 

9
Mengubah nama kolom tertentu dalam panda DataFrame
Saya sedang mencari cara yang elegan untuk mengubah nama kolom yang ditentukan dalam a DataFrame. mainkan data ... import pandas as pd d = { 'one': [1, 2, 3, 4, 5], 'two': [9, 8, 7, 6, 5], 'three': ['a', 'b', 'c', 'd', 'e'] } df = pd.DataFrame(d) Solusi paling elegan …
195 python  pandas 


15
Bagaimana cara membaca file csv besar dengan panda?
Saya mencoba membaca file csv besar (aprox. 6 GB) dalam panda dan saya mendapatkan kesalahan memori: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: Ada bantuan untuk ini?
194 python  pandas  csv  memory  chunks 

10
panda tiga arah bergabung dengan banyak dataframe pada kolom
Saya memiliki 3 file CSV. Masing-masing memiliki kolom pertama sebagai nama (string) orang, sedangkan semua kolom lainnya di setiap bingkai data adalah atribut orang tersebut. Bagaimana saya bisa "bergabung" bersama ketiga dokumen CSV untuk membuat CSV tunggal dengan setiap baris memiliki semua atribut untuk setiap nilai unik dari nama string …
191 python  pandas  join  merge 

4
Python panda Menyaring nan dari pemilihan data kolom string
Tanpa menggunakan groupbybagaimana cara saya menyaring data tanpa NaN? Katakanlah saya memiliki matriks di mana pelanggan akan mengisi 'N / A', 'n / a' atau variasinya dan yang lain membiarkannya kosong: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol', 'mol', 'lob', 'lob'], 'rating': [3., …
190 python  pandas  dataframe 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.