Pertanyaan yang diberi tag «pandas»

Pandas adalah pustaka Python untuk manipulasi dan analisis data, misalnya kerangka data, rangkaian waktu multidimensi, dan kumpulan data cross-sectional yang biasa ditemukan dalam statistik, hasil sains eksperimental, ekonometrik, atau keuangan. Panda adalah salah satu pustaka sains data utama di Python.

11
Pilih dengan string parsial dari DataFrame panda
Saya punya DataFramedengan 4 kolom yang 2 berisi nilai string. Saya bertanya-tanya apakah ada cara untuk memilih baris berdasarkan kecocokan string parsial terhadap kolom tertentu? Dengan kata lain, fungsi atau fungsi lambda yang akan melakukan sesuatu seperti re.search(pattern, cell_in_question) mengembalikan boolean. Saya kenal dengan sintaks df[df['A'] == "hello world"]tetapi sepertinya …


7
Dapatkan statistik untuk setiap grup (seperti jumlah, rata-rata, dll) menggunakan panda GroupBy?
Saya memiliki bingkai data dfdan saya menggunakan beberapa kolom dari itu ke groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Dengan cara di atas saya hampir mendapatkan tabel (frame data) yang saya butuhkan. Yang hilang adalah kolom tambahan yang berisi jumlah baris di setiap grup. Dengan kata lain, saya memiliki maksud tetapi saya juga ingin tahu …

7
Cara memfilter dataframe Pandas menggunakan 'in' dan 'not in' seperti di SQL
Bagaimana saya bisa mencapai setara dengan SQL INdan NOT IN? Saya memiliki daftar dengan nilai yang diperlukan. Inilah skenarionya: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Cara saya saat ini melakukan ini adalah sebagai berikut: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') …

18
UnicodeDecodeError saat membaca file CSV di Pandas dengan Python
Saya menjalankan program yang sedang memproses 30.000 file serupa. Sejumlah acak dari mereka berhenti dan menghasilkan kesalahan ini ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, …

6
Bagaimana cara menghindari Python / Pandas membuat indeks dalam csv yang disimpan?
Saya mencoba untuk menyimpan csv ke folder setelah melakukan beberapa pengeditan pada file. Setiap kali saya menggunakan pd.to_csv('C:/Path of file.csv')file csv memiliki kolom indeks yang terpisah. Saya ingin menghindari pencetakan indeks ke csv. Saya mencoba: pd.read_csv('C:/Path to file to edit.csv', index_col = False) Dan untuk menyimpan file ... pd.to_csv('C:/Path to …
407 python  csv  indexing  pandas 


6
Memilih deretan seri panda / bingkai data berdasarkan indeks integer
Saya ingin tahu mengapa df[2]tidak didukung, sementara df.ix[2]dan df[2:3]keduanya berfungsi. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Saya berharap df[2]untuk bekerja dengan cara yang sama df[2:3]agar konsisten dengan konvensi …

15
Membangun panda DataFrame dari nilai dalam variabel memberikan "ValueError: Jika menggunakan semua nilai skalar, Anda harus melewati indeks"
Ini mungkin pertanyaan sederhana, tapi saya tidak tahu bagaimana melakukan ini. Katakanlah saya memiliki dua variabel sebagai berikut. a = 2 b = 3 Saya ingin membuat DataFrame dari ini: df2 = pd.DataFrame({'A':a,'B':b}) Ini menghasilkan kesalahan: ValueError: Jika menggunakan semua nilai skalar, Anda harus melewati indeks Saya mencoba ini juga: …


12
Cara menerapkan fungsi ke dua kolom bingkai data Pandas
Misalkan saya punya dfyang memiliki kolom'ID', 'col_1', 'col_2' . Dan saya mendefinisikan suatu fungsi: f = lambda x, y : my_function_expression. Sekarang saya ingin menerapkan fke dfdua kolom 'col_1', 'col_2'untuk elemen-bijaksana menghitung kolom baru 'col_3', agak seperti: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments …
368 python  pandas  dataframe 

2
Penggabungan Panda 101
Bagaimana cara melakukan ( LEFT| RIGHT| FULL) ( INNER| OUTER) bergabung dengan panda? Bagaimana cara menambahkan NaN untuk baris yang hilang setelah digabungkan? Bagaimana cara saya menyingkirkan NaN setelah bergabung? Bisakah saya menggabungkan indeks? Bergabung silang dengan panda? Bagaimana cara menggabungkan beberapa DataFrames? merge? join? concat? update? WHO? Apa? Mengapa?! …
365 python  pandas  join  merge 

2
Bagaimana cara memutar bingkai data
Apa itu inden? Bagaimana saya berputar? Apakah ini poros? Format panjang ke format lebar? Saya telah melihat banyak pertanyaan yang bertanya tentang tabel pivot. Bahkan jika mereka tidak tahu bahwa mereka bertanya tentang tabel pivot, mereka biasanya begitu. Hampir tidak mungkin untuk menulis pertanyaan dan jawaban kanonik yang mencakup semua …

11
Bagaimana cara mendapatkan nilai dari sel dataframe?
Saya telah membangun suatu kondisi yang mengekstrak tepat satu baris dari bingkai data saya: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Sekarang saya ingin mengambil nilai dari kolom tertentu: val = d2['col_name'] Tetapi sebagai hasilnya saya mendapatkan bingkai data yang berisi satu baris dan satu kolom ( yaitu …
344 python  pandas  dataframe 

30
Python Pandas Error tokenizing data
Saya mencoba menggunakan panda untuk memanipulasi file .csv tapi saya mendapatkan kesalahan ini: pandas.parser.CParserError: Kesalahan tokenizing data. C error: Diharapkan 2 bidang pada baris 3, lihat 12 Saya telah mencoba membaca panda docs, tetapi tidak menemukan apa pun. Kode saya sederhana: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) …
343 python  csv  pandas 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.