Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.


10
Perbedaan antara peta, applymap, dan metode penerapan di Panda
Bisakah Anda memberi tahu saya kapan harus menggunakan metode vektorisasi ini dengan contoh-contoh dasar? Saya melihat itu mapadalah Seriesmetode sedangkan sisanya adalah DataFramemetode. Saya bingung tentang applydan applymapmetode. Mengapa kita memiliki dua metode untuk menerapkan fungsi ke DataFrame? Sekali lagi, contoh sederhana yang menggambarkan penggunaan akan sangat bagus!

15
Konversi panda dataframe ke array NumPy
Saya tertarik mengetahui cara mengubah kerangka data panda menjadi array NumPy. bingkai data: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = …

5
Membuat DataFrame Pandas kosong, lalu mengisinya?
Saya mulai dari dokumen DataFrame panda di sini: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Saya ingin secara iteratif mengisi DataFrame dengan nilai-nilai dalam jenis perhitungan time series. Jadi pada dasarnya, saya ingin menginisialisasi DataFrame dengan kolom A, B dan baris timestamp, semua 0 atau semua NaN. Saya kemudian akan menambahkan nilai awal dan memeriksa data …
463 python  dataframe  pandas 

24
Cara menghitung nilai NaN di kolom di panda DataFrame
Saya memiliki data, di mana saya ingin menemukan jumlah NaN, sehingga jika kurang dari beberapa ambang batas, saya akan menjatuhkan kolom ini. Saya melihat, tetapi tidak dapat menemukan fungsi untuk ini. ada value_counts, tetapi akan lambat bagi saya, karena sebagian besar nilai berbeda dan saya hanya ingin menghitung NaN.
463 python  pandas  dataframe 



11
Pilih dengan string parsial dari DataFrame panda
Saya punya DataFramedengan 4 kolom yang 2 berisi nilai string. Saya bertanya-tanya apakah ada cara untuk memilih baris berdasarkan kecocokan string parsial terhadap kolom tertentu? Dengan kata lain, fungsi atau fungsi lambda yang akan melakukan sesuatu seperti re.search(pattern, cell_in_question) mengembalikan boolean. Saya kenal dengan sintaks df[df['A'] == "hello world"]tetapi sepertinya …


7
Dapatkan statistik untuk setiap grup (seperti jumlah, rata-rata, dll) menggunakan panda GroupBy?
Saya memiliki bingkai data dfdan saya menggunakan beberapa kolom dari itu ke groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Dengan cara di atas saya hampir mendapatkan tabel (frame data) yang saya butuhkan. Yang hilang adalah kolom tambahan yang berisi jumlah baris di setiap grup. Dengan kata lain, saya memiliki maksud tetapi saya juga ingin tahu …

7
Cara memfilter dataframe Pandas menggunakan 'in' dan 'not in' seperti di SQL
Bagaimana saya bisa mencapai setara dengan SQL INdan NOT IN? Saya memiliki daftar dengan nilai yang diperlukan. Inilah skenarionya: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Cara saya saat ini melakukan ini adalah sebagai berikut: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') …

18
UnicodeDecodeError saat membaca file CSV di Pandas dengan Python
Saya menjalankan program yang sedang memproses 30.000 file serupa. Sejumlah acak dari mereka berhenti dan menghasilkan kesalahan ini ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, …


16
Mengubah nama kolom dari bingkai data
Saya memiliki kerangka data yang disebut "harga baru" (lihat di bawah) dan saya ingin mengubah nama kolom dalam program saya di R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 Sebenarnya inilah yang saya lakukan: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Saya belum menempatkan …
399 r  dataframe  rename 

6
Memilih deretan seri panda / bingkai data berdasarkan indeks integer
Saya ingin tahu mengapa df[2]tidak didukung, sementara df.ix[2]dan df[2:3]keduanya berfungsi. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Saya berharap df[2]untuk bekerja dengan cara yang sama df[2:3]agar konsisten dengan konvensi …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.