Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.



7
Menulis panda DataFrame ke file CSV
Saya memiliki dataframe dalam panda yang ingin saya tulis ke file CSV. Saya melakukan ini menggunakan: df.to_csv('out.csv') Dan mendapatkan kesalahan: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Apakah ada cara untuk menyiasatinya dengan mudah (yaitu saya memiliki karakter unicode dalam bingkai data saya)? …
715 python  csv  pandas  dataframe 

8
Ubah daftar kamus menjadi panda DataFrame
Saya punya daftar kamus seperti ini: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] Dan saya ingin mengubah ini menjadi panda DataFrameseperti ini: month points points_h1 time year 0 NaN 50 NaN 5:00 2010 1 february 25 NaN …

10
Cukup cetak seluruh Seri Panda / DataFrame
Saya sering bekerja dengan Series dan DataFrames di terminal. Default __repr__untuk Seri mengembalikan sampel yang dikurangi, dengan beberapa nilai kepala dan ekor, tetapi sisanya hilang. Apakah ada cara bawaan untuk cukup mencetak seluruh Seri / DataFrame? Idealnya, itu akan mendukung perataan yang tepat, mungkin berbatasan antara kolom, dan bahkan mungkin …
654 python  pandas  dataframe 

3
Bagaimana iloc, ix, dan loc berbeda?
Adakah yang bisa menjelaskan bagaimana ketiga metode mengiris ini berbeda? Saya telah melihat dokumen , dan saya telah melihat jawaban ini , tetapi saya masih tidak dapat menjelaskan bagaimana ketiganya berbeda. Bagi saya, mereka tampaknya dapat dipertukarkan sebagian besar, karena mereka berada di tingkat yang lebih rendah. Misalnya, kita ingin …

15
Bagaimana cara menangani SettingWithCopyWarning di Pandas?
Latar Belakang Saya baru saja memutakhirkan Panda saya dari 0,11 ke 0,13.0rc1. Sekarang, aplikasi tersebut mengeluarkan banyak peringatan baru. Salah satunya seperti ini: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE …

14
Turunkan tingkat faktor dalam bingkai data yang disubsidi
Saya memiliki bingkai data yang mengandung a factor. Saat saya membuat subset dari subsetkerangka data ini menggunakan atau fungsi pengindeksan lainnya, bingkai data baru dibuat. Namun, factorvariabel mempertahankan semua level aslinya, bahkan ketika / jika mereka tidak ada dalam kerangka data baru. Ini menyebabkan masalah ketika melakukan faceted plotting atau …
543 r  dataframe  r-factor  r-faq 


20
Konversi daftar menjadi bingkai data
Saya memiliki daftar data bersarang. Panjangnya adalah 132 dan setiap item adalah daftar panjangnya 20. Apakah ada cara cepat untuk mengubah struktur ini menjadi kerangka data yang memiliki 132 baris dan 20 kolom data? Berikut ini beberapa contoh data untuk digunakan: l <- replicate( 132, list(sample(letters, 20)), simplify = FALSE …
513 r  list  dataframe 

11
Cepat membaca tabel yang sangat besar sebagai kerangka data
Saya memiliki tabel yang sangat besar (30 juta baris) yang ingin saya muat sebagai dataframe di R. read.table()memiliki banyak fitur yang mudah, tetapi sepertinya ada banyak logika dalam implementasi yang akan memperlambat segalanya. Dalam kasus saya, saya berasumsi saya tahu jenis kolom sebelumnya, tabel tidak berisi judul kolom atau nama …
504 r  import  dataframe  r-faq 




16
Buat data.frame kosong
Saya mencoba menginisialisasi data.frame tanpa baris. Pada dasarnya, saya ingin menentukan tipe data untuk setiap kolom dan menamainya, tetapi hasilnya tidak ada baris yang dibuat. Yang terbaik yang bisa saya lakukan sejauh ini adalah sesuatu seperti: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] Yang membuat data.frame dengan …
480 r  dataframe  r-faq 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.