Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.

12
Mengganti nilai kosong (spasi putih) dengan NaN dalam panda
Saya ingin menemukan semua nilai dalam kerangka data Pandas yang berisi spasi putih (jumlah sembarang) dan mengganti nilai-nilai itu dengan NaNs. Adakah ide bagaimana hal ini dapat diperbaiki? Pada dasarnya saya ingin mengubah ini: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 …
150 python  pandas  dataframe 

11
Hapus kolom dari kerangka data di mana SEMUA nilai adalah NA
Saya mengalami masalah dengan kerangka data dan saya sendiri tidak bisa menyelesaikan masalah itu: Kerangka data memiliki sifat sewenang-wenang sebagai kolom dan setiap baris mewakili satu set data . Pertanyaannya adalah: Bagaimana cara menyingkirkan kolom di mana untuk SEMUA baris nilainya NA ?
149 r  apply  dataframe 

2
Pilih baris di pandas MultiIndex DataFrame
Apa cara pandas paling umum untuk memilih / memfilter baris dataframe yang indeksnya adalah MultiIndex ? Mengiris berdasarkan satu nilai / label Mengiris berdasarkan beberapa label dari satu atau lebih level Pemfilteran pada kondisi dan ekspresi boolean Metode mana yang dapat diterapkan dalam keadaan apa Asumsi untuk kesederhanaan: input dataframe …


7
Pandna dataframe fillna () hanya beberapa kolom di tempat
Saya mencoba untuk mengisi nilai dalam dataframe Pandas dengan 0 untuk hanya beberapa subset kolom. Ketika saya melakukannya: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, inplace=True) print df Hasil: a b c 0 1.0 4.0 NaN 1 2.0 5.0 NaN 2 3.0 NaN 7.0 3 NaN 6.0 …
144 python  pandas  dataframe 


8
Bagaimana cara memilih baris pertama dari setiap grup?
Saya memiliki DataFrame yang dihasilkan sebagai berikut: df.groupBy($"Hour", $"Category") .agg(sum($"value") as "TotalValue") .sort($"Hour".asc, $"TotalValue".desc)) Hasilnya terlihat seperti: +----+--------+----------+ |Hour|Category|TotalValue| +----+--------+----------+ | 0| cat26| 30.9| | 0| cat13| 22.1| | 0| cat95| 19.6| | 0| cat105| 1.3| | 1| cat67| 28.5| | 1| cat4| 26.8| | 1| cat13| 12.6| | 1| …




2
Bagaimana cara menambahkan kolom konstan dalam Spark DataFrame?
Saya ingin menambahkan kolom dalam DataFramedengan nilai arbitrer (sama untuk setiap baris). Saya mendapatkan kesalahan saat menggunakan withColumnsebagai berikut: dt.withColumn('new_column', 10).head(5) --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-50-a6d0257ca2be> in <module>() 1 dt = (messages 2 .select(messages.fromuserid, messages.messagetype, floor(messages.datetime/(1000*60*5)).alias("dt"))) ----> 3 dt.withColumn('new_column', 10).head(5) /Users/evanzamir/spark-1.4.1/python/pyspark/sql/dataframe.pyc in withColumn(self, colName, col) 1166 [Row(age=2, …

7
Temukan kolom yang namanya berisi string tertentu
Saya memiliki kerangka data dengan nama kolom, dan saya ingin menemukan yang berisi string tertentu, tetapi tidak sama persis dengan itu. Aku mencari 'spike'di kolom nama seperti 'spike-2', 'hey spike', 'spiked-in'(yang 'spike'bagian selalu terus-menerus). Saya ingin nama kolom dikembalikan sebagai string atau variabel, jadi saya mengakses kolom nanti dengan df['name']atau …

5
Bingkai data panda mendapatkan baris pertama dari setiap grup
Saya punya panda DataFrameseperti berikut. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Saya ingin mengelompokkan ini berdasarkan ["id", "value"] dan mendapatkan baris pertama dari setiap grup. id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 first …
137 python  pandas  dataframe 

6
panda dataframe kolom scaling dengan sklearn
Saya memiliki kerangka data panda dengan kolom tipe campuran, dan saya ingin menerapkan min_max_scaler sklearn ke beberapa kolom. Idealnya, saya ingin melakukan transformasi ini di tempat, tetapi belum menemukan cara untuk melakukan itu. Saya telah menulis kode berikut yang berfungsi: import pandas as pd import numpy as np from sklearn …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.