Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.

3
Dapatkan jarak terdekat dengan dua geodataframe di panda
Ini adalah geodatframe pertama saya: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) City1 …


3
Mengapa menugaskan dengan [:] versus iloc [:] menghasilkan hasil yang berbeda dalam panda?
Saya sangat bingung dengan metode pengindeksan yang berbeda menggunakan ilocdi panda. Katakanlah saya sedang mencoba mengubah 1-d Dataframe menjadi 2-d Dataframe. Pertama saya memiliki Dataframe 1-d berikut a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T Dan saya akan mengubahnya menjadi 2-d Dataframe dengan ukuran 2x4. Saya mulai dengan menetapkan 2-d Dataframe sebagai …

3
Panda lambat DataFrame MultiIndex reindex
Saya memiliki DataFrame panda dalam bentuk: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 2019-12-01 00:51:14+00:00 …

1
Cara pivot dataframe yang terdiri dari kolom dengan bagian dan sub bagian di R
Saya memiliki kerangka data yang disebutkan di bawah ini: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", …

2
Hasilkan produk kartesian biner yang difilter
Pernyataan masalah Saya mencari cara yang efisien untuk menghasilkan produk kartesian biner penuh (tabel dengan semua kombinasi Benar dan Salah dengan sejumlah kolom), difilter oleh kondisi eksklusif tertentu. Sebagai contoh, untuk tiga kolom / bit n=3kita akan mendapatkan tabel lengkap df_combs = pd.DataFrame(itertools.product(*([[True, False]] * n))) 0 1 2 0 …



6
mengidentifikasi dan menandai baris duplikat di r
Saya ingin mengidentifikasi dan menandai baris duplikat berdasarkan 2 kolom. Saya ingin membuat pengidentifikasi unik untuk setiap duplikat jadi saya tahu bukan hanya barisnya adalah duplikat, tetapi baris mana yang merupakan duplikat dengannya. Saya memiliki kerangka data yang terlihat seperti di bawah ini dengan beberapa pasangan item duplikat (saat cocok …
11 r  dataframe 


6
menggabungkan dataframe berdasarkan beberapa kolom dan ambang batas
Saya memiliki dua data.frames dengan beberapa kolom yang umum (di sini: date, city, ctry, dan ( other_) number). Sekarang saya ingin menggabungkan mereka pada kolom di atas tetapi mentolerir beberapa tingkat perbedaan: threshold.numbers <- 3 threshold.date <- 5 # in days Jika perbedaan antara dateentri adalah > threshold.date(dalam hari) atau …
11 r  dataframe 


6
AttributeError: objek 'DataFrame' tidak memiliki atribut 'ix'
Saya mendapatkan kesalahan di atas ketika saya mencoba menggunakan atribut .ix dari dataframe panda untuk mengeluarkan kolom, misalnya df.ix [:, 'col_header']. Script bekerja pada pagi ini, tetapi sore ini saya menjalankannya di lingkungan linux baru dengan instalasi baru Pandas. Adakah orang lain yang melihat kesalahan ini sebelumnya? Saya sudah mencari …

3
Lepaskan hanya sebagian kolom dari bingkai data panda
Saya memiliki contoh dataframe berikut: df = pd.DataFrame(data = {'RecordID' : [1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5], 'DisplayLabel' : ['Source','Test','Value 1','Value 2','Value3','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2'], 'Value' : ['Web','Logic','S','I','Complete','Person','Voice','>20','P','Mail','OCR','A','I','Dictation','Understandable','S','I','Web','Logic','R','S']}) yang menciptakan kerangka data ini: +-------+----------+---------------+----------------+ | Index | RecordID | Display Label | Value | +-------+----------+---------------+----------------+ | 0 | 1 | …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.