Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.


9
Judul atau nama kolom indeks panda
Bagaimana cara mendapatkan nama kolom indeks dalam python panda? Berikut ini contoh bingkai data: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 Apa yang saya coba lakukan adalah mendapatkan / mengatur judul indeks dataframe. Inilah yang saya coba: import pandas as pd data = {'Column 1' …

15
Membagi kolom string bingkai data menjadi beberapa kolom
Saya ingin mengambil data formulir before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 dan gunakan split()pada kolom " type" dari atas untuk mendapatkan sesuatu seperti ini: attr type_1 type_2 1 1 foo bar 2 30 foo bar_2 3 …
245 r  string  dataframe  split  r-faq 

6
Mengapa panda saya 'berlaku' fungsi referensi beberapa kolom berfungsi? [Tutup]
Tutup. Pertanyaan ini tidak dapat direproduksi atau disebabkan oleh kesalahan ketik . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga sesuai topik untuk Stack Overflow. Ditutup tahun lalu . Perbaiki pertanyaan ini Saya memiliki beberapa masalah dengan fungsi berlaku Pandas, ketika menggunakan beberapa kolom dengan kerangka …


12
panda mendapatkan baris yang TIDAK ada dalam bingkai data lain
Saya punya dua bingkai data panda yang memiliki beberapa baris yang sama. Misalkan dataframe2 adalah subset dari dataframe1. Bagaimana saya bisa mendapatkan baris dataframe1 yang tidak ada di dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 = pandas.DataFrame(data …
229 python  pandas  dataframe 

19
Normalisasi kolom bingkai data panda
Saya memiliki dataframe dalam panda di mana setiap kolom memiliki rentang nilai yang berbeda. Sebagai contoh: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Adakah yang tahu bagaimana saya bisa menormalkan kolom-bingkai dataframe ini di mana setiap nilai antara 0 dan 1? Output yang saya …



8
Perbarui bingkai data dalam panda saat iterasi baris demi baris
Saya memiliki bingkai data panda yang terlihat seperti ini (ini yang cukup besar) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American M 528.205 2014-04-19 1096 2014-03-17 American M 528.205 2014-05-17 sekarang saya …

7
Apa perbedaan antara bergabung dan bergabung di Panda?
Misalkan saya memiliki dua DataFrames seperti itu: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Saya ingin menggabungkan mereka, jadi saya mencoba sesuatu seperti ini: pd.merge(left, right, left_on='key1', right_on='key2') Dan saya senang key1 lval key2 rval 0 foo 1 foo 4 1 …
208 python  pandas  dataframe  join 

7
Kelompok Panda-oleh dan jumlah
Saya menggunakan bingkai data ini: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes …

13
Bagaimana cara menampilkan konten kolom lengkap dalam Spark Dataframe?
Saya menggunakan spark-csv untuk memuat data ke dalam DataFrame. Saya ingin melakukan kueri sederhana dan menampilkan konten: val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv") df.registerTempTable("tasks") results = sqlContext.sql("select col from tasks"); results.show() Col tampaknya terpotong: scala> results.show(); +--------------------+ | col| +--------------------+ |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 …


17
Mendeteksi dan mengecualikan pencilan dalam bingkai data Pandas
Saya memiliki bingkai data panda dengan beberapa kolom. Sekarang saya tahu bahwa baris tertentu outlier berdasarkan nilai kolom tertentu. Misalnya kolom 'Vol' memiliki semua nilai sekitar 12xxdan satu nilai adalah 4000(outlier). Sekarang saya ingin mengecualikan baris-baris yang memiliki Volkolom seperti ini. Jadi, pada dasarnya saya perlu meletakkan filter pada bingkai …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.