Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.


8
panda menghargai beberapa kolom
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Apa cara terbaik untuk mengembalikan nilai unik 'Col1' dan 'Col2'? Output yang diinginkan adalah 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

4
Python panda: mengisi baris data baris demi baris
Tugas sederhana untuk menambahkan baris ke pandas.DataFrameobjek tampaknya sulit untuk diselesaikan. Ada 3 pertanyaan stackoverflow yang berkaitan dengan ini, tidak ada yang memberikan jawaban yang berfungsi. Inilah yang saya coba lakukan. Saya memiliki DataFrame yang saya sudah tahu bentuknya serta nama-nama baris dan kolom. >>> df = pandas.DataFrame(columns=['a','b','c','d'], index=['x','y','z']) >>> …
133 python  dataframe  row  pandas 


8
Abaikan baris yang berisi kolom khusus NA
Saya ingin tahu cara menghilangkan NAnilai dalam bingkai data, tetapi hanya di beberapa kolom saya tertarik. Sebagai contoh, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) tapi aku hanya ingin omit data mana yyang NA, oleh karena itu hasilnya harus x y z …
130 r  dataframe  na 



5
R - Menggabungkan dua kerangka data?
Diberikan dua kerangka data adan b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570 1.7916780 4 -1.3645337 1.3642276 5 -0.4954542 -0.6660001 …

10
Bagaimana cara menambahkan baris ke bingkai data di R?
Di R, bagaimana Anda menambahkan baris baru ke bingkai data setelah bingkai data telah diinisialisasi? Sejauh ini saya punya ini: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- data.frame("hola", "ciao") merge(df, de) # Adds to the …
129 r  dataframe 


9
Bagaimana cara menambahkan kolom baru ke Spark DataFrame (menggunakan PySpark)?
Saya memiliki Spark DataFrame (menggunakan PySpark 1.5.1) dan ingin menambahkan kolom baru. Saya telah mencoba yang berikut ini tetapi tidak berhasil: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, columns=['new_col']) spark_new_col = sqlContext.createDataFrame(new_col) my_df_spark.withColumn("hours", spark_new_col["new_col"]) Juga mendapat kesalahan menggunakan ini: my_df_spark.withColumn("hours", sc.parallelize(randomed_hours)) Jadi …

4
Gabungkan daftar kerangka data panda
Saya memiliki daftar kerangka data Pandas yang ingin saya gabungkan menjadi satu kerangka data Pandas. Saya menggunakan Python 2.7.10 dan Pandas 0.16.2 Saya membuat daftar kerangka data dari: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000): dfs.append(chunk) Ini …

5
Tambahkan tanggal yang hilang ke bingkai data panda
Data saya dapat memiliki beberapa acara pada tanggal tertentu atau NO acara pada tanggal tertentu. Saya mengambil peristiwa ini, menghitung berdasarkan tanggal dan memplotnya. Namun, ketika saya memplotnya, kedua seri saya tidak selalu cocok. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() Dalam kode di atas idx menjadi kisaran katakanlah 30 …
128 python  date  plot  pandas  dataframe 



Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.