Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.

9
Impor file CSV sebagai DataFrame pandas
Apa cara Python untuk membaca dalam file CSV menjadi pandas DataFrame (yang kemudian dapat saya gunakan untuk operasi statistik, dapat memiliki kolom dengan tipe berbeda, dll.)? File CSV saya "value.txt"memiliki konten berikut: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 Di R kita akan membaca file ini dengan menggunakan: price …
91 python  pandas  csv  dataframe 

6
memilih dari panda multi-indeks
Saya memiliki bingkai data multi-indeks dengan kolom 'A' dan 'B'. Apakah ada cara untuk memilih baris dengan memfilter pada satu kolom multi-indeks tanpa menyetel ulang indeks ke indeks satu kolom? Sebagai contoh. # has multi-index (A,B) df #can I do this? I know this doesn't work because the index is …


5
bagaimana cara membagi kolom tupel di pandas dataframe?
Saya memiliki kerangka data panda (ini hanya sebagian kecil) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV \ …

5
Buat DataFrame pandas dari item dalam kamus bertingkat
Misalkan saya memiliki kamus bersarang 'user_dict' dengan struktur: Level 1: UserId (Long Integer) Level 2: Kategori (String) Level 3: Atribut Aneka (float, int, dll ..) Misalnya, entri kamus ini adalah: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} setiap item user_dictmemiliki struktur yang …

5
Spark DataFrame groupBy dan urutkan dalam urutan menurun (pyspark)
Saya menggunakan pyspark (Python 2.7.9 / Spark 1.3.1) dan memiliki GroupObject dataframe yang perlu saya filter & urutkan dalam urutan menurun. Mencoba mencapainya melalui potongan kode ini. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Tapi itu melempar kesalahan berikut. sort() got an unexpected keyword argument 'ascending'

13
Membandingkan dua kerangka data dan mendapatkan perbedaannya
Saya memiliki dua dataframe. Contoh: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …



3
Pisahkan kerangka data yang besar menjadi daftar bingkai data berdasarkan nilai umum di kolom
Saya memiliki bingkai data dengan 10 kolom, mengumpulkan tindakan "pengguna", di mana salah satu kolom berisi ID (tidak unik, mengidentifikasi pengguna) (kolom 10). panjang bingkai data sekitar 750000 baris. Saya mencoba untuk mengekstrak frame data individu (sehingga mendapatkan daftar atau vektor frame data) yang dipisahkan oleh kolom yang berisi pengenal …

1
Terapkan fungsi ke setiap sel di DataFrame
Saya memiliki kerangka data yang mungkin terlihat seperti ini: A B C foo bar foo bar bar foo foo bar Saya ingin melihat setiap elemen dari setiap baris (atau setiap elemen dari setiap kolom) dan menerapkan fungsi berikut untuk mendapatkan DF berikutnya: def foo_bar(x): return x.replace('foo', 'wow') A B C …

5
Ubah Named Character Vector menjadi data.frame
Saya memiliki vektor karakter bernama yang dikembalikan dari xmlAttrs seperti ini: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Saya ingin mengubahnya menjadi bingkai data yang terlihat seperti ini: testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71


5
Hapus dan kembalikan nilai nilai untuk setiap variabel?
Saya memiliki kerangka data yang mencatat respons dari pilihan bahasa pemrograman 19717 orang melalui pertanyaan pilihan ganda. Kolom pertama tentu saja jenis kelamin responden sementara sisanya adalah pilihan yang mereka pilih. Dan karenanya jika saya memilih Python maka respons saya akan dicatat dalam kolom Python dan bukan bash dan sebaliknya. …


Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.