Pemrograman dataframe

9

Apa cara Python untuk membaca dalam file CSV menjadi pandas DataFrame (yang kemudian dapat saya gunakan untuk operasi statistik, dapat memiliki kolom dengan tipe berbeda, dll.)? File CSV saya "value.txt"memiliki konten berikut: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 Di R kita akan membaca file ini dengan menggunakan: price …

91 python pandas csv dataframe

6

memilih dari panda multi-indeks

Saya memiliki bingkai data multi-indeks dengan kolom 'A' dan 'B'. Apakah ada cara untuk memilih baris dengan memfilter pada satu kolom multi-indeks tanpa menyetel ulang indeks ke indeks satu kolom? Sebagai contoh. # has multi-index (A,B) df #can I do this? I know this doesn't work because the index is …

91 python pandas dataframe multi-index

1

Di manakah dokumentasi tentang tag 'Frek' Pandas? [Tutup]

Tutup. Pertanyaan ini tidak memenuhi pedoman Stack Overflow . Saat ini tidak menerima jawaban. Ingin memperbaiki pertanyaan ini? Perbarui pertanyaan agar sesuai dengan topik Stack Overflow. Tutup 2 tahun lalu . Perbaiki pertanyaan ini Saya baru mengenal Pandas, dan sedang mencoba menggunakan date_range. Saya menemukan semua jenis hal yang baik …

91 python pandas documentation dataframe frequency

5

bagaimana cara membagi kolom tupel di pandas dataframe?

Saya memiliki kerangka data panda (ini hanya sebagian kecil) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV \ …

91 python numpy pandas dataframe tuples

5

Buat DataFrame pandas dari item dalam kamus bertingkat

Misalkan saya memiliki kamus bersarang 'user_dict' dengan struktur: Level 1: UserId (Long Integer) Level 2: Kategori (String) Level 3: Atribut Aneka (float, int, dll ..) Misalnya, entri kamus ini adalah: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} setiap item user_dictmemiliki struktur yang …

90 python pandas dataframe multi-index

5

Spark DataFrame groupBy dan urutkan dalam urutan menurun (pyspark)

Saya menggunakan pyspark (Python 2.7.9 / Spark 1.3.1) dan memiliki GroupObject dataframe yang perlu saya filter & urutkan dalam urutan menurun. Mencoba mencapainya melalui potongan kode ini. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Tapi itu melempar kesalahan berikut. sort() got an unexpected keyword argument 'ascending'

90 python apache-spark dataframe pyspark apache-spark-sql

13

Membandingkan dua kerangka data dan mendapatkan perbedaannya

Saya memiliki dua dataframe. Contoh: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …

89 python pandas dataframe

6

Bagaimana cara menambahkan sufiks (atau awalan) ke setiap nama kolom?

Saya ingin menambahkan _xsufiks ke setiap nama kolom seperti ini: featuresA = myPandasDataFrame.columns.values + '_x' Bagaimana saya melakukan ini? Selain itu, jika saya ingin menambahkan x_sebagai sufiks, bagaimana solusinya akan berubah?

89 python pandas dataframe

17

Tambahkan (sisipkan) kolom di antara dua kolom dalam data.frame

Saya memiliki bingkai data yang memiliki kolom a, b, dan c. Saya ingin menambahkan kolom baru d antara b dan c. Saya tahu saya bisa menambahkan d di akhir dengan menggunakan cbind tetapi bagaimana saya bisa memasukkannya di antara dua kolom?

89 r dataframe insert

3

Pisahkan kerangka data yang besar menjadi daftar bingkai data berdasarkan nilai umum di kolom

Saya memiliki bingkai data dengan 10 kolom, mengumpulkan tindakan "pengguna", di mana salah satu kolom berisi ID (tidak unik, mengidentifikasi pengguna) (kolom 10). panjang bingkai data sekitar 750000 baris. Saya mencoba untuk mengekstrak frame data individu (sehingga mendapatkan daftar atau vektor frame data) yang dipisahkan oleh kolom yang berisi pengenal …

88 r performance matrix split dataframe

1

Terapkan fungsi ke setiap sel di DataFrame

Saya memiliki kerangka data yang mungkin terlihat seperti ini: A B C foo bar foo bar bar foo foo bar Saya ingin melihat setiap elemen dari setiap baris (atau setiap elemen dari setiap kolom) dan menerapkan fungsi berikut untuk mendapatkan DF berikutnya: def foo_bar(x): return x.replace('foo', 'wow') A B C …

87 python pandas dataframe apply

5

Ubah Named Character Vector menjadi data.frame

Saya memiliki vektor karakter bernama yang dikembalikan dari xmlAttrs seperti ini: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Saya ingin mengubahnya menjadi bingkai data yang terlihat seperti ini: testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71

87 r dataframe vector type-conversion

7

Tambahkan kolom baru ke bingkai data berdasarkan kamus

Saya memiliki kerangka data dan kamus. Saya perlu menambahkan kolom baru ke kerangka data dan menghitung nilainya berdasarkan kamus. Pembelajaran mesin, menambahkan fitur baru berdasarkan beberapa tabel: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' : [1, 1, …

23 python pandas dataframe dictionary

5

Hapus dan kembalikan nilai nilai untuk setiap variabel?

Saya memiliki kerangka data yang mencatat respons dari pilihan bahasa pemrograman 19717 orang melalui pertanyaan pilihan ganda. Kolom pertama tentu saja jenis kelamin responden sementara sisanya adalah pilihan yang mereka pilih. Dan karenanya jika saya memilih Python maka respons saya akan dicatat dalam kolom Python dan bukan bash dan sebaliknya. …

19 python pandas dataframe

4

Membandingkan daftar dalam dua kolom dengan bijaksana secara efisien

Saat memiliki Pandaf DataFrame seperti ini: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc Tetapi dengan sekitar 100.000 entri, …

16 python pandas numpy dataframe

Pertanyaan yang diberi tag «dataframe»