Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.

4
datetime dtypes di pandas read_csv
Saya membaca di file csv dengan beberapa kolom datetime. Saya perlu mengatur tipe data setelah membaca di file, tetapi datetimes tampaknya menjadi masalah. Misalnya: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Ketika dijalankan memberikan kesalahan: TypeError: tipe data "datetime" tidak …

10
Simpan Dataframe ke csv langsung ke s3 Python
Saya memiliki DataFrame panda yang ingin saya unggah ke file CSV baru. Masalahnya adalah saya tidak ingin menyimpan file secara lokal sebelum mentransfernya ke s3. Apakah ada metode seperti to_csv untuk menulis dataframe ke s3 secara langsung? Saya menggunakan boto3. Inilah yang saya miliki sejauh ini: import boto3 s3 = …

4
Bagaimana membentuk kolom tupel dari dua kolom di Pandas
Saya punya Pandas DataFrame dan saya ingin menggabungkan kolom 'lat' dan 'long' untuk membentuk tupel. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null …

12
data.frame baris ke daftar
Saya memiliki data.frame yang ingin saya ubah menjadi daftar per baris, yang berarti setiap baris akan sesuai dengan elemen daftarnya sendiri. Dengan kata lain, saya ingin daftar yang sepanjang data.frame memiliki baris. Sejauh ini, saya telah mengatasi masalah ini dengan cara berikut, tetapi saya bertanya-tanya apakah ada cara yang lebih …
123 list  r  dataframe 


3
Temukan nama kolom yang memiliki nilai maksimum untuk setiap baris
Saya memiliki DataFrame seperti ini: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Disini saya ingin bertanya bagaimana cara mendapatkan nama kolom yang …
123 python  pandas  dataframe  max 


7
Cara menambahkan baris ke bingkai data R.
Saya telah melihat-lihat StackOverflow, tetapi saya tidak dapat menemukan solusi khusus untuk masalah saya, yang melibatkan penambahan baris ke bingkai data R. Saya menginisialisasi bingkai data 2 kolom kosong, sebagai berikut. df = data.frame(x = numeric(), y = character()) Kemudian, tujuan saya adalah untuk mengulang melalui daftar nilai dan, di …
121 r  merge  append  dataframe  rows 

8
Pilih kolom bingkai data secara dinamis menggunakan $ dan nilai karakter
Saya memiliki vektor nama kolom yang berbeda dan saya ingin dapat mengulang masing-masing untuk mengekstrak kolom itu dari data.frame. Misalnya, pertimbangkan kumpulan data mtcarsdan beberapa nama variabel yang disimpan dalam vektor karakter cols. Ketika saya mencoba untuk memilih variabel dari mtcarsmenggunakan subset dinamis cols, setelah pekerjaan ini cols <- c("mpg", …
121 r  dataframe  r-faq 

3
mendapatkan indeks baris dalam fungsi pandas apply
Saya mencoba mengakses indeks baris dalam fungsi yang diterapkan di seluruh DataFramePandas. Saya punya sesuatu seperti ini: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 dan saya akan mendefinisikan fungsi yang mengakses elemen dengan baris tertentu def rowFunc(row): return row['a'] + …
121 python  pandas  dataframe 

14
Hitung jumlah baris dalam setiap kelompok
Saya memiliki kerangka data dan saya ingin menghitung jumlah baris dalam setiap grup. Saya biasanya menggunakan aggregatefungsi untuk menjumlahkan data sebagai berikut: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Sekarang, saya ingin menghitung pengamatan tetapi tidak dapat menemukan argumen yang tepat FUN. Secara intuitif, saya pikir …
121 r  dataframe  aggregate  r-faq 


5
Meneruskan nama kolom data.frame ke suatu fungsi
Saya mencoba menulis fungsi untuk menerima data.frame ( x) dan columndari itu. Fungsi ini melakukan beberapa kalkulasi pada x dan kemudian mengembalikan data.frame lain. Saya terjebak pada metode praktik terbaik untuk meneruskan nama kolom ke fungsi. Dua contoh minimal fun1dan di fun2bawah ini menghasilkan hasil yang diinginkan, dapat melakukan operasi …
119 r  dataframe  r-faq 

1
Aturan apa yang digunakan Panda untuk menghasilkan tampilan vs salinan?
Saya bingung tentang aturan yang digunakan Panda saat memutuskan bahwa pilihan dari kerangka data adalah salinan dari kerangka data asli, atau tampilan pada aslinya. Jika saya punya, misalnya, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Saya mengerti bahwa querymengembalikan salinan sehingga sesuatu seperti foo = df.query('2 < index <= 5') foo.loc[:,'E'] = …

3
Bagaimana cara menguji apakah sebuah string berisi salah satu substring dalam daftar, di panda?
Apakah ada fungsi yang setara dengan kombinasi df.isin()dan df[col].str.contains()? Sebagai contoh, katakanlah saya memiliki seri s = pd.Series(['cat','hat','dog','fog','pet']), dan saya ingin menemukan semua tempat yang sberisi salah satu ['og', 'at'], saya ingin mendapatkan semuanya kecuali 'hewan peliharaan'. Saya punya solusi, tapi agak janggal: searchfor = ['og', 'at'] found = [s.str.contains(x) …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.