Pertanyaan yang diberi tag «dataframe»

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.

13
Bagaimana cara menghitung jumlah kemunculan karakter tertentu di setiap baris kolom string?
Saya memiliki data.frame di mana variabel tertentu berisi string teks. Saya ingin menghitung jumlah kemunculan karakter tertentu di setiap string individu. Contoh: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Saya ingin membuat kolom baru untuk q.data dengan jumlah kemunculan "a" dalam string (mis. C (2,1,0)). Satu-satunya pendekatan berbelit-belit yang berhasil saya lakukan adalah: …
103 regex  r  dataframe 

5
bagaimana mengubah kolom Dataframe dari tipe String ke tipe Double di pyspark
Saya memiliki dataframe dengan kolom sebagai String. Saya ingin mengubah tipe kolom menjadi tipe Double di PySpark. Berikut caranya, saya lakukan: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Hanya ingin tahu, apakah ini cara yang tepat untuk melakukannya karena saat menjalankan Regresi Logistik, saya mendapatkan beberapa kesalahan, jadi saya …

2
Kolom binning dengan python pandas
Saya memiliki kolom Data Frame dengan nilai numerik: df['percentage'].head() 46.5 44.2 100.0 42.12 Saya ingin melihat kolom sebagai jumlah bin: bins = [0, 1, 5, 10, 25, 50, 100] Bagaimana saya bisa mendapatkan hasil sebagai bin dengan mereka value counts? [0, 1] bin amount [1, 5] etc [5, 10] etc …

8
Membersihkan nilai `Inf` dari kerangka data R.
Di R, saya memiliki operasi yang membuat beberapa Infnilai ketika saya mengubah kerangka data. Saya ingin mengubah Infnilai - nilai ini menjadi NAnilai. Kode yang saya miliki lambat untuk data besar, apakah ada cara yang lebih cepat untuk melakukan ini? Katakanlah saya memiliki dataframe berikut: dat <- data.frame(a=c(1, Inf), b=c(Inf, …
101 r  dataframe  data.table 

2
Objek 'DataFrame' tidak memiliki atribut 'sort'
Saya menghadapi beberapa masalah di sini, dalam paket python saya, saya telah menginstal numpy, tetapi saya masih memiliki kesalahan ini, objek 'DataFrame' tidak memiliki atribut 'sort' Siapapun bisa memberi saya ide .. Ini kode saya: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] …

7
Cara menggeser kolom di Pandas DataFrame
Saya ingin menggeser kolom dalam Pandas DataFrame, tetapi saya belum dapat menemukan metode untuk melakukannya dari dokumentasi tanpa menulis ulang seluruh DF. Apakah ada yang tahu bagaimana melakukannya? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Output yang diinginkan: …
101 python  pandas  dataframe 

1
Cara membaca beberapa baris pertama untuk bingkai data panda
Apakah ada cara bawaan untuk digunakan read_csvhanya untuk membaca nbaris pertama file tanpa mengetahui panjang baris sebelumnya? Saya memiliki file besar yang membutuhkan waktu lama untuk membaca, dan kadang-kadang hanya ingin menggunakan yang pertama, katakanlah, 20 baris untuk mendapatkan sampelnya (dan memilih untuk tidak memuat semuanya dan mengambil alih kepalanya). …
101 python  pandas  csv  dataframe 

5
Ganti Tidak Ada dengan NaN di pandas dataframe
Saya punya meja x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Saya ingin mengganti python None dengan pandas NaN. Saya mencoba: x.replace(to_replace=None, value=np.nan) Tapi saya mendapat: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed a …

6
Ubah bingkai data panda menjadi seri
Saya agak baru mengenal panda. Saya memiliki bingkai data panda yaitu 1 baris kali 23 kolom. Saya ingin mengubahnya menjadi seri? Saya bertanya-tanya apa cara paling pythonic untuk melakukan ini? Saya sudah mencoba pd.Series(myResults)tapi mengeluh ValueError: cannot copy sequence with size 23 to array axis with dimension 1. Tidaklah cukup …







Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.