Pertanyaan yang diberi tag «pandas»

panda adalah pustaka python untuk manipulasi dan analisis Data Panel, misalnya deret waktu multidimensi dan set data cross-sectional yang biasa ditemukan dalam statistik, hasil sains eksperimental, ekonometrik, atau keuangan.

2
Kapan harus memilih regresi linier atau Pohon Keputusan atau regresi Hutan Acak? [Tutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 4 tahun yang lalu . Saya sedang mengerjakan suatu proyek dan saya mengalami kesulitan dalam menentukan algoritma mana yang …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 


1
Perbedaan antara interpolasi () dan fillna () dalam panda
Karena metode interpolasi dan fillna melakukan pekerjaan yang sama untuk mengisi nilai-nilai na. Apa perbedaan mendasar antara keduanya. Apa pentingnya memiliki dua metode yang berbeda ini ?? Adakah yang bisa menjelaskan saya dalam istilah awam. Saya sudah mengunjungi melalui dokumentasi resmi dan ingin tahu bedanya

3
Meningkatkan kecepatan penyaringan dataframe Pandas
Saya memiliki dataset dengan 19 kolom dan sekitar 250rb baris. Saya telah bekerja dengan kumpulan data yang lebih besar, tetapi kali ini, Pandas memutuskan untuk bermain dengan saraf saya. Saya mencoba untuk membagi dataset asli menjadi 3 sub-dataframe berdasarkan beberapa aturan sederhana. Namun, butuh waktu lama untuk mengeksekusi kode. Sekitar …


2
Menghitung indeks dalam panda
Saya merasa ini adalah pertanyaan yang belum sempurna tetapi saya sangat baru dalam hal ini dan belum bisa memecahkannya / temukan jawabannya. Pada akhirnya apa yang saya coba lakukan di sini adalah untuk menghitung nilai unik pada kolom tertentu dan kemudian menentukan nilai unik mana yang memiliki lebih dari satu …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.