Pertanyaan yang diberi tag «performance»

12
Seberapa besar data besar?
Banyak orang menggunakan istilah data besar dalam cara yang agak komersial , sebagai sarana untuk menunjukkan bahwa kumpulan data besar terlibat dalam perhitungan, dan karenanya solusi potensial harus memiliki kinerja yang baik. Tentu saja, big data selalu membawa istilah yang terkait, seperti skalabilitas dan efisiensi, tetapi apa sebenarnya yang mendefinisikan …

4
Apakah ada cara mudah untuk menjalankan panda. DataFrame.isin secara paralel?
Saya memiliki program pemodelan dan penilaian yang banyak menggunakan DataFrame.isin fungsi panda, mencari melalui daftar facebook "seperti" catatan pengguna individu untuk masing-masing dari beberapa ribu halaman tertentu. Ini adalah bagian yang paling memakan waktu dari program, lebih dari pemodelan atau penilaian, hanya karena hanya berjalan pada satu inti sedangkan sisanya …

3
Bagaimana Anda mengelola harapan di tempat kerja?
Dengan semua kehebohan tentang Ilmu Data, Pembelajaran Mesin, dan semua kisah sukses di sekitarnya, ada banyak harapan yang dibenarkan, juga terlalu banyak, dari Ilmuwan Data dan model prediksi mereka. Pertanyaan saya untuk berlatih Ahli Statistik, ahli Pembelajaran Mesin, dan Ilmuwan Data adalah - bagaimana Anda mengelola harapan dari para pebisnis …


3
Mengukur kinerja berbagai pengklasifikasi dengan ukuran sampel yang berbeda
Saat ini saya menggunakan beberapa pengklasifikasi yang berbeda pada berbagai entitas yang diekstraksi dari teks, dan menggunakan presisi / mengingat sebagai ringkasan seberapa baik kinerja masing-masing pengklasifikasi yang terpisah di seluruh dataset yang diberikan. Saya bertanya-tanya apakah ada cara yang berarti untuk membandingkan kinerja pengklasifikasi ini dengan cara yang sama, …

4
Ukuran kinerja: Mengapa disebut recall?
presisi adalah fraksi dari instance yang diambil yang relevan, sedangkan recall (juga dikenal sebagai sensitivitas) adalah fraksi dari instance yang relevan yang diambil. Saya tahu artinya tetapi saya tidak tahu mengapa itu disebut recall ? Saya bukan penutur asli bahasa Inggris. Saya tahu mengingat berarti mengingat, maka saya tidak tahu …

3
Bahasa terbaik untuk komputasi ilmiah [ditutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Sepertinya sebagian besar bahasa memiliki sejumlah perpustakaan komputasi ilmiah yang tersedia. Python memiliki Scipy …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 



3
Meningkatkan kecepatan penyaringan dataframe Pandas
Saya memiliki dataset dengan 19 kolom dan sekitar 250rb baris. Saya telah bekerja dengan kumpulan data yang lebih besar, tetapi kali ini, Pandas memutuskan untuk bermain dengan saraf saya. Saya mencoba untuk membagi dataset asli menjadi 3 sub-dataframe berdasarkan beberapa aturan sederhana. Namun, butuh waktu lama untuk mengeksekusi kode. Sekitar …


1
Mengapa pelatihan RNN tidak menggunakan 100% GPU?
Saya bertanya-tanya mengapa pelatihan RNN biasanya tidak menggunakan 100% GPU. Misalnya, jika saya menjalankan benchmark RNN ini pada Maxwell Titan X di Ubuntu 14.04.4 LTS x64, utilisasi GPU di bawah 90%: Tolok ukur diluncurkan menggunakan perintah: python rnn.py -n 'fastlstm' -l 1024 -s 30 -b 128 Bagaimana saya bisa mendiagnosis …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.