Pertanyaan yang diberi tag «bigdata»

Big data adalah istilah untuk kumpulan set data yang begitu besar dan kompleks sehingga menjadi sulit untuk diproses menggunakan alat manajemen basis data di tangan atau aplikasi pemrosesan data tradisional. Tantangannya termasuk penangkapan, kurasi, penyimpanan, pencarian, berbagi, transfer, analisis dan visualisasi.

3
Menangani set fitur yang terus meningkat
Saya sedang mengerjakan sistem deteksi penipuan. Di bidang ini, penipuan baru muncul secara teratur, sehingga fitur baru harus ditambahkan ke model secara berkelanjutan. Saya bertanya-tanya apa cara terbaik untuk menanganinya (dari perspektif proses pengembangan)? Hanya menambahkan fitur baru ke dalam vektor fitur dan melatih ulang penggolong tampaknya menjadi pendekatan yang …



3

2
Kapan harus memilih regresi linier atau Pohon Keputusan atau regresi Hutan Acak? [Tutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 4 tahun yang lalu . Saya sedang mengerjakan suatu proyek dan saya mengalami kesulitan dalam menentukan algoritma mana yang …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 


1
Perbedaan antara interpolasi () dan fillna () dalam panda
Karena metode interpolasi dan fillna melakukan pekerjaan yang sama untuk mengisi nilai-nilai na. Apa perbedaan mendasar antara keduanya. Apa pentingnya memiliki dua metode yang berbeda ini ?? Adakah yang bisa menjelaskan saya dalam istilah awam. Saya sudah mengunjungi melalui dokumentasi resmi dan ingin tahu bedanya

2
Pembelajaran Mesin Praktik Terbaik untuk Big Dataset
Saya akan lulus dari Master saya dan telah belajar tentang pembelajaran mesin serta melakukan proyek penelitian dengannya. Saya bertanya-tanya tentang praktik terbaik di industri saat melakukan tugas pembelajaran mesin dengan Kumpulan Data Besar (seperti 100-an GB atau TB). Menghargai jika sesama ilmuwan data dapat berbagi pengalaman mereka. Ini pertanyaan saya: …

1
Arti Asli dari "Kecerdasan" dalam "Kecerdasan Bisnis"
Apa istilah "Inteligensi" awalnya berdiri di "Inteligensi Bisnis" ? Apakah ini berarti sebagaimana digunakan dalam " Kecerdasan Buatan " atau seperti yang digunakan dalam " Badan Intelijen " ? Dengan kata lain, apakah " Kecerdasan Bisnis " berarti: "Bertindak cerdas & cerdas dalam bisnis" atau "Mengumpulkan data dan informasi tentang …

1
Kesalahan Bertingkat dalam Badai Apache
Melalui presentasi dan materi Summingbird oleh Twitter, salah satu alasan yang disebutkan untuk menggunakan cluster Storm dan Hadoop bersama-sama di Summingbird adalah bahwa pemrosesan melalui Storm menghasilkan cascading of error. Untuk menghindari cascading kesalahan dan akumulasi itu, cluster Hadoop digunakan untuk mengolah data dan membuang hasil Storm setelah data yang …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.