Pertanyaan yang diberi tag «data-mining»

Aktivitas yang mencari pola dalam kumpulan data yang besar dan kompleks. Biasanya menekankan teknik algoritmik, tetapi mungkin juga melibatkan serangkaian keterampilan, aplikasi, atau metodologi terkait dengan tujuan itu.

4
Bagaimana cara men-debug analisis data?
Saya telah menemukan masalah berikut, yang saya rekomendasikan agak khas. Saya punya beberapa data besar, katakanlah, beberapa juta baris. Saya menjalankan beberapa analisis non-sepele, misalnya query SQL yang terdiri dari beberapa sub-query. Saya mendapatkan beberapa hasil, dengan menyatakan, misalnya, bahwa properti X meningkat dari waktu ke waktu. Sekarang, ada dua …

1
Pengelompokan data pelanggan disimpan dalam ElasticSearch
Saya memiliki banyak profil pelanggan yang disimpan dalam sebuah cluster elasticsearch . Profil ini sekarang digunakan untuk membuat grup target untuk langganan email kami. Grup target sekarang dibentuk secara manual menggunakan kemampuan pencarian faceted elasticsearch (seperti dapatkan semua pelanggan pria berusia 23 tahun dengan satu mobil dan 3 anak). Bagaimana …

3
Hubungan antara belit dalam matematika dan CNN
Saya sudah membaca penjelasan konvolusi dan memahaminya sampai batas tertentu. Adakah yang bisa membantu saya memahami bagaimana operasi ini berhubungan dengan konvolusi dalam Jaring Saraf Konvolusional? Apakah fungsi seperti filter gyang menerapkan bobot?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3

2
Kapan harus memilih regresi linier atau Pohon Keputusan atau regresi Hutan Acak? [Tutup]
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 4 tahun yang lalu . Saya sedang mengerjakan suatu proyek dan saya mengalami kesulitan dalam menentukan algoritma mana yang …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 

3
Data Perdagangan NASDAQ
Saya mencoba mencari data stok untuk dipraktikkan, apakah ada sumber daya yang bagus untuk ini? Saya menemukan ini: ftp://emi.nasdaq.com/ITCH/ tetapi hanya memiliki tahun berjalan. Saya sudah memiliki cara untuk menguraikan protokol, tetapi ingin memiliki lebih banyak data untuk dibandingkan. Tidak harus dalam format yang sama, asalkan memiliki statistik harga, perdagangan, …

5
Cara membuat daftar stopword yang bagus
Saya mencari beberapa petunjuk tentang cara membuat daftar stopwords. Adakah yang tahu / bisakah seseorang merekomendasikan metode yang bagus untuk mengekstrak daftar stopword dari dataset itu sendiri untuk preprocessing dan filtering? Data: sejumlah besar input teks manusia dengan panjang variabel (pencarian dan seluruh kalimat (hingga 200 karakter)) selama beberapa tahun. …


1
Mempelajari pengkodean sinyal
Saya memiliki sejumlah besar sampel yang mewakili bit stream yang disandikan Manchester sebagai sinyal audio. Frekuensi di mana mereka dikodekan adalah komponen frekuensi utama ketika tinggi, dan ada jumlah white noise yang konsisten di latar belakang. Saya telah secara manual mendekodekan stream ini, tetapi saya bertanya-tanya apakah saya dapat menggunakan …

1
Penambangan Data Relasional tanpa ILP
Saya memiliki dataset besar dari database relasional yang saya perlukan untuk membuat model klasifikasi. Biasanya untuk situasi ini saya akan menggunakan Pemrograman Logika Induktif (ILP), tetapi karena keadaan khusus saya tidak bisa melakukan itu. Cara lain untuk mengatasi hal ini adalah dengan mencoba menggabungkan nilai ketika saya memiliki hubungan asing. …



5
Berkelompok dengan kesamaan cosinus
Saya memiliki satu set data besar dan persamaan cosinus di antara mereka. Saya ingin mengelompokkannya menggunakan cosine similarity yang menyatukan objek-objek serupa tanpa perlu menentukan sebelumnya jumlah cluster yang saya harapkan. Saya membaca dokumentasi sklearn DBSCAN dan Affinity Propagation, di mana keduanya membutuhkan matriks jarak (bukan cosine similarity matrix). Sungguh, …


2
Bagaimana cara membuat mesin pencari teks?
Saya memiliki string HTML dan ingin mencari tahu apakah kata yang saya berikan relevan dengan string itu. Relevansi dapat diukur berdasarkan frekuensi dalam teks. Contoh untuk menggambarkan masalah saya: this is an awesome bike store bikes can be purchased online. the bikes we own rock. check out our bike store …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.