Ilmu Data data-mining

4

Saya telah menemukan masalah berikut, yang saya rekomendasikan agak khas. Saya punya beberapa data besar, katakanlah, beberapa juta baris. Saya menjalankan beberapa analisis non-sepele, misalnya query SQL yang terdiri dari beberapa sub-query. Saya mendapatkan beberapa hasil, dengan menyatakan, misalnya, bahwa properti X meningkat dari waktu ke waktu. Sekarang, ada dua …

10 data-mining sql experiments

1

Pengelompokan data pelanggan disimpan dalam ElasticSearch

Saya memiliki banyak profil pelanggan yang disimpan dalam sebuah cluster elasticsearch . Profil ini sekarang digunakan untuk membuat grup target untuk langganan email kami. Grup target sekarang dibentuk secara manual menggunakan kemampuan pencarian faceted elasticsearch (seperti dapatkan semua pelanggan pria berusia 23 tahun dengan satu mobil dan 3 anak). Bagaimana …

10 data-mining clustering

3

Hubungan antara belit dalam matematika dan CNN

Saya sudah membaca penjelasan konvolusi dan memahaminya sampai batas tertentu. Adakah yang bisa membantu saya memahami bagaimana operasi ini berhubungan dengan konvolusi dalam Jaring Saraf Konvolusional? Apakah fungsi seperti filter gyang menerapkan bobot?

10 machine-learning neural-network deep-learning cnn convolution machine-learning ensemble-modeling machine-learning classification data-mining clustering machine-learning feature-selection convnet pandas graphs ipython machine-learning apache-spark multiclass-classification naive-bayes-classifier multilabel-classification machine-learning data-mining dataset data-cleaning data machine-learning data-mining statistics correlation machine-learning data-mining dataset data-cleaning data beginner career python r visualization machine-learning data-mining nlp stanford-nlp dataset linear-regression time-series correlation anomaly-detection ensemble-modeling data-mining machine-learning python data-mining recommender-system machine-learning cross-validation model-selection scoring prediction sequential-pattern-mining categorical-data python tensorflow image-recognition statistics machine-learning data-mining predictive-modeling data-cleaning preprocessing classification deep-learning tensorflow machine-learning algorithms data keras categorical-data reference-request loss-function classification logistic-regression apache-spark prediction naive-bayes-classifier beginner nlp word2vec vector-space-models scikit-learn decision-trees data programming

3

Bagaimana cara melakukan batch product dalam Tensorflow?

Saya memiliki dua tensor a:[batch_size, dim] b:[batch_size, dim]. Saya ingin melakukan produk dalam untuk setiap pasangan dalam batch, menghasilkan c:[batch_size, 1], di mana c[i,0]=a[i,:].T*b[i,:]. Bagaimana?

10 tensorflow scikit-learn svm cross-validation feature-selection bayesian machine-learning decision-trees parameter-estimation neural-network convnet neural-network regularization visualization machine-learning similarity python pandas indexing r data-cleaning machine-learning predictive-modeling data-cleaning recommender-system python sequential-pattern-mining software-recommendation r visualization gaussian distribution machine-learning data-mining bigdata apache-hadoop predictive-modeling logistic-regression sampling machine-learning regression feature-selection mongodb neural-network inception machine-learning classification dataset databases logistic-regression deep-learning backpropagation classification data-mining multilabel-classification text-mining data-cleaning unsupervised-learning anomaly-detection python r python pandas

2

Kapan harus memilih regresi linier atau Pohon Keputusan atau regresi Hutan Acak? [Tutup]

Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 4 tahun yang lalu . Saya sedang mengerjakan suatu proyek dan saya mengalami kesulitan dalam menentukan algoritma mana yang …

10 machine-learning algorithms random-forest linear-regression decision-trees machine-learning predictive-modeling forecast r clustering similarity data-mining dataset statistics text-mining text-mining data-cleaning data-wrangling machine-learning classification algorithms xgboost data-mining dataset dataset regression graphs svm unbalanced-classes cross-validation optimization hyperparameter genetic-algorithms visualization predictive-modeling correlation machine-learning predictive-modeling apache-spark statistics normalization apache-spark map-reduce r correlation confusion-matrix r data-cleaning classification terminology dataset image-classification machine-learning regression apache-spark machine-learning data-mining nlp parsing machine-learning dimensionality-reduction visualization clustering multiclass-classification evaluation unsupervised-learning machine-learning machine-learning data-mining supervised-learning unsupervised-learning machine-learning data-mining classification statistics predictive-modeling data-mining clustering python pandas machine-learning dataset data-cleaning data bigdata software-recommendation

3

Data Perdagangan NASDAQ

Saya mencoba mencari data stok untuk dipraktikkan, apakah ada sumber daya yang bagus untuk ini? Saya menemukan ini: ftp://emi.nasdaq.com/ITCH/ tetapi hanya memiliki tahun berjalan. Saya sudah memiliki cara untuk menguraikan protokol, tetapi ingin memiliki lebih banyak data untuk dibandingkan. Tidak harus dalam format yang sama, asalkan memiliki statistik harga, perdagangan, …

10 data-mining dataset

5

Cara membuat daftar stopword yang bagus

Saya mencari beberapa petunjuk tentang cara membuat daftar stopwords. Adakah yang tahu / bisakah seseorang merekomendasikan metode yang bagus untuk mengekstrak daftar stopword dari dataset itu sendiri untuk preprocessing dan filtering? Data: sejumlah besar input teks manusia dengan panjang variabel (pencarian dan seluruh kalimat (hingga 200 karakter)) selama beberapa tahun. …

9 data-mining nlp information-retrieval language-model

2

Bagaimana memodelkan perilaku pembelian pengguna di Amazon?

Untuk proyek tugas akhir kami di Ilmu Data, kami mengusulkan berikut- Berikan Dataset Ulasan Amazon , kami berencana untuk membuat algoritme (yang kira-kira berdasarkan pada Personal PageRank) yang menentukan posisi strategis untuk menempatkan iklan di Amazon. Misalnya, ada jutaan produk di Amazon. Dan dataset memberi Anda gambaran tentang produk apa …

9 machine-learning data-mining dataset recommender-system

1

Mempelajari pengkodean sinyal

Saya memiliki sejumlah besar sampel yang mewakili bit stream yang disandikan Manchester sebagai sinyal audio. Frekuensi di mana mereka dikodekan adalah komponen frekuensi utama ketika tinggi, dan ada jumlah white noise yang konsisten di latar belakang. Saya telah secara manual mendekodekan stream ini, tetapi saya bertanya-tanya apakah saya dapat menggunakan …

9 machine-learning data-mining scalability algorithms feature-selection

1

Penambangan Data Relasional tanpa ILP

Saya memiliki dataset besar dari database relasional yang saya perlukan untuk membuat model klasifikasi. Biasanya untuk situasi ini saya akan menggunakan Pemrograman Logika Induktif (ILP), tetapi karena keadaan khusus saya tidak bisa melakukan itu. Cara lain untuk mengatasi hal ini adalah dengan mencoba menggabungkan nilai ketika saya memiliki hubungan asing. …

9 data-mining classification relational-dbms

2

Pengenalan aktivitas manusia menggunakan masalah kumpulan data ponsel cerdas

Saya baru di komunitas ini dan semoga pertanyaan saya cocok di sini. Sebagai bagian dari kursus analisis data sarjana saya, saya telah memilih untuk melakukan proyek pengenalan aktivitas manusia menggunakan set data ponsel cerdas. Sejauh yang saya ketahui, topik ini berkaitan dengan Pembelajaran Mesin dan Dukungan Mesin Vektor. Saya belum …

9 bigdata machine-learning databases clustering data-mining

6

Python: Menangani Kelas Ketidakseimbangan dalam Pembelajaran Mesin python

Saya memiliki dataset yang saya coba prediksi variabel targetnya. Col1 Col2 Col3 Col4 Col5 1 2 23 11 1 2 22 12 14 1 22 11 43 38 3 14 22 25 19 3 12 42 11 14 1 22 11 43 38 2 1 2 23 11 4 2 …

9 machine-learning python data-mining dataset pandas

5

Berkelompok dengan kesamaan cosinus

Saya memiliki satu set data besar dan persamaan cosinus di antara mereka. Saya ingin mengelompokkannya menggunakan cosine similarity yang menyatukan objek-objek serupa tanpa perlu menentukan sebelumnya jumlah cluster yang saya harapkan. Saya membaca dokumentasi sklearn DBSCAN dan Affinity Propagation, di mana keduanya membutuhkan matriks jarak (bukan cosine similarity matrix). Sungguh, …

8 machine-learning data-mining clustering text-mining

2

Menggunakan NLP untuk mengotomatiskan kategorisasi deskripsi pengguna

Saya memiliki file keluhan pelanggan yang sangat besar tentang produk yang dimiliki perusahaan saya dan saya ingin melakukan analisis data pada deskripsi tersebut dan menandai kategori untuk masing-masing. Sebagai contoh: Saya perlu mencari tahu jumlah keluhan di sisi Perangkat Lunak dan Keras produk saya dari keluhan pelanggan. Saat ini, saya …

8 data-mining classification nlp categorical-data

2

Bagaimana cara membuat mesin pencari teks?

Saya memiliki string HTML dan ingin mencari tahu apakah kata yang saya berikan relevan dengan string itu. Relevansi dapat diukur berdasarkan frekuensi dalam teks. Contoh untuk menggambarkan masalah saya: this is an awesome bike store bikes can be purchased online. the bikes we own rock. check out our bike store …

8 machine-learning data-mining

Pertanyaan yang diberi tag «data-mining»