Pertanyaan yang diberi tag «clustering»

Analisis atau pengelompokan klaster adalah tugas pengelompokan sekumpulan objek sedemikian rupa sehingga objek dalam kelompok yang sama (disebut klaster) lebih mirip satu sama lain (dalam beberapa hal) daripada satu sama lain dalam kelompok lain (kluster) . Ini adalah tugas utama penambangan data eksplorasi, dan teknik umum untuk analisis data statistik, yang digunakan di banyak bidang, termasuk pembelajaran mesin, pengenalan pola, analisis gambar, pencarian informasi dll.


2
Pengelompokan dokumen menggunakan topik yang berasal dari Latent Dirichlet Allocation
Saya ingin menggunakan Alokasi Dirichlet Laten untuk proyek dan saya menggunakan Python dengan perpustakaan gensim. Setelah menemukan topik saya ingin mengelompokkan dokumen menggunakan algoritma seperti k-means (Idealnya saya ingin menggunakan yang baik untuk tumpang tindih cluster sehingga rekomendasi pun disambut). Saya berhasil mendapatkan topik tetapi dalam bentuk: 0,041 * Menteri …

4
Sarankan set data pelatihan penggolong teks
Kumpulan data mana yang tersedia secara bebas yang dapat saya gunakan untuk melatih classifier teks? Kami mencoba untuk meningkatkan keterlibatan pengguna kami dengan merekomendasikan konten yang paling terkait untuknya, jadi kami pikir. Jika kami mengklasifikasikan konten kami berdasarkan kantong kata yang telah ditentukan, kami dapat merekomendasikan kepadanya untuk melibatkan konten …


2
Bagaimana autoencoder digunakan untuk pengelompokan?
Misalkan saya memiliki satu set sinyal domain waktu dengan sama sekali tidak ada label . Saya ingin mengelompokkannya dalam 2 atau 3 kelas. Autoencoder adalah jaringan tanpa pengawasan yang belajar mengompresi input. Jadi diberi input , bobot dan , bias dan , dan output , kita dapat menemukan hubungan berikut:x(i)x(i)x^{(i)}W1W1W_1W2W2W_2b1b1b_1b2b2b_2x^(i)x^(i)\hat{x}^{(i)} …


5
Berkelompok dengan kesamaan cosinus
Saya memiliki satu set data besar dan persamaan cosinus di antara mereka. Saya ingin mengelompokkannya menggunakan cosine similarity yang menyatukan objek-objek serupa tanpa perlu menentukan sebelumnya jumlah cluster yang saya harapkan. Saya membaca dokumentasi sklearn DBSCAN dan Affinity Propagation, di mana keduanya membutuhkan matriks jarak (bukan cosine similarity matrix). Sungguh, …

3
Bagaimana mengevaluasi pengelompokan teks?
Metrik apa yang dapat digunakan untuk mengevaluasi model pengelompokan teks? Saya menggunakan tf-idf+ k-means, tf-idf+ hierarchical clustering, doc2vec+ k-means (metric is cosine similarity), doc2vec+ hierarchical clustering (metric is cosine similarity). Bagaimana menentukan model mana yang terbaik?

2
Pas garis melalui awan titik besar
Saya memiliki satu set besar poin (urutan 10k poin) yang dibentuk oleh trek partikel (pergerakan di bidang xy pada waktunya difilmkan oleh kamera, jadi 3d - 256x256px dan ca 3k frame dalam set contoh saya) dan kebisingan. Partikel-partikel ini bergerak pada garis yang kira-kira lurus kira-kira (tetapi hanya kira-kira) dalam …

1
Apa perbedaan antara vektor eigen matriks afinitas dan vektor vektor eigen Laplacian dalam konteks pengelompokan spektral?
Dalam pengelompokan spektral, ini adalah praktik standar untuk memecahkan masalah vektor eigen L v = λ vL.v=λvL v = \lambda v di mana adalah grafik Laplacian, adalah vektor eigen yang terkait dengan nilai eigen .L.L.Lvvvλλ\lambda Pertanyaan saya: mengapa repot-repot mengambil grafik Laplacian? Tidak bisakah saya memecahkan masalah vektor eigen untuk …

3
Algoritma untuk segmentasi data urutan
Saya memiliki urutan besar vektor dengan panjang N. Saya perlu beberapa algoritma pembelajaran tanpa pengawasan untuk membagi vektor ini menjadi segmen M. Sebagai contoh: K-means tidak cocok, karena menempatkan elemen serupa dari lokasi yang berbeda ke dalam satu cluster. Memperbarui: Data nyata terlihat seperti ini: Di sini, saya melihat 3 …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.