Pertanyaan yang diberi tag «text-mining»

Mengacu pada subset penambangan data yang berkaitan dengan mengekstraksi informasi dari data dalam bentuk teks dengan mengenali pola. Tujuan dari penggalian teks sering untuk mengklasifikasikan dokumen yang diberikan ke dalam salah satu dari sejumlah kategori secara otomatis, dan untuk meningkatkan kinerja ini secara dinamis, menjadikannya contoh pembelajaran mesin. Salah satu contoh penambangan teks jenis ini adalah filter spam yang digunakan untuk email.

1
Menggunakan kata-kata topik yang dihasilkan oleh LDA untuk mewakili dokumen
Saya ingin melakukan klasifikasi dokumen dengan mewakili setiap dokumen sebagai serangkaian fitur. Saya tahu bahwa ada banyak cara: BOW, TFIDF, ... Saya ingin menggunakan Latent Dirichlet Allocation (LDA) untuk mengekstrak kata kunci topik dokumen EACH TUNGGAL. dokumen diwakili oleh kata-kata topik ini. Tapi saya tidak tahu apakah itu masuk akal …

1
Klasifikasi percakapan berdasarkan konten
Saya ingin dapat merancang classifier yang dapat membedakan berbagai jenis percakapan (tidak perlu menceritakan apa pun tentang suasana hati, ketulusan, atau hasil, yang agak terlalu jauh diambil). Untuk mengetahui, misalnya, bahwa di antara 50 sampel percakapan, 10 melibatkan kedua belah pihak untuk mencari informasi tentang acara di masa depan, 30 …


2
Mengotomatisasi korelasi statistik antara "teks" dan "data"
Saya mengumpulkan data tekstual seputar siaran pers, posting blog, ulasan, dll dari produk dan kinerja perusahaan tertentu. Secara khusus, saya ingin melihat apakah ada korelasi antara jenis dan / atau sumber konten "tekstual" tertentu dengan penilaian pasar dari simbol saham perusahaan. Korelasi nyata semacam itu dapat ditemukan oleh pikiran manusia …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.