Pertanyaan yang diberi tag «dataset»

Dataset adalah kumpulan data, seringkali dalam bentuk tabel atau matriks. Tag ini TIDAK ditujukan untuk permintaan data ("di mana saya dapat menemukan dataset tentang ...") -> lihat OpenData


2
Kumpulan data patokan untuk pemfilteran kolaboratif
Saya ingin menguji algoritma baru untuk pemfilteran kolaboratif . Kasus penggunaan yang umum adalah merekomendasikan film berdasarkan preferensi pengguna yang mirip dengan pengguna tertentu. Apa beberapa dataset patokan umum yang sering digunakan peneliti untuk menguji algoritme mereka? Saya tahu bahwa di dalam Computer Vision orang sering menggunakan MNIST atau CIFAR, …


4
Sarankan set data pelatihan penggolong teks
Kumpulan data mana yang tersedia secara bebas yang dapat saya gunakan untuk melatih classifier teks? Kami mencoba untuk meningkatkan keterlibatan pengguna kami dengan merekomendasikan konten yang paling terkait untuknya, jadi kami pikir. Jika kami mengklasifikasikan konten kami berdasarkan kantong kata yang telah ditentukan, kami dapat merekomendasikan kepadanya untuk melibatkan konten …



2
Cara terbaik untuk menyimpan kumpulan data besar menggunakan R dari Twitter?
Saya sedang mengerjakan sebuah proyek yang bertujuan untuk mengambil set data yang besar (yaitu, data tweet yang berumur beberapa hari) dari Twitter menggunakan perpustakaan twitteR di R. mengalami kesulitan menyimpan tweet karena mesin saya hanya memiliki memori 8 GB . Kehabisan memori bahkan sebelum saya mengaturnya untuk mengambil selama satu …
8 r  dataset 

3
Grafik Interaktif saat mencatat data
Saya ingin membuat grafik dan mengeksplorasi data langsung / yang diukur secara interaktif. Ada beberapa opsi di luar sana, dengan plot.ly menjadi yang paling ramah pengguna. Plot.ly memiliki UI yang fantastis dan mudah digunakan (mudah scalable, pannable, mudah diperbesar / pas untuk layar), tetapi tidak dapat menangani set besar data …
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.