Apa set data yang tersedia secara bebas untuk klasifikasi dengan lebih dari 1000 fitur (atau titik sampel jika mengandung kurva)?
Sudah ada wiki komunitas tentang kumpulan data gratis: Menemukan sampel data yang tersedia secara bebas
Tapi di sini, akan menyenangkan untuk memiliki daftar yang lebih fokus yang dapat digunakan dengan lebih nyaman , juga saya mengusulkan aturan berikut:
- Satu pos per dataset
- Tidak ada tautan ke set dataset
setiap kumpulan data harus dikaitkan dengan
sebuah nama (untuk mencari tahu apa itu tentang) dan link ke dataset (dataset R dapat diberi nama dengan nama paket)
jumlah fitur (katakanlah itu p ) ukuran dataset (katakanlah itu n ) dan jumlah label / kelas (katakanlah itu k )
tingkat kesalahan tipikal dari pengalaman Anda (sebutkan algoritma yang digunakan untuk kata-kata) atau dari literatur (dalam hal ini menghubungkan kertas)