Pertanyaan yang diberi tag «dataset»

Permintaan kumpulan data di luar topik di situs ini. Gunakan tag ini untuk pertanyaan tentang membuat, memproses, atau memelihara set data.

3
Data pelatihan tidak seimbang - tetapi apakah set validasi saya juga harus?
Saya telah memberi label data yang terdiri dari 10.000 contoh positif, dan 50.000 contoh negatif, sehingga totalnya 60000 contoh. Jelas data ini tidak seimbang. Sekarang katakanlah saya ingin membuat set validasi saya, dan saya ingin menggunakan 10% dari data saya untuk melakukannya. Pertanyaan saya adalah sebagai berikut: Haruskah saya memastikan …

5
Apakah nominal, ordinal, & biner untuk data kuantitatif, data kualitatif, atau keduanya?
Saya mendapatkan berbagai tipe data dan saya butuh bantuan: Jika Anda melihat gambar di atas (diambil dari sini ), ia memiliki tipe data seperti ini: Kuantitatif (Terpisah, Berkelanjutan) Kualitatif (Nominal (N), Ordinal (O), Binary (B)). Tetapi jika Anda melihat gambar berikut ini (dari sini ), kategorinya adalah: Kuantitatif (Diskrit (NOB)) …


1
Praktik terbaik untuk mengukur dan menghindari overfitting?
Saya mengembangkan sistem perdagangan otomatis untuk pasar saham. Tantangan besar adalah overfitting. Dapatkah Anda merekomendasikan beberapa sumber yang menggambarkan metode untuk mengukur dan menghindari overfitting? Saya mulai dengan set pelatihan / validasi, tetapi set validasi selalu ternoda. Juga, data deret waktu selalu berubah karena pasar selalu berubah. Bagaimana Anda mengukur …

1
Apakah Anda menandai data ini sebagai penipuan?
Misalkan Anda telah diberi beberapa data dari rancangan acak kelompok dengan 4 kali pengulangan dan 23 kali perawatan. Setelah pemeriksaan awal data, Anda perhatikan bahwa untuk 8 perawatan semua pengulangan adalah identik, yang jelas salah. Setelah melaporkan masalah, Anda diberi tahu bahwa itu karena kebingungan dari orang yang bertanggung jawab …

2
Masalah dengan Deteksi Outlier
Dalam sebuah posting blog Andrew Gelman menulis : Regresi bertahap adalah salah satu dari hal-hal ini, seperti deteksi outlier dan diagram lingkaran, yang tampaknya menjadi populer di kalangan non-ahli statistik tetapi dianggap oleh para ahli statistik sebagai sedikit lelucon. Saya mengerti referensi untuk diagram lingkaran, tetapi mengapa deteksi outlier dipandang …

2
Analisis data rotasi roda hamster
Sebelum memposting pertanyaan ini, saya telah menelusuri pertanyaan-pertanyaan lain di Stack ini, dan ini mungkin akan menjadi jalan-jalan di taman untuk siapa saja yang membacanya! Tetapi deskripsi Stack ini termasuk analisis dan visualisasi data, jadi saya harap ini ada di tempat yang tepat! </preapology> Saya menggunakan Raspberry Pi dengan magnet …


2
Fungsi kemungkinan data terpotong
Saya mengalami sedikit kesulitan memahami konsep dan derivasi dari kemungkinan data terpotong. Misalnya, jika saya ingin menemukan fungsi kemungkinan berdasarkan sampel dari distribusi, tetapi ketika mengambil sampel dari distribusi, saya mengamati nilai terpotong (di mana ada cut-off dari MMM, yaitu setiap dicatat sebagai ):xi>Mxi>Mx_{i}>MMMM x1,x2,M,x3,M,x4,x5,...,x10x1,x2,M,x3,M,x4,x5,...,x10 x_{1}, x_{2}, M, x_{3}, M, …

1
Interval kepercayaan saat menggunakan teorema Bayes
Saya menghitung beberapa probabilitas bersyarat, dan interval kepercayaan 95% yang terkait. Untuk banyak kasus saya, saya memiliki jumlah xkeberhasilan langsung dari npercobaan (dari tabel kontingensi), sehingga saya dapat menggunakan interval kepercayaan Binomial, seperti yang disediakan oleh binom.confint(x, n, method='exact')in R. Namun dalam kasus lain, saya tidak memiliki data seperti itu, …


1
Apa artinya ini kabur di sekitar garis dalam grafik ini?
Saya bermain-main dengan ggplot2 menggunakan perintah berikut ini agar sesuai dengan baris ke data saya: ggplot(data=datNorm, aes(x=Num, y=Val)) + geom_point() + stat_summary(fun.data = "mean_cl_boot", geom="errorbar", colour="red", width=0.8) + stat_sum_single(median) + stat_sum_single(mean, colour="blue") + geom_smooth(level = 0.95, aes(group=1), method="lm") Titik merah adalah nilai median, biru berarti dan garis merah vertikal menunjukkan …

2
Kumpulan game komputer
Saya telah mencari dataset permainan komputer, tetapi sejauh ini saya hanya dapat menemukan dataset 'Avatar History' untuk WoW. Apakah ada set data menarik lain di luar sana, mungkin untuk genre lain?
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.