Apakah ada seri numerik yang dibuat sebelumnya dengan properti statistik yang dikenal?


8

Saya mencoba menguji suatu program yang mengklaim untuk menghitung beberapa sifat statistik dari urutan numerik (seperti rata-rata, median, standar deviasi dll). Sekuens sederhana dan pendek lulus tes dengan baik, tapi saya ingin menantang program dengan sekuens panjang, atau sekuens dengan nilai besar dan kecil (untuk menguji overflow / underflow) dll. Jadi, apakah ada perangkat lunak atau sumber daya online atau lainnya sumber urutan numerik yang berbeda dengan sifat statistik yang dikenal?

Jawaban:


9

Institut Nasional Standar dan Teknologi AS memiliki satu set Data Rujukan Statistik "yang menyediakan dataset referensi dengan nilai-nilai bersertifikasi untuk berbagai metode statistik", termasuk satu set berlabel 'statistik ringkasan univariat' dengan nilai-nilai bersertifikat untuk mean, deviasi standar dan autokorelasi lag-1.

Tampaknya tidak menyertakan nilai median, tetapi perhitungan median yang akurat seharusnya tidak menjadi masalah. Perhitungan median sampel yang efisien sedikit lebih sulit.


Dataset tersebut tampaknya agak pendek - beberapa ribu nilai paling banyak. Apakah ada urutan panjang, dan urutan dengan beberapa nilai ekstrem untuk menguji luapan dan kehilangan presisi? Juga, adakah properti statistik dari "orde yang lebih tinggi" yang tersedia untuk set ini, seperti skewness, kurtosis dll?
mbaitoff

1

Anda dapat mengambil kotak alat statistik favorit Anda (milik saya adalah R) dan menggunakannya untuk mulai menghasilkan jangka waktu data yang lama. Dalam R misalnya, dimungkinkan untuk menghasilkan data dari semua jenis distribusi. Dengan cara ini Anda dapat memvalidasi bahwa program yang Anda uji ini sejalan dengan program statistik lainnya. Itu hanya membandingkan kinerja dengan misalnya R, tapi saya percaya R dalam hal ini :).


Saya mencari tidak hanya urutan, tetapi untuk urutan dengan kemungkinan jebakan. Jenis distribusi tidak terlalu relevan di sini.
mbaitoff
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.