Di bawah ini adalah histogram dari beberapa data, nampan adalah bilangan bulat, parameter lainnya tidak relevan.
Seperti yang Anda lihat, tampaknya ada dua distribusi normal yang terpisah tetapi tumpang tindih untuk angka ganjil dan genap.
Probabilitas menjadi bilangan genap adalah 1/3, juga 2/3 untuk bilangan ganjil.
Saya tidak memiliki gagasan tentang signifikansi statistik aktual ini agar jujur, jadi saya mencoba mencari tahu apa artinya mempelajari lebih lanjut, tetapi saya tidak dapat menemukan apa pun, saya sudah mencoba banyak istilah pencarian untuk menemukan ini dan bahkan membalikkan pencarian gambar tetapi yang saya dapatkan hanyalah informasi tentang distribusi multimodal dll. dan saya tidak dapat menemukan apa pun ketika distribusi multimoda benar-benar tumpang tindih dengan cara ini
Apakah ada nama untuk ini?
Bagi mereka yang tertarik datanya dari 1.000.000 game acak goofspiel (N = 13) menggunakan skrip matlab
N = 1000000;
random = zeros(1,N);
for i = 1 : N
pc = randperm(13);
p1 = randperm(13);
p2 = randperm(13);
random(i) = sum(pc.*sign(p1-p2));
end
histogram(random,'BinMethod','integer')
Contoh yang lebih umum (meskipun buatan) adalah sebagai berikut
a = [1:50 50:-1:1];
b = normpdf(linspace(-2,2),0,0.5).*50;
c = a;
rng('default') %For reproducibility
d = logical(randi([0,1],1,length(a)));
for i = 1:length(c) %There's gotta be a way to do this without an explicit loop
if(d(i))
c(i) = b(i);
end
end
bar(c)
Seperti contoh pertama ada dua distribusi yang tumpang tindih (segitiga dan normal), tetapi dalam hal ini alih-alih berganti pada setiap titik, itu acak.
Saya tahu ini adalah contoh yang dilebih-lebihkan (dan bahkan bukan histogram) tetapi harus ada contoh hal semacam ini yang benar-benar terjadi dengan data statistik bukan? Kemudian lagi mungkin tidak, atau itu sama sekali tidak relevan?
Pertanyaan sebenarnya ada dua:
Pertanyaan umum - Apa jenis "benda" ini, jika ada? - agar saya (atau siapa pun yang mungkin akan menemukannya) dapat mempelajari lebih lanjut tentang hal itu dan jika ada penyesuaian yang perlu dilakukan.
Pertanyaan yang secara spesifik berkaitan dengan dataset pertama saya - haruskah saya memisahkan nilai ganjil dan genap atau cocok dengan distribusi normal ke seluruh rangkaian?