Berapa banyak istilah terbesar dalam


11

Pertimbangkan i=1N|Xi| di mana X1,,XN adalah id dan CLT berlaku.
Berapa banyak istilah terbesar yang menambahkan hingga setengah jumlah total?
Misalnya, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: 30% dari persyaratan mencapai sekitar setengah dari total.

Menetapkan
sumbiggest( j;X1XN)sum of the j biggest of |X1||XN|
halfsum(N)the smallest j such that sumbiggest( j )sumbiggest(N)/2.

Apakah ada hasil asimptotik umum untuk halfsum ( N,μ,σ )?
Derivasi yang sederhana dan intuitif akan menyenangkan.

(Sedikit Monte Carlo menunjukkan bahwa kadang-kadang halfsum ( N ) N / 4 atau lebih;
yaitu, 1/4 terbesar dari Xi tambahkan hingga 1/2 total.
Saya mendapatkan 0,24 N untuk setengah normal, 0,19 N untuk eksponensial, untuk N = 20, 50, 100.)


3
Jangan mengharapkan hasil universal seperti CLT. Misalnya, jawaban untuk varian seragam (0,1) akan sangat berbeda dari jawaban untuk varian seragam (1000,1001)!
whuber

Benar, halfsum tentu saja akan tergantung pada mean dan sd. Tapi mengapa ~ N / 5 untuk eksponensial?
denis

2
Asimtotik, Denis, cutoff untuk halfsum akan menjadi nilai yang x 0 t f ( t ) d t = 1 / 2 dimana f adalah pdf untuk | X i | ; pertanyaannya menanyakan N ( 1 - F ( x ) ) ( F adalah cdf untuk | X i | ). Dalam hal seragam [ 0 , 1 ]x0xtf(t)dt=1/2f|Xi|N(1F(x))F|Xi|[0,1]distribusi Anda mendapatkan jawaban @ Dilip; untuk eksponensial, . x0.186682NN/5
whuber

Jawaban:


2

Tidak, tidak ada hasil asimptotik umum. Biarkan menjadi urutan x i , di mana x [ 1 ] adalah yang terbesar.x[1]x[N]xix[1]

Perhatikan dua contoh berikut:

1) . Jelas bahwa CLT berlaku. Anda hanya perlu M = 1 observasi untuk M j = 1 | x [ j ] | 1P(x=0)=1M=1. j=1M|x[j]|12N|xi|

P(x=1)=1M=N/2j=1M|x[j]|12N|xi|

Sebagai contoh nontrivial, distribusi Bernoulli:

P(x=1)=p, P(x=0)=1ppN/2p


4
0N/2x[i]

1

Xi[0,1]iXiN/2N/2XN/4NNU[0,1]01x0<x<1(1x)Nx1(1+x)/2(1x)N(1+x)/2)=(1x2)N/2N/4x1/2(11/2)N0.3NN/4

iXi=YYx(1x2)N/2=Y/2YN/2N/12Yx=1(Y/N)YY=0Y=N


(0,1)1(0,)Y1,Y2,,Yn+1Y ( 1 ) , Y ( 2 ) , , Y ( n ) ( 0 , α )Ymax=α Y(1),Y(2),,Y(n)didistribusikan secara seragam dalam . Lihat, misalnya, pertanyaan dan jawaban ini di situs pendamping math.SE. (lanjutan)(0,α)
Dilip Sarwate

Bagaimanapun, argumen saya tidak menggunakan jarak antara sampel yang dipesan dari distribusi seragam.
Dilip Sarwate

Anda benar, saya salah paham dengan Anda. Sebagai pertanyaan sampingan, bukankah potongan antara titik seragam-acak didistribusikan secara eksponensial, setelah penskalaan - kebalikan dari q + a Anda? [Patah Tongkat Aturan dari Proyek Demonstrasi Wolfram] ( demonstrations.wolfram.com/BrokenStickRule ) pasti terlihat eksponensial, pasti ada yang mudah? bukti.
denis

Silakan ajukan pertanyaan sampingan Anda sebagai pertanyaan terpisah.
Dilip Sarwate

Mulai, lalu lihat probabilitas-distribusi-panjang-fragmen , Anda bisa berkomentar di sana.
denis

0

Mari kita asumsikan X hanya memiliki nilai positif untuk menghilangkan nilai absolut.

Tanpa bukti yang pasti, saya pikir Anda harus menyelesaikannya untuk k

(1FX(k))E(X|X>=k)=12E(X) dengan F menjadi fungsi distribusi kumulatif untuk X

dan kemudian jawabannya diberikan dengan mengambil nilai tertinggi.n(1FX(k))

Logika saya adalah bahwa asymtopically jumlah semua nilai yang lebih tinggi dari k seharusnya

n(1FX(k))E(X|X>=k)

dan setengah dari jumlah total adalah sekitar

12nE(X) .

Simulasi numerik menunjukkan bahwa hasilnya berlaku untuk kasus seragam (seragam dalam ) di mana dan saya mendapatkan . Saya tidak yakin apakah hasilnya selalu bertahan atau apakah bisa disederhanakan lebih lanjut, tapi saya pikir itu sangat tergantung pada fungsi distribusi F.F ( k ) = k k = [0,1]F(k)=kk=(12)

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.