Memahami bukti lemma yang digunakan dalam ketidaksetaraan Hoeffding


11

Saya sedang mempelajari catatan kuliah Larry Wasserman tentang Statistik yang menggunakan Casella dan Berger sebagai teks utamanya. Saya sedang mengerjakan catatan kuliahnya set 2 dan terjebak dalam derivasi lemma yang digunakan dalam ketidaksetaraan Hoeffding (hal.2-3). Saya mereproduksi bukti dalam catatan di bawah ini dan setelah bukti saya akan menunjukkan di mana saya terjebak.


Kata pengantar singkat

Misalkan dan . Kemudian .E(X)=0aXbE(etX)et2(ba)2/8

Bukti

Karena , kita dapat menulis sebagai kombinasi cembung dari dan , yaitu mana . Dengan cembung dari fungsi kita milikiaXbXabX=αb+(1α)aα=Xabayety

etXαetb+(1α)eta=Xabaetb+bXbaeta

Ambil harapan dari kedua belah pihak dan gunakan fakta untuk mendapatkanE(X)=0

E(etX)abaetb+bbaeta=eg(u)

di mana , dan . Perhatikan bahwa . Juga untuk semua u> 0 .u=t(ba)g(u)=γu+log(1γ+γeu)γ=a/(ba)g(0)=g(0)=0g(u)1/4u>0

Dengan teorema Taylor, ada ε(0,u) sedemikian sehingga g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

Karenanya E(etX)eg(u)et2(ba)28 .


Saya bisa mengikuti buktinya sampai

E(etX)abaetb+bbaeta=eg(u) tetapi saya tidak dapat menemukan cara menurunkan .u,g(u),γ


3
Sangat menarik bahwa nilai maksimum dari adalah dan dengan demikian hasilnya secara efektif yang tampak terlalu akrab untuk muncul karena kebetulan belaka. Saya menduga mungkin ada cara lain, mungkin lebih mudah, untuk memperoleh hasilnya melalui argumen probabilistik. var(X)σmax2=(ba)2/4
E[etX]eσmax2t2/2
Dilip Sarwate

@DilipSarwate Pemahaman saya adalah bahwa varians maksimum terjadi untuk variabel acak seragam . dari adalah . Bisakah Anda jelaskan bagaimana Anda mendapat ? XU(a,b)XVar(X)=(ba)212(ba)24
Anand

Dengan memusatkan massa pada titik akhir ...
Elvis

@DilipSarwate Saya menambahkan beberapa komentar di buktinya, yang dapat menjelaskan sedikit liitle mengapa kasus terburuk adalah varians maks.
Elvis

1
@DilipSarwate - Lihat lemma 1 dan latihan 1 di sini: terrytao.wordpress.com/2010/01/03/… . Tampaknya ada derivasi sederhana mengandalkan ketidaksetaraan Jensen dan ekspansi taylor. Namun rincian ini tidak jelas bagi saya. Mungkin seseorang bisa memahaminya. (derivasi (9) hingga (10) dan latihan 1)
Leo

Jawaban:


17

Saya tidak yakin saya memahami pertanyaan Anda dengan benar. Saya akan mencoba menjawab: coba tulis sebagai fungsi : this adalah alami karena Anda ingin terikat dalam .

abaetb+bbaeta
u=t(ba)eu28

Dengan dibantu oleh pengalaman, Anda akan tahu bahwa lebih baik memilih untuk menuliskannya dalam bentuk . Kemudian mengarah ke dengan .eg(u)

eg(u)=abaetb+bbaeta
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
γ=aba

Apakah itu jenis hal yang Anda minta?

Sunting: beberapa komentar tentang buktinya

  1. Trik pertama layak untuk diperhatikan dengan cermat: jika adalah fungsi cembung, dan adalah variabel acak terpusat, maka mana adalah variabel diskrit yang ditentukan oleh Sebagai konsekuensinya, Anda mendapatkan adalah variabel terpusat dengan dukungan dalam yang memiliki varian tertinggi: Perhatikan bahwa jika kami memperbaiki lebar dukunganϕaXb
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0
    P(X0=a)=bbaP(X0=b)=aba.
    X0[a,b]
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba), ini kurang dari seperti Dilip katakan dalam komentar, ini karena ; batas diperoleh untuk .(ba)24(ba)2+4ab0a=b
  2. Sekarang giliran masalah kita. Mengapa mungkin untuk mendapatkan ikatan hanya bergantung pada ? Secara intuitif, ini hanya masalah : jika Anda memiliki batas untuk kasus , maka batas umum dapat diperoleh dengan mengambil . Sekarang pikirkan kumpulan variabel terpusat dengan dukungan lebar 1: tidak ada begitu banyak kebebasan, jadi batas seperti harus ada. Pendekatan lain adalah dengan mengatakan bahwa dengan lemma di atas pada , maka lebih umum , yang hanya bergantung pada danu=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγ : jika Anda memperbaiki dan , dan biarkan bervariasi, hanya ada satu derajat kebebasan, dan , , . Kita mendapatkan Anda hanya perlu menemukan ikatan yang hanya melibatkan .u=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. Sekarang kami yakin itu bisa dilakukan, itu pasti jauh lebih mudah! Anda tidak perlu berpikir untuk untuk memulai. Intinya adalah bahwa Anda harus menulis semuanya sebagai fungsi dari dan . Perhatikan pertama bahwa , , dan . Kemudian Sekarang kita berada dalam kasus khusus ... I pikir kamu bisa menyelesaikannya.guγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

Saya harap saya mengklarifikasi sedikit.


Itulah tepatnya yang saya cari. Terima kasih banyak.
Anand

1
@ Dan saya tahu itu sulit untuk mengikuti saran, namun saya pikir Anda tidak boleh mulai dengan berfokus pada detail teknis tetapi cobalah untuk mendapatkan mengapa ikatan seperti itu bisa ada ... maka buktinya akan tampak lebih mudah. Saya mencoba menunjukkan kepada Anda mengapa di bagian kedua, ditambahkan pagi ini (Anda perlu tidur pada pertanyaan seperti ini - setidaknya saya perlu). Saya pikir itu mengerikan bagaimana intuisi semacam ini tidak muncul di sebagian besar buku pelajaran ... bahkan jika Anda mendapatkan bagian teknis, selama Anda tidak memiliki ide-ide semuanya terlihat ajaib. Terima kasih dan CrossV karena memberi saya kesempatan untuk memikirkan hal ini secara terperinci!
Elvis

1
Wow! +1 untuk hasil edit. Terima kasih. Tapi bukankah menyenangkan jika bisa mendapatkan sesuatu seperti
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
Dilip Sarwate

@ Elvis Terima kasih atas sarannya dan telah meluangkan waktu untuk menuliskan bagian intuitifnya. Saya perlu meluangkan waktu untuk memahami hal ini!
Anand

1
@ Elvis Mengambil tentang intuisi, saya ingin memperjelas pemahaman saya. Untuk mendapatkan batas yang lebih tajam, seseorang membutuhkan momen yang lebih tinggi. Markov menggunakan momen pertama, Chebyshev momen kedua dan Hoeffding menggunakan mgf. Apakah ini benar? Jika seseorang dapat memperluas dan memperjelas bagian ini, itu akan bagus.
Anand
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.