EDIT: versi asli melewatkan nilai absolut. Maaf!!
Hai Ian. Saya akan secara singkat menguraikan dua ketidaksetaraan sampel, satu menggunakan ikatan Lipschitz, yang lain menggunakan ikatan pada turunan kedua, dan kemudian membahas beberapa kesulitan dalam masalah ini. Meskipun saya berlebihan, karena pendekatan yang menggunakan satu turunan menjelaskan apa yang terjadi dengan lebih banyak turunan (melalui Taylor), ternyata versi turunan kedua cukup bagus.
Pertama, dengan ikatan Lipschitz: cukup kerjakan kembali ketimpangan Jensen standar. Trik yang sama berlaku: hitung ekspansi Taylor pada nilai yang diharapkan.
Secara khusus, Misalkan memiliki ukuran yang sesuai , dan atur . Jika memiliki konstanta Lipschitz , maka dengan teorema Taylorμ m : = E ( x ) f LXμm:=E(x)fL
f(x)=f(m)+f′(z)(x−m)≤f(m)+L|x−m|,
di mana (perhatikan bahwa dan adalah mungkin). Menggunakan ini dan bekerja kembali bukti Jensen (saya paranoid dan memeriksa bahwa yang standar memang ada di wikipedia),x ≤ m x > mz∈[m,x]x≤mx>m
E(f(X))=∫f(x)dμ(x)≤f(m)∫dμ(x)+L∫|x−m|dμ(x)=f(E(X))+LE(|X−E(X)|).
Sekarang, misalkan . Pada kasus ini,|f′′(x)|≤λ
f(x)=f(m)+f′(m)(x−m)+f′′(z)(x−m)22≤f(m)+f′(m)(x−m)+λ(x−m)22,
dan sebagainya
E(f(X))≤f(m)+f′(m)(E(X)−m)+λE((X−m)2)2=f(E(X))+λVar(X)2.
Saya ingin menyebutkan secara singkat beberapa hal. Maaf jika sudah jelas.
Pertama, Anda tidak bisa hanya mengatakan "wlog " dengan menggeser distribusi, karena Anda mengubah hubungan antara dan .f μE(X)=0fμ
Berikutnya adalah bahwa terikat harus bergantung pada distribusi dalam beberapa cara. Untuk melihat ini, bayangkan dan . Apa pun nilai , Anda masih mendapatkan . Di sisi lain, . Dengan demikian, dengan mengubah , Anda dapat membuat jarak antara dua kuantitas secara sewenang-wenang! Secara intuitif, lebih banyak massa didorong menjauh dari rata-rata, dan dengan demikian, untuk fungsi cembung apa pun, akan meningkat.f ( x ) = x 2 σ f ( E ( X ) ) = f ( 0 ) = 0X∼Gaussian(0,σ2)f(x)=x2σf(E(X))=f(0)=0 σ E ( f ( X ) )E(f(X))=E(X2)=σ2σE(f(X))
Terakhir, saya tidak melihat cara mendapatkan ikatan multiplikasi seperti yang Anda sarankan. Semua yang saya gunakan dalam posting ini adalah standar: Teorema dan batas turunan Taylor adalah roti & mentega dalam batas statistik, dan mereka secara otomatis memberikan aditif, bukan kesalahan multiplikasi.
Saya akan memikirkannya, dan memposting sesuatu. Intuisi yang kabur adalah akan membutuhkan kondisi yang sangat berat pada fungsi dan distribusi, dan bahwa batas aditif sebenarnya di jantungnya.