Batasan pada ekspektasi bersyarat dengan margin normal dan korelasi yang ditentukan (Pearson)


8

Saya melihat pertanyaan berikut di forum lain:

"Misalkan tinggi dan berat pria dewasa dapat digambarkan dengan model normal, dan bahwa korelasi antara variabel-variabel ini adalah 0,65. Jika tinggi pria menempatkannya pada persentil ke-60, pada persentil berapa Anda mengharapkan berat badannya seperti apa?"

Saya melihat bahwa seseorang di forum tersebut telah menunjukkan bahwa pertanyaan tersebut berbicara tentang margin menjadi normal ( height and weight ... can be described with normal models), bukan tentang normalitas bivariat dan pertanyaannya tidak memiliki jawaban tunggal.

Jelas jawabannya akan tergantung pada hubungan ketergantungan bivariat yang sebenarnya (copula), yang membuat saya penasaran.

Pertanyaanku adalah:

Mengingat margin normal dan korelasi populasi yang ditentukan ( , korelasi Pearson), adakah cara yang cukup mudah untuk menemukan batasan pada diberikan keduanya normal, dengan korelasi ?ρE(Y|X=xq)X,Yρ

Jika ada nilai terbesar tepat dan nilai terkecil untuk harapan bersyarat, itu (dan untuk preferensi, keadaan di mana masing-masing terjadi *) akan baik untuk diketahui.

* Saya memiliki kecurigaan yang kuat tentang keadaan apa itu (yaitu jenis ketergantungan yang mungkin terlibat; khususnya, saya berharap jenis tertentu dari distribusi yang merosot akan memberikan batasan) tetapi saya belum menyelidiki pemikiran itu dalam kedalaman. (Saya pikir seseorang sudah cenderung mengetahuinya.)

Jika gagal, batas atas atau bawah pada nilai terbesar dan terkecil akan menarik.

Saya tidak perlu memerlukan jawaban aljabar (beberapa algoritma akan melakukannya), meskipun jawaban aljabar akan menyenangkan.

Jawaban perkiraan atau sebagian mungkin berguna / bermanfaat.

Jika tidak ada yang memiliki jawaban yang baik, saya mungkin harus melakukannya sendiri.

Jawaban:


4

Saya pikir tidak ada batasan. Kesimpulan ini bergantung pada konstruksi berikut, yang paling sederhana untuk dijelaskan untuk distribusi kontinu yang sewenang-wenang. Seiring kita berjalan, kondisi akan ditambahkan sampai kita berada dalam kasus Marginal normal.

Jadi, biarkan menjadi variabel acak kontinu dengan fungsi distribusi . Diberikan interval setengah terbuka (yang pada akhirnya akan menjadi sangat sempit), tentukanXF(a,b]

ψ:(a,b](,c]

melalui

ψ(x)=F1(F(x)F(a)).

Ini meningkat secara monoton dan jelas c=ψ(b)=F1(F(b)F(a)). Dengan konstruksi,

Pr(X(a,b])=Pr(ψ(X)c).

Perpanjang ke peta satu-ke-satu viaψΨ:RR

Ψ|(a,b]=ψ,Ψ|(,c]=ψ1

dan sebaliknya . Distribusi adalah identik dengan yang , tapi apa yang telah dilakukan adalah untuk swap nilai antara dua interval dan .Ψ(x)=xΨ(X)X(a,b](,c]

Gambar 1: grafik Psi

Contoh untuk .Ψ(a,b]=(1.5,1.75]

Biarkan korelasi Pearson dari menjadi . (Tanpa kehilangan umum kita sekarang mungkin mengira kedua dan telah dibakukan, karena ini akan berubah tidak maupun kelangsungan ). Biarkan menjadi bilangan real, seperti dalam pertanyaan, di mana harapan bersyarat akan dievaluasi. Pilih yang tetapi buat sangat sempit sehingga kecil. Kemudian perubahan dari ke(X,Y)ρ(1,1)XYρXxqY(a,b]xq(a,b]Pr(X(a,b])ρ=E(XY)ρ=E(Ψ(X)Y)dapat dibuat kecil sewenang-wenang. (Dibutuhkan sedikit usaha untuk menunjukkan ini; turun ke kenyataan bahwa ekspektasi bersyarat dari diberikan meningkat relatif lambat ketika berkurang. Jika tidak, tidak akan didefinisikan.) Namun, menerapkan perubahan keYXc|ba|ρΨE(Y|X=xq)

E(Y|Ψ(X)=xq)=E(Y|X=Ψ(xq)),

yang merupakan ekspektasi bersyarat untuk pada beberapa nilai kurang dari atau sama dengan .YXc

Gambar 2: grafik dari PDF (Psi (X), Y)

Kontur dari PDF. Di sini . Distribusi normal bivariat asli diberi korelasi , yang berkurang menjadi sekitar - nilai target - ketika probabilitas dalam dua strip ditukar.(a,b]=(1.5,1.75]0.850.5

Ketika adalah distribusi normal bivariat, as . Asalkan , ekspektasi bersyarat dari didorong ke untuk dan ke untuk . Konstruksi analog, menukar interval dengan , akan mendorong ekspektasi bersyarat dari jauh ke arah lain. Dengan menyesuaikan nilai asli dari sedikit kita dapat mengkompensasi perubahan kecil dalam(X,Y)c|ba|0ρ0Yρ>0+ρ<0(a,b][c,)Yρρyang terjadi, menunjukkan bahwa tidak peduli berapa nilai asli dari , kita tidak dapat mengatakan apa-apa tentang ekspektasi bersyarat dari pada titik tertentu .ρYX=xq

(Pengecualian nyata dapat ditangani dengan memulai dengan, katakanlah, distribusi bivariat dengan marginal Normal yang dukungannya terbatas pada garis .)ρ=0y=±x


+1 Ini sangat menarik. Ini agak terkait dengan konstruksi yang ada dalam pikiran saya dalam menulis pertanyaan, tetapi itu lebih baik ditargetkan untuk memindahkan hanya bersyarat di lingkungan langsung dari kuantil dan diskusi yang lebih bijaksana daripada yang saya mainkan. Kesimpulan Anda tampaknya pada awalnya bacaan itu benar. Terima kasih.
Glen_b -Reinstate Monica

Sebenarnya +1 tidak memadai di sini.
Glen_b -Reinstate Monica

0

Jika saya memahami pertanyaan Anda dengan benar, jawabannya tergantung pada "hubungan ketergantungan bivariat yang sebenarnya (copula)" yang digunakan.

Nah ada batas pada nilai yang dapat diambil kopula kan? Jadi mengapa tidak menggunakan copula comonotonicity dan copula countermonotonicity untuk menetapkan batas.

masukkan deskripsi gambar di sini

Sumber: Thorsten Schmidt - Mengatasi copulas


Pertanyaannya lebih membatasi daripada batas pada copulas - Anda tidak dapat mencapai batas co-dan counter-monotonicity karena kendala pada ρ.
Glen_b -Reinstate Monica
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.