Apakah rata-rata variabel acak univariat selalu sama dengan integral dari fungsi kuantilnya?

17

Saya hanya memperhatikan bahwa mengintegrasikan fungsi kuantil variabel acak univariat (invers cdf) dari p = 0 ke p = 1 menghasilkan rata-rata variabel. Saya belum pernah mendengar hubungan ini sebelumnya, jadi saya bertanya-tanya: Apakah ini selalu terjadi? Jika demikian, apakah hubungan ini dikenal luas?

Berikut ini adalah contoh dalam python:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

mean pdf quantile-function

— Tyler Streeter
sumber

26

Misalkan $F$ adalah CDF dari variabel acak $X$ , sehingga CDF terbalik dapat dituliskan $F^{-1}$ . Di integral Anda buat substitusi $p = F(x)$ , $dp = F'(x)dx = f(x)dx$ untuk mendapatkan

\int_{0}^{1} F^{- 1} (p) d p = \int_{- \infty}^{\infty} x f (x) d x = E_{F} [X] .

$\int_0^1F^{-1}(p)dp = \int_{-\infty}^{\infty}x f(x) dx = \mathbb{E}_F[X].$

Ini berlaku untuk distribusi berkelanjutan. Perhatian harus diambil untuk distribusi lain karena CDF terbalik tidak memiliki definisi yang unik.

Edit

Ketika variabel tidak kontinu, itu tidak memiliki distribusi yang benar-benar kontinu berkenaan dengan ukuran Lebesgue, membutuhkan perawatan dalam definisi CDF terbalik dan perawatan dalam komputasi integral. Pertimbangkan, misalnya, kasus distribusi diskrit. Menurut definisi, ini adalah CDF $F$ merupakan fungsi langkah dengan langkah-langkah ukuran $\Pr_F(x)$ pada setiap nilai yang mungkin $x$ .

Gambar 1

Angka ini menunjukkan CDF dari Bernoulli distribusi skala oleh . Artinya, variabel acak memiliki probabilitas menyamai dan probabilitas menyamai . Ketinggian lompatan pada dan memberikan probabilitasnya. Harapan variabel ini jelas sama dengan $(2/3)$ $2$ $1/3$ $0$ $2/3$ $2$ $0$ $2$ . $0\times(1/3)+2\times(2/3)=4/3$

Kita dapat mendefinisikan "invers CDF" dengan meminta $F^{-1}$

F^{- 1} (p) = x if F (x) \geq p and F (x^{-}) < p .

$F^{-1}(p) = x \text{ if } F(x) \ge p \text{ and } F(x^{-}) \lt p.$

Ini berarti bahwa juga merupakan fungsi langkah. Untuk kemungkinan nilai dari variabel acak, akan mencapai nilai selama interval panjang . Oleh karena itu integralnya diperoleh dengan menjumlahkan nilai-nilai $F^{-1}$ $x$ $F^{-1}$ $x$ $\Pr_F(x)$ , yang hanya harapan. $x\Pr_F(x)$

Gambar 2

Ini adalah grafik CDF terbalik dari contoh sebelumnya. Melompat dari dan di CDF menjadi garis horizontal panjang ini pada ketinggian sama dengan dan , nilai-nilai untuk yang probabilitasnya mereka sesuai. (The Inverse CDF tidak didefinisikan di luar interval .) Terpisahkan Its adalah jumlah dari dua persegi panjang, salah satu dari ketinggian dan basis , yang lain dari ketinggian dan basis $1/3$ $2/3$ $0$ $2$ $[0,1]$ $0$ $1/3$ $2$ , dengan total $2/3$ $4/3$ , seperti sebelumnya.

Secara umum, untuk campuran distribusi kontinu dan diskrit, kita perlu mendefinisikan CDF terbalik untuk memparalelkan konstruksi ini: pada setiap lompatan diskrit ketinggian kita harus membentuk garis horizontal panjang seperti yang diberikan oleh rumus sebelumnya. $p$ $p$

— whuber
sumber

Anda membuat kesalahan dalam perubahan variabel. dari mana x berasal?

— Mascarpone

3

@Mascarpone Harap baca teks sebelum persamaan. Saya tidak berpikir ada kesalahan dalam perubahan variabel :-), tetapi jika Anda pikir itu akan menjelaskan eksposisi, saya akan senang menunjukkan bahwa ketika

, maka

. Aku hanya berpikir itu tidak perlu.

p = F (x)

$p=F(x)$

x = F^{- 1} (p)

$x=F^{-1}(p)$

— whuber

sekarang saya mengerti;),

— Mascarpone

+1 Whuber: Terima kasih! Bisakah Anda menguraikan untuk menggunakan formula yang Anda berikan, bagaimana menjaga distribusi lain yang CDF kebalikannya tidak memiliki definisi yang unik?

— StackExchange for All

1

Untuk mengabaikan pertimbangan tidak nyaman seperti tentang invers, invers pseudo dan sejenisnya, dan secara bersamaan untuk generalisasi setiap saat, lihat di sini .

— Apakah

9

Hasil yang setara dikenal dalam analisis survival : umur yang diharapkan adalah dengan fungsi survival adalah diukur sejak lahir pada . (Dapat dengan mudah diperluas untuk mencakup nilai negatif .)

\int_{t = 0}^{\infty} S (t) d t

$\int_{t=0}^\infty S(t) \; dt$

S (t) = Pr (T > t)

$S(t) = \Pr(T \gt t)$

t = 0

$t=0$

t

$t$

masukkan deskripsi gambar di sini

Jadi kita dapat menulis ulang ini sebagai tapi ini

\int_{t = 0}^{\infty} (1 - F (t)) d t

$\int_{t=0}^\infty (1-F(t)) \; dt$

seperti yang ditunjukkan dalam berbagai refleksi dari area yang bersangkutan

\int_{q = 0}^{1} F^{- 1} (q) d q

$\int_{q=0}^1 F^{-1}(q) \; dq$

masukkan deskripsi gambar di sini

— Henry
sumber

1

Saya suka gambar, dan secara naluriah merasa ada ide bagus bersembunyi di sini - Saya suka ide itu -, tapi saya tidak mengerti yang ini. Penjelasan akan sangat membantu. Satu hal yang berhenti saya di trek saya adalah pikiran mencoba untuk memperpanjang integral dari

ke

: memiliki menyimpang.

(1 - F (t)) d t

$(1-F(t))dt$

- \infty

$-\infty$

— whuber

@whuber: Jika Anda ingin memperluas ke

negatif , Anda mendapatkan

t

$t$

. Perhatikan bahwa jika konvergen distribusi konvergen sekitar

, yaitu

maka mudah untuk melihat bahwa ekspektasinya nol. Mengambil jumlah alih-alih perbedaan

\int_{t = 0}^{\infty} (1 - F (t)) d t - \int_{t = - \infty}^{0} F (t) d t

$\int_{t=0}^\infty (1-F(t)) \; dt - \int_{t=-\infty}^0 F(t) \; dt$

0

$0$

F (t) = 1 - F (- t)

$F(t)=1-F(-t)$

memberikan deviasi absolut rata-rata sekitar

.

\int_{t = 0}^{\infty} (1 - F (t)) d t + \int_{t = - \infty}^{0} F (t) d t

$\int_{t=0}^\infty (1-F(t)) \; dt + \int_{t=-\infty}^0 F(t) \; dt$

0

$0$

— Henry

Jika Anda menyukai diagram, Anda mungkin tertarik pada makalah ini tahun 1988 oleh Lee: The Matematika Kelebihan Cakupan Kerugian dan Penilaian Retrospektif-Pendekatan Grafis .

— Avraham

4

Kami sedang mengevaluasi:

enter image description here

Mari kita coba dengan perubahan variabel sederhana:

enter image description here

Dan kami perhatikan bahwa, dengan definisi PDF dan CDF:

enter image description here

hampir dimana-mana. Dengan demikian kita memiliki, berdasarkan definisi nilai yang diharapkan:

enter image description here

— Sabar
sumber

Pada baris terakhir saya menjelaskan dengan lebih jelas definisi nilai yang diharapkan. Hampir di mana-mana mengacu pada persamaan di atas yang terakhir. en.wikipedia.org/wiki/Almost_everywhere

— Mascarpone

1

diedit, thanx :)

— Mascarpone

3

$X$ $F$ $F^{-1}(U)$ $X$ $U$ $(0,1)$ $X$ $F^{-1}(U)$ :

E (X) = E (F^{- 1} (U)) = \int_{0}^{1} F^{- 1} (u) d u .

$E(X)=E(F^{-1}(U))=\int_0^1 F^{-1}(u)\mathrm{d}u.$ The representation

X \sim F^{- 1} (U)

$X \sim F^{-1}(U)$ holds for a general cdf

F

$F$ , taking

F^{- 1}

$F^{-1}$ to be the left-continuous inverse of

F

$F$ in the case when

F

$F$ it is not invertible.

— Stéphane Laurent
sumber

1

Note that $F(x)$ is defined as $P(X\le x)$ and is a right-continuous function. $F^{-1}$ is defined as

F^{- 1} (p) = min (x | F (x) \geq p) .

$\begin{equation} F^{-1}(p)=\min(x|F(x)\ge p). \end{equation}$ The

min

$\min$ makes sense because of the right continuity. Let

U

$U$ be a uniform distribution on

[0, 1]

$[0, 1]$ . You can easily verify that

F^{- 1} (U)

$F^{-1}(U)$ has the same CDF as

X

$X$ , which is

F

$F$ . This doesn't require

X

$X$ to be continuous. Hence,

E (X) = E (F^{- 1} (U)) = \int_{0}^{1} F^{- 1} (p) d p

$E(X)=E(F^{-1}(U))=\int_0^1F^{-1}(p)\mathop{dp}$ . The integral is the Riemann–Stieltjes integral. The only assumption we need is the mean of

X

$X$ exists (

E | X | < \infty

$E|X|<\infty$ ).

— WWang
sumber

That's the same answer as mine.

— Stéphane Laurent