Bagaimana menemukan matriks kovarians poligon?

Bayangkan Anda memiliki poligon yang didefinisikan oleh seperangkat koordinat $(x_1,y_1)...(x_n,y_n)$ dan pusat massanya adalah pada $(0,0)$ . Anda dapat memperlakukan poligon sebagai distribusi seragam dengan batas poligon.

Saya mencari metode yang akan menemukan matriks kovarian poligon .

Saya menduga bahwa matriks kovarians poligon terkait erat dengan momen kedua dari area , tetapi apakah mereka setara, saya tidak yakin. Rumus yang ditemukan dalam artikel wikipedia yang saya tautkan tampaknya (tebakan di sini, tidak terlalu jelas bagi saya dari artikel) untuk merujuk pada inersia rotasi di sekitar sumbu x, y dan z daripada sumbu utama poligon.

(Kebetulan, kalau ada yang bisa mengarahkan saya ke cara menghitung sumbu utama poligon, itu juga akan berguna bagi saya)

Ini tergoda untuk hanya melakukan PCA pada koordinat , tetapi hal itu berjalan ke masalah bahwa koordinat tidak selalu tersebar merata di sekitar poligon, dan karena itu tidak mewakili kepadatan poligon. Contoh ekstrem adalah garis besar North Dakota, yang poligonnya didefinisikan oleh sejumlah besar titik mengikuti sungai Merah, ditambah hanya dua titik lagi yang menentukan tepi barat negara bagian.

pca covariance-matrix polygon

— Ingolif
sumber

Dengan "menemukan", saya berasumsi hanya mengambil sampel dari poligon, lalu menghitung kovarians sampel, bukan apa yang ada dalam pikiran Anda?

— Stephan Kolassa

Selain itu, dapatkah Anda mengedit posting untuk menyertakan koordinat untuk poligon Anda, sehingga orang-orang dapat bermain-main dengannya?

— Stephan Kolassa

@StephanKolassa Maksud saya memperlakukan poligon sebagai kepadatan probabilitas bivariat yang seragam dengan batas poligon. Tentu, Anda dapat mencicipi poin dan batasnya adalah hal yang sama, tetapi saya mencari metode a-priori. Gambar itu hanyalah ilustrasi dari cat yang saya gunakan. Data dunia nyata yang ingin saya gunakan adalah garis besar negara bagian dan wilayah.

— Ingolifs

Anda benar bahwa istilah umum untuk "matriks kovarians" adalah momen inersia atau momen kedua . Kapak utama berorientasi pada eigendirections-nya. Menjalankan PCA pada koordinat tidak benar: itu sama saja dengan mengasumsikan semua massa terletak pada simpul. Metode perhitungan barycenter yang paling langsung - momen pertama - dibahas dalam posting saya di gis.stackexchange.com/a/22744/664 . Momen kedua dihitung dengan cara yang sama dengan modifikasi kecil. Pertimbangan khusus diperlukan di bidang ini.

— whuber

μ_{k, l} (P) = \iint_{P} x^{k} y^{l} d x d y

$\mu_{k,l}(\mathcal{P})=\iint_{\mathcal{P}}x^ky^l\mathrm{d}x\mathrm{d}y$

\partial P

$\partial\mathcal{P}$

ω

$\omega$

d ω = x^{k} y^{l} d x d y .

$\mathrm{d}\omega=x^ky^l\mathrm{d}x\mathrm{d}y.$

x^{k} y^{l + 1} d x

$x^ky^{l+1}\mathrm{d}x$

x^{k + 1} y^{l} d y

$x^{k+1}y^l\mathrm{d}y$

Jawaban:

Mari kita lakukan analisis terlebih dahulu.

Misalkan dalam poligon kepadatan probabilitasnya adalah fungsi proporsional Maka konstanta proporsionalitas adalah kebalikan dari integral atas poligon, $\mathcal{P}$ $p(x,y).$ $p$

μ_{0, 0} (P) = \iint_{P} p (x, y) d x d y .

$\mu_{0,0}(\mathcal{P})=\iint_{\mathcal P} p(x,y) \mathrm{d}x\,\mathrm{d}y.$

The barycenter dari poligon adalah titik koordinat rata-rata, dihitung sebagai momen pertama mereka. Yang pertama adalah

μ_{1, 0} (P) = \frac{1}{μ_{0, 0} (P)} \iint_{P} x p (x, y) d x d y .

$\mu_{1,0}(\mathcal{P})=\frac{1}{\mu_{0,0}(\mathcal{P})} \iint_{\mathcal P} x\,p(x,y)\mathrm{d}x\,\mathrm{d}y.$

The tensor inersia dapat direpresentasikan sebagai array simetris saat kedua dihitung setelah menerjemahkan poligon untuk menempatkan barycenter pada titik asal: yaitu, matriks momen kedua pusat

μ_{k, l}^{'} (P) = \frac{1}{μ_{0, 0} (P)} \iint_{P} {(x - μ_{1, 0} (P))}^{k} {(y - μ_{0, 1} (P))}^{l} p (x, y) d x d y

$\mu^\prime_{k,l}(\mathcal{P}) = \frac{1}{\mu_{0,0}(\mathcal{P})} \iint_{\mathcal P} \left(x - \mu_{1,0}(\mathcal{P})\right)^k\,\left(y - \mu_{0,1}(\mathcal{P})\right)^l\,p(x,y)\mathrm{d}x\,\mathrm{d}y$

di mana berkisar dari hingga hingga Tensor itu sendiri - alias matriks kovarians - adalah $(k,l)$ $(2,0)$ $(1,1)$ $(0,2).$

I (P) = (\begin{matrix} μ_{2, 0}^{'} (P) & μ_{1, 1}^{'} (P) \\ μ_{1, 1}^{'} (P) & μ_{0, 2}^{'} (P) \end{matrix}) .

$I(\mathcal{P}) = \pmatrix{\mu^\prime_{2,0}(\mathcal{P}) & \mu^\prime_{1,1}(\mathcal{P}) \\ \mu^\prime_{1,1}(\mathcal{P}) & \mu^\prime_{0,2}(\mathcal{P})}.$

PCA menghasilkan sumbu utama dari ini adalah vektor satuan eigen yang diukur oleh nilai eigennya. $I(\mathcal{P})$ $\mathcal{P}:$

Selanjutnya, mari kita cari tahu cara melakukan perhitungan. Karena poligon disajikan sebagai urutan simpul yang menggambarkan batas berorientasi adalah wajar untuk memanggil $\partial\mathcal P,$

Teorema Green: mana adalah satu-bentuk yang didefinisikan di lingkungan dan
$\iint_{P} d ω = \oint_{\partial P} ω$ $\iint_{\mathcal{P}} \mathrm{d}\omega = \oint_{\partial\mathcal{P}}\omega$ $\omega = M(x,y)\mathrm{d}x + N(x,y)\mathrm{d}y$ $\mathcal{P}$ $d ω = (\frac{\partial}{\partial x} N (x, y) - \frac{\partial}{\partial y} M (x, y)) d x d y .$ $\mathrm{d}\omega = \left(\frac{\partial}{\partial x}N(x,y) - \frac{\partial}{\partial y}M(x,y)\right)\mathrm{d}x\,\mathrm{d}y.$

Misalnya, dengan dan kepadatan konstan ( mis. , Seragam) kita dapat (dengan inspeksi) memilih salah satu dari banyak solusi, seperti $\mathrm{d}\omega = x^k y^l \mathrm{d}x\mathrm{d}y$ $p,$

ω (x, y) = \frac{- 1}{l + 1} x^{k} y^{l + 1} d x .

$\omega(x,y) = \frac{-1}{l+1}x^k y^{l+1}\mathrm{d}x.$

Intinya adalah bahwa integral kontur mengikuti segmen garis yang ditentukan oleh urutan simpul. Segmen baris apa pun dari vertex ke vertex dapat diparameterisasi dengan variabel nyata dalam formulir $\mathbf{u}$ $\mathbf{v}$ $t$

t \to u + t w

$t \to \mathbf{u} + t\mathbf{w}$

di mana adalah arah normal satuan dari keNilai karena itu berkisar dari hingga Di bawah parameterisasi ini dan adalah fungsi linear dari dan dan adalah fungsi linear dari Dengan demikian integran dari integral kontur atas setiap tepi menjadi fungsi polinom dari yang mudah dievaluasi untuk kecil dan $\mathbf{w} \propto \mathbf{v}-\mathbf{u}$ $\mathbf{u}$ $\mathbf{v}.$ $t$ $0$ $|\mathbf{v}-\mathbf{u}|.$ $x$ $y$ $t$ $\mathrm{d}x$ $\mathrm{d}y$ $\mathrm{d}t.$ $t,$ $k$ $l.$

Menerapkan analisis ini sama mudahnya dengan mengkodekan komponen-komponennya. Pada level terendah kita akan memerlukan fungsi untuk mengintegrasikan satu-bentuk polinomial pada segmen garis. Fungsi tingkat yang lebih tinggi akan mengumpulkan ini untuk menghitung momen mentah dan pusat untuk mendapatkan barycenter dan tensor inersia, dan akhirnya kita dapat beroperasi pada tensor tersebut untuk menemukan sumbu utama (yang merupakan vektor eigen yang diskalakan). The Rkode di bawah melakukan pekerjaan ini. Itu tidak membuat pretensi efisiensi: ini dimaksudkan hanya untuk menggambarkan penerapan praktis dari analisis sebelumnya. Setiap fungsi mudah dan konvensi penamaan sejajar dengan analisis.

Termasuk dalam kode adalah prosedur untuk menghasilkan poligon tertutup, hanya terhubung, non-self-berpotongan yang valid (dengan mendeformasi secara acak titik-titik di sepanjang lingkaran dan termasuk titik awal sebagai titik terakhir untuk membuat loop tertutup). Berikut ini adalah beberapa pernyataan untuk memplot poligon, menampilkan simpulnya, berdampingan dengan barycenter, dan memplot sumbu utama dalam warna merah (terbesar) dan biru (terkecil), menciptakan sistem koordinat poligon-sentris berorientasi positif.

#
# Integrate a monomial one-form x^k*y^l*dx along the line segment given as an 
# origin, unit direction vector, and distance.
#
lintegrate <- function(k, l, origin, normal, distance) {
  # Binomial theorem expansion of (u + tw)^k
  expand <- function(k, u, w) {
    i <- seq_len(k+1)-1
    u^i * w^rev(i) * choose(k,i)
  }
  # Construction of the product of two polynomials times a constant.
  omega <- normal[1] * convolve(rev(expand(k, origin[1], normal[1])), 
                                expand(l, origin[2], normal[2]),
                                type="open")
  # Integrate the resulting polynomial from 0 to `distance`.
  sum(omega * distance^seq_along(omega) / seq_along(omega))
}
#
# Integrate monomials along a piecewise linear path given as a sequence of
# (x,y) vertices.
#
cintegrate <- function(xy, k, l) {
  n <- dim(xy)[1]-1 # Number of edges
  sum(sapply(1:n, function(i) {
    dv <- xy[i+1,] - xy[i,]               # The direction vector
    lambda <- sum(dv * dv)
    if (isTRUE(all.equal(lambda, 0.0))) {
      0.0
    } else {
      lambda <- sqrt(lambda)              # Length of the direction vector
      -lintegrate(k, l+1, xy[i,], dv/lambda, lambda) / (l+1)
    }
  }))
}
#
# Compute moments of inertia.
#
inertia <- function(xy) {
  mass <- cintegrate(xy, 0, 0)
  barycenter = c(cintegrate(xy, 1, 0), cintegrate(xy, 0, 1)) / mass
  uv <- t(t(xy) - barycenter)   # Recenter the polygon to obtain central moments
  i <- matrix(0.0, 2, 2)
  i[1,1] <- cintegrate(uv, 2, 0)
  i[1,2] <- i[2,1] <- cintegrate(uv, 1, 1)
  i[2,2] <- cintegrate(uv, 0, 2)
  list(Mass=mass,
       Barycenter=barycenter,
       Inertia=i / mass)
}
#
# Find principal axes of an inertial tensor.
#
principal.axes <- function(i.xy) {
  obj <- eigen(i.xy)
  t(t(obj$vectors) * obj$values)
}
#
# Construct a polygon.
#
circle <- t(sapply(seq(0, 2*pi, length.out=11), function(a) c(cos(a), sin(a))))
set.seed(17)
radii <- (1 + rgamma(dim(circle)[1]-1, 3, 3))
radii <- c(radii, radii[1])  # Closes the loop
xy <- circle * radii
#
# Compute principal axes.
#
i.xy <- inertia(xy)
axes <- principal.axes(i.xy$Inertia)
sign <- sign(det(axes))
#
# Plot barycenter and principal axes.
#
plot(xy, bty="n", xaxt="n", yaxt="n", asp=1, xlab="x", ylab="y",
     main="A random polygon\nand its principal axes", cex.main=0.75)
polygon(xy, col="#e0e0e080")
arrows(rep(i.xy$Barycenter[1], 2), 
       rep(i.xy$Barycenter[2], 2),
       -axes[1,] + i.xy$Barycenter[1],     # The -signs make the first axis .. 
       -axes[2,]*sign + i.xy$Barycenter[2],# .. point to the right or down.
       length=0.1, angle=15, col=c("#e02020", "#4040c0"), lwd=2)
points(matrix(i.xy$Barycenter, 1, 2), pch=21, bg="#404040")

— whuber
sumber

+1 Wow, ini jawaban yang bagus!

— amoeba

Sunting: Tidak menyadari bahwa whuber sudah menjawab. Saya akan meninggalkan ini sebagai contoh dari pendekatan lain (mungkin kurang elegan) untuk masalah ini.

Matriks kovarians

Mari menjadi titik acak dari distribusi seragam pada poligon dengan luas . Matriks kovarians adalah: $(X,Y)$ $P$ $A$

C = [\begin{matrix} C_{X X} & C_{X Y} \\ C_{X Y} & C_{Y Y} \end{matrix}]

$C = \begin{bmatrix} C_{XX} & C_{XY} \\ C_{XY} & C_{YY} \end{bmatrix}$

di mana adalah varian , adalah varian , dan adalah kovarians antara dan . Ini mengasumsikan nol rata-rata, karena pusat massa poligon terletak di titik asal. Distribusi seragam memberikan kepadatan probabilitas konstan ke setiap titik dalam , jadi: $C_{XX} = E[X^2]$ $X$ $C_{YY} = E[Y^2]$ $Y$ $C_{XY} = E[XY]$ $X$ $Y$ $\frac{1}{A}$ $P$

\begin{matrix} (1) & C_{X X} = \frac{1}{A} \iint_{P} x^{2} d V C_{Y Y} = \frac{1}{A} \iint_{P} y^{2} d V C_{X Y} = \frac{1}{A} \iint_{P} x y d V \end{matrix}

$C_{XX} = \frac{1}{A} \underset{P}{\iint} x^2 dV \quad C_{YY} = \frac{1}{A} \underset{P}{\iint} y^2 dV \quad C_{XY} = \frac{1}{A} \underset{P}{\iint} x y dV \tag{1}$

Triangulasi

Alih-alih mencoba mengintegrasikan langsung ke wilayah rumit seperti , kita dapat menyederhanakan masalah dengan mempartisi ke dalam subregional segitiga: $P$ $P$ $n$

P = T_{1} \cup \dots \cup T_{n}

$P = T_1 \cup \cdots \cup T_n$

Dalam contoh Anda, satu kemungkinan partisi tampak seperti ini:

Ada berbagai cara untuk menghasilkan triangulasi (lihat di sini ). Misalnya, Anda bisa menghitung triangulasi simpul Delaunay , kemudian membuang sisi-sisi yang berada di luar (karena ini mungkin bukan cembung seperti pada contoh). $P$

Integral over kemudian dapat dibagi menjadi jumlah integral atas segitiga: $P$

\begin{matrix} (2) & C_{X X} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} x^{2} d V C_{Y Y} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} y^{2} d V C_{X Y} = \frac{1}{A} \sum_{i = 1}^{n} \iint_{T_{i}} x y d V \end{matrix}

$C_{XX} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} x^2 dV \quad C_{YY} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} y^2 dV \quad C_{XY} = \frac{1}{A} \sum_{i=1}^n \underset{T_i}{\iint} x y dV \tag{2}$

Segitiga memiliki batas yang bagus dan sederhana sehingga integral ini lebih mudah untuk dievaluasi.

Mengintegrasikan lebih dari segitiga

Ada berbagai cara untuk berintegrasi dengan segitiga. Dalam hal ini, saya menggunakan trik yang melibatkan pemetaan segitiga ke unit square. Mengubah ke koordinat barycentric mungkin menjadi pilihan yang lebih baik.

Berikut adalah solusi untuk integral di atas, untuk segitiga sembarang didefinisikan oleh simpul . Membiarkan: $T$ $(x_1,y_1), (x_2,y_2), (x_3,y_3)$

v_{x} = [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \end{matrix}] v_{y} = [\begin{matrix} y_{1} \\ y_{2} \\ y_{3} \end{matrix}] \vec{1} = [\begin{matrix} 1 \\ 1 \\ 1 \end{matrix}] L = [\begin{matrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \end{matrix}]

$v_x = \left[ \begin{smallmatrix} x_1 \\ x_2 \\ x_3 \end{smallmatrix} \right] \quad v_y = \left[ \begin{smallmatrix} y_1 \\ y_2 \\ y_3 \end{smallmatrix} \right] \quad \vec{1} = \left[ \begin{smallmatrix} 1 \\ 1 \\ 1 \end{smallmatrix} \right] \quad L = \left[ \begin{smallmatrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \end{smallmatrix} \right]$

Kemudian:

\begin{matrix} (3) & \iint_{T} x^{2} d V = \frac{A}{6} Tr (v_{x} v_{x}^{T} L) \iint_{T} y^{2} d V = \frac{A}{6} Tr (v_{y} v_{y}^{T} L) \iint_{T} x y d V = \frac{A}{12} ({\vec{1}}^{T} v_{x} v_{y}^{T} \vec{1} + v_{x}^{T} v_{y}) \end{matrix}

$\underset{T}{\iint} x^2 dV = \frac{A}{6} \text{Tr}(v_x v_x^T L) \quad \underset{T}{\iint} y^2 dV = \frac{A}{6} \text{Tr}(v_y v_y^T L) \quad \underset{T}{\iint} x y dV = \frac{A}{12} (\vec{1}^T v_x v_y^T \vec{1} + v_x^T v_y) \tag{3}$

Menyatukan semuanya

Biarkan dan berisi koordinat x / y dari simpul untuk setiap segitiga , seperti di atas. Masukkan ke dalam untuk setiap segitiga, mencatat bahwa ketentuan daerah dibatalkan. Ini memberikan solusinya: $v_x^i$ $v_y^i$ $T_i$ $(3)$ $(2)$

\begin{matrix} (4) & C_{X X} = \frac{1}{6} \sum_{i = 1}^{n} Tr (v_{x}^{i} (v_{x}^{i})^{T} L) C_{Y Y} = \frac{1}{6} \sum_{i = 1}^{n} Tr (v_{y}^{i} (v_{y}^{i})^{T} L) C_{X Y} = \frac{1}{12} \sum_{i = 1}^{n} ({\vec{1}}^{T} v_{x}^{i} (v_{y}^{i})^{T} \vec{1} + (v_{x}^{i})^{T} v_{y}^{i}) \end{matrix}

$C_{XX} = \frac{1}{6} \sum_{i=1}^n \text{Tr} \big( v_x^i (v_x^i)^T L \big) \quad C_{YY} = \frac{1}{6} \sum_{i=1}^n \text{Tr} \big( v_y^i (v_y^i)^T L \big) \quad C_{XY} = \frac{1}{12} \sum_{i=1}^n \big( \vec{1}^T v_x^i (v_y^i)^T \vec{1} + (v_x^i)^T v_y^i \big) \tag{4}$

Kapak utama

Sumbu utama diberikan oleh vektor eigen dari matriks kovarian , seperti pada PCA. Tidak seperti PCA, kami memiliki ekspresi analitik untuk , daripada harus memperkirakannya dari titik data sampel. Perhatikan bahwa simpul itu sendiri bukan sampel yang representatif dari distribusi seragam pada , jadi orang tidak bisa begitu saja mengambil matriks kovarians sampel dari simpul tersebut. Tapi, * adalah * fungsi simpul yang relatif sederhana, seperti yang terlihat pada . $C$ $C$ $P$ $C$ $(4)$

— pengguna20160
sumber

+1 Ini dapat disederhanakan dengan memungkinkan segitiga berorientasi , sehingga menghilangkan kebutuhan untuk triangulasi yang tepat. Alih-alih, Anda bisa langsung membuat pusat arbitrer dan menjumlahkan nilai-nilai (yang ditandatangani) di atas segitiga inilah yang sering dilakukan karena jauh lebih tidak rewel. Sangat mudah untuk melihat bahwa penjumlahan tersebut pada dasarnya adalah hal yang sama dengan menerapkan Green's Theorem, karena setiap istilah dalam penjumlahan akhirnya adalah fungsi dari edgePendekatan ini diilustrasikan di bagian "Area" di quantdec.com/SYSEN597/GTKAV/section2/chapter_11.htm .

O

$O$

O P_{i} P_{i + 1} :

$OP_iP_{i+1}:$

P_{i} P_{i + 1} .

$P_iP_{i+1}.$

— Whuber

@whuber Menarik, terima kasih telah menunjukkan ini

— user20160

Kedua jawaban ini baik, meskipun sedikit di atas tingkat pendidikan saya. Setelah saya yakin saya benar-benar mengerti mereka, saya akan mencoba mencari tahu siapa yang mendapat hadiah.

— Ingolifs